MonarchBase - Protein-coding gene

DPOGS206111
Transcript	DPOGS206111-TA	1236 bp
Protein	DPOGS206111-PA	411 aa
Genomic position	DPSCF300028 + 565771-567006
RNAseq coverage	291x (Rank: top 38%)

Annotation
*Heliconius*	HMEL014064	0.0	97.81%
*Bombyx*	BGIBMGA006832-TA	0.0	92.21%
*Drosophila*	TBPH-PC	3e-111	65.12%
EBI UniRef50	UniRef50_Q13148	2e-99	59.63%	TAR DNA-binding protein 43 n=68 Tax=Coelomata RepID=TADBP_HUMAN
NCBI RefSeq	XP_392590.3	2e-134	59.48%	PREDICTED: similar to TBPH CG10327-PA, isoform A [Apis mellifera]
NCBI nr blastp	gi\|328783809	3e-135	59.72%	PREDICTED: TAR DNA-binding protein 43-like [Apis mellifera]
NCBI nr blastx	gi\|328783809	5e-140	58.11%	PREDICTED: TAR DNA-binding protein 43-like [Apis mellifera]

Group
Gene Ontology	GO:0000166	2.4e-19	nucleotide binding
	GO:0003676	6.6e-17	nucleic acid binding
KEGG pathway
InterPro domain	[105-174] IPR012677	2.4e-19	Nucleotide-binding, alpha-beta plait
	[106-177] IPR000504	6.6e-17	RNA recognition motif domain
Orthology group	MCL11120		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS206111-TA
ATGTCCTTCGAGTACTTGCCCGTGGCCGAAGATGAAAATGAAGAACCCATAGAACTTCCAATTGAAGAAGATGGGACTTTGATGTTAACAACTGTATCCGCGCAGTTTCCTGGCTGTTGTGGACTCAAGTATCGTCATCCTGAAACGAAAACGTTTAGAGGTATAAGATTACGAGATGGTAGGCTTTACCCACCACCAGAAGGTTGGGGAAATCAACTGTACATATGCAGTTTTCCGAAAGAAAATAAACGAAAATCTGGTGACAATTCTGAAACATCTTCGGTGAAAAGTAAACGGAATGATAATTTGTGCTCAGATTTAATAGTGTTGGGGTTACCATGGAAAGCAACAGAGCAAACCGTGCGGGAGTATTTCGAAAAGTTTGGCGAAGTGTTAATGGCTCAATTAAAACGTGATCCTAAAACCGGTATGTCAAAAGGCTTCGCTTTTATTAGATTTTCATCTTACACATCTCAGATGAGAGTCTTAGCTCAAAGACATATGATTGATGGACGTTGGTGTGATGTACGGATACCTAACTCAAAGGAAGGTTCTGTCACATCTATGCCTTGTAAAGTTTTTGTTGGCCGCTGTACAGAAGATTTAACAGCCAATGATTTAAGAGAATATTTTTCACAATTTGGTGAAGTAACAGATGTTTTTATTCCAAAGCCTTTTAGGGCATTCAGCTTTATAACATTTTTGGATCCTGAAGTTGCACAAAGCTTATGTGGTCAAGACCACATTATAAAAGGAGTATCTGTAAATGTGTCTAATGCATCACCTAAACAAAATAAAAGTGGTTCTAATCAACGAAACTTACCAAGTAGAAACTATGAAGAAGGACATCCACACAGTGCCTCAAACAATAATTCATGGAGTAGCCGTAATATGGATATGGTGAATATGCAAGCCTTAGGATTGTCTGGCCAACACGGTCAAACCGCCGTGGCCGGTGGTGGAGGGCAAGGCCAAGGTGGAAGTATGCCACTCGGCATGGGTGGTTTGCCAGTAAATCAAGCTCTAGTAGCTGCTGCACTAAATCAGGCAGCAGGCTGGGGTTTAATTAATAATATACCATCGGGGGGATCAGATCAAGGTGCCTTTGCTGGACCGGCTTCTTCTGCTCCACCAGCACCACCTAACTTCCTGTCATGGATGCAACAGGGCAATTCTGGACAAGGACCTTCTAGTCAGTGGGGACAGAGACACCAATCCCAAGGCCACTCCGTTTGA

Protein sequence:

>DPOGS206111-PA
MSFEYLPVAEDENEEPIELPIEEDGTLMLTTVSAQFPGCCGLKYRHPETKTFRGIRLRDGRLYPPPEGWGNQLYICSFPKENKRKSGDNSETSSVKSKRNDNLCSDLIVLGLPWKATEQTVREYFEKFGEVLMAQLKRDPKTGMSKGFAFIRFSSYTSQMRVLAQRHMIDGRWCDVRIPNSKEGSVTSMPCKVFVGRCTEDLTANDLREYFSQFGEVTDVFIPKPFRAFSFITFLDPEVAQSLCGQDHIIKGVSVNVSNASPKQNKSGSNQRNLPSRNYEEGHPHSASNNNSWSSRNMDMVNMQALGLSGQHGQTAVAGGGGQGQGGSMPLGMGGLPVNQALVAAALNQAAGWGLINNIPSGGSDQGAFAGPASSAPPAPPNFLSWMQQGNSGQGPSSQWGQRHQSQGHSV-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: