MonarchBase - Protein-coding gene

DPOGS206108
Transcript	DPOGS206108-TA	3771 bp
Protein	DPOGS206108-PA	1256 aa
Genomic position	DPSCF300028 + 398641-406454
RNAseq coverage	2229x (Rank: top 5%)

Annotation
*Heliconius*	HMEL005038	0.0	91.29%
*Bombyx*	BGIBMGA004315-TA	1e-09	25.10%
*Drosophila*	Dp1-PB	0.0	52.87%
EBI UniRef50	UniRef50_Q5TRN4	0.0	53.19%	AGAP005467-PA n=4 Tax=Endopterygota RepID=Q5TRN4_ANOGA
NCBI RefSeq	XP_969652.1	0.0	61.43%	PREDICTED: similar to high density lipoprotien binding protein / vigilin [Tribolium castaneum]
NCBI nr blastp	gi\|270013832	0.0	61.58%	hypothetical protein TcasGA2_TC012484 [Tribolium castaneum]
NCBI nr blastx	gi\|270013832	0.0	61.46%	hypothetical protein TcasGA2_TC012484 [Tribolium castaneum]

Group
Gene Ontology	GO:0003723	1.3e-17	RNA binding
KEGG pathway
InterPro domain	[575-643] IPR004087	1.3e-17	K Homology
	[579-638] IPR018111	2.5e-15	K Homology, type 1, subgroup
Orthology group	MCL14662		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS206108-TA
ATGATGCATCAGCAATCCATGATGGTTGGAGACATGATACCCGTACATTCTGAAATACCCGTGCATACAGAGGAGATGAATAATGTTGGCTACGAGTCCAATAGCAACTCGTATGCTTATGATGACCTGTTCCCGGCTTTGCCTCACTCGCAGGCTCCAGTCCAACGCAACCTTCAACCCATCAGCAACAAACTGAGGGTTGGATCCTCTCTTCATACTCAGGTTTTCCACGTGCCGTATGAAGAAAGAAAACTGGACAACGCCAATACTTTTGGCGAGGGCGAGTCGTTAAGGACATGTCAGTCTATTACTAAGGACACCGGCGCTCATATTGAAATATCAACTAGCAAGGATGGAAGCCTGACATTCCTTATTACCGGAAAACATAGTGCAGTCCTAGATGCAAGGCGTTTGATCCTTACCCACTTTCAACAACAGGCGAGCAAGCAAATTTCTATTCCCAAGGAGCATCATCGTTGGATCCTTGGAAAGGGGGGTCTAAAGTTAAAAGAGTTGGAGAAAATGACGGCTACTAAGATCAGTGTTCCTGGAATAGCAGATAATAGTGAAGTCATCACTATTACCGGAACCAAAGAGGGAATTGAAAAGGCTGAACATGAAATTCGTGTCTGTTCTGAGGAACAGTCCCGAAAAGCTCTGGAGCGTATAATAGTCCCGAAGATCTATCATCCCTTCATCCAAGGACCATTTGGTGAAACGGCGGAAGCTTTAAGTTCTGAGACCGGCGCTCGTATACATATTCCACCGGCTTCAACCAAAAGTAACGAGATCGTTATTGCTGGTGAAAAGAACGGTGTGCTGGCAGCCAAGGCTAGGATCGAGCAGATTTATGAGGAGATGGCAAAAAAATGTTCAACTGTACGTGTCGAAGTGCCTAAGTCGCAGCACAAATACGTTATTGGATCTCGCGGAACTACTATCCAAGAGATTTTGAAAGAAACGGGTGTTTCTGTGGAAATGCCACCTCCGGATTCACCCACGGGTACCATTACTTTACATGGTCCTCATAACAAGATTGGTCTTGCTCTATCAAAGGTGTGTGAGAAAGCAAACTCTGTGAAAACTGCAACCGTTGATGCACCTACCTGGATTCATAAGTACATAATTGGAAAGAATGGCTCTAATATTAAGAAGATTACTCAGGACTTCTCAAAGGTGCACGTAGACATTACACACTCTGAAGATAAAGTCAAAATTGATGGACCTCCAGAGGAAGTTGAACGCGTCCAAGTGGAATTGGATAACTTTGTGAAGAACTTGCTTGCTACACATACATATGTGGAGTTGACTGTTGACCCTAAATTCTTTAAGCATATCATTGGCAAAAACGGAAGTAACATTAATAGACTGAAGGTTGAGACTCGTGTAGTTATAAATATTATTGAGAGTGAAGGCAACAATGTTATACGCATCGAAGGCAGCCATCAAGGTGTCGACGACGCTGAAAGAGAACTGCGCGAAATGGTTATGAAGTTAGAGAACGAAAGGACGAAGGAAGTCTTTGTTGACCACAAATATATTAAATCATTAATAGGAGTTAGAGGTGACAGAATAAAGGAAATTCGTGAGAAATTCGACCGAGTACTCATATCACTACCGGATCAAGGTCAAAAGAGGAGTCCCATCAAACTCCGAGGACCGCAGGAGGATATAGAAAAATGTGAATCACACCTCCATAAACTGATGAAAGAAATTGCCGAATCGTCTTACATACAAGAAGTGCCTATCTTCAAACAATTCCATAAGTTCATTATCGGTAAGGGTGGTGCTAATTTAAGAAAGATAAGAGACGAAACACAAACGCAGATCGATCTGCCTGCTGAAGGGGACGACAGCGATGTTATTACAGTGAGAGGTAAACGTGAAAACGTAGAGGAGGCCGTTAAAAGAATACAACAAATCCACAACGAGAAGGCGAACATTGTCACAGAGGAGGTAACGATAGCGCCTAAATATTATAACTCACTGATTGGTGCTGGCGGTAAACTTATACATTCTATTATGGAAGAGTGTGGAGGTGTTCTAATAAAGTTCCCACCAGCCGAGAGTGATAGCGACAAGGTTGTGATAAGGGGACCGATCGAGGACGTGGAGAAAGCTAAGCAGCAGTTGTTAGCACATGCTTCGGAGCGCGAATTGACATCCCACACGGCCCACGTGCGAGCTAAACCAGAGCATCATAAGTTCCTCATTGGAAAGAATGGCGCTAACATCAAGAAGATCCGCGAGCAGACTGGCGCTCGTATCATTTTCCCTACTGAGAAGGATGAGGACAAAGAAGCCATTTTCATCATTGGTCGCGAGGCACAAGTGGAGGAGGCACGAAAGCAGTTGGAAGCCGCCGTTGCTGAAATCAGCAACGTGTCCGAGGGTGAGATGGCCGTGGACCCGCGCCACCATCGACACTTCGTGGCTCGACGTGGAGAAGTGCTGAGAAGGATCGCTGAAGACTGCGGGGGAGTCCAGATATCATTCCCACGACAGGGAGTCAACAGCGATCGCGTTGTTCTCAAGGGGCCTAAGGAATGCATTGAGGCTGCCAAGAATCGGATCACCGAGATCATTGAGGATCTGGAAGCGAAGGTTACCATTGAATGTATCATTCCACAAAGACATCACCGAACGGTGATGGGGGCGCGCGGTGCCAAGGTGAAGGACATTACAGCCGAATTTGATGTTCAAATCAAGTTCCCTGAGCGAGACCTCACTGAGGGTGCTGATATTCCACTAAGAAACGAAGATAACGCTGAACCAGGACAAAATGACATCATCAGAATAACTGGACGGCCGGAGAATTGTGAAGCGGCCAAAAAAGCTCTGCTGGACCAAGTTCCTATTACAATTGACGTTGAAGTGCCAAATGATCTTCACCGTTTGCTCGCCGGTCAAAAGAGGAGGGAATTGATGCAGACCTATGACGTTCACATTCTAATGCCACCACCTAATGAAGAAGCCTCTGATATTGTGAAGGTCACCGGTACACCTACAAATGTTGAGAAAGCAAAGGTGGCACTTGCTGAGAAGATTGTAGAGATGGAGAAAGAAAAAGAAGATAGGATTCTAAGATCGTTTGAGCTGAAATTCAAAGTGGACCCTGAATACCACCCTCTTGTTATTGGTAAAGGTGGCTCAGTGATTACTAAGATTCGCACAGATTACGGAGTACAAATAAATCTACCAAAGCGAGGTGAACCCGATGATGATATTATCACCATACAAGGATACGAAGATAAGGCACATCAAGCCAAAGAAGCCATTATGAATATAGTTCACCAACTTGATAACCAATATCGTGACGAGGTGGACATCGATCCCCGCGTCCATAGAAGACTGATAGGTCTACGAGGAAAGAACATAAGGCGCATTATGGACGAGTACAAAGTTGATATTCGTTTCCCGAAACAAGGAGACGACAGCATCGTTATAATAACCGGTGATGAAGACAACGTTCTCGACGCCAAAGACCACCTTCTCAATCTAGCCGAGGAATACTTGCAAGACGTAGTGGACCGCTACCAGAGGCCGGCCGGTCCATCTCTGGGCGATTTCGGGGACGTTCTCAACACTGAGAATACAAATAACGGCGGCGCTGCTGCCGTTCAGCCGTCCGGCGGGTTCGTGGTGAAGGGCGGGCCGTGGGAGCAGCGCGCCCCCGACACAGCCTCCACCCACGAGTTCCCAACAATGCCGGGAGCTCCACGAGCGGCGGCAAACCCCACACCCTCCTCCGCGTGGGGCCCTCGCCGCTAA

Protein sequence:

>DPOGS206108-PA
MMHQQSMMVGDMIPVHSEIPVHTEEMNNVGYESNSNSYAYDDLFPALPHSQAPVQRNLQPISNKLRVGSSLHTQVFHVPYEERKLDNANTFGEGESLRTCQSITKDTGAHIEISTSKDGSLTFLITGKHSAVLDARRLILTHFQQQASKQISIPKEHHRWILGKGGLKLKELEKMTATKISVPGIADNSEVITITGTKEGIEKAEHEIRVCSEEQSRKALERIIVPKIYHPFIQGPFGETAEALSSETGARIHIPPASTKSNEIVIAGEKNGVLAAKARIEQIYEEMAKKCSTVRVEVPKSQHKYVIGSRGTTIQEILKETGVSVEMPPPDSPTGTITLHGPHNKIGLALSKVCEKANSVKTATVDAPTWIHKYIIGKNGSNIKKITQDFSKVHVDITHSEDKVKIDGPPEEVERVQVELDNFVKNLLATHTYVELTVDPKFFKHIIGKNGSNINRLKVETRVVINIIESEGNNVIRIEGSHQGVDDAERELREMVMKLENERTKEVFVDHKYIKSLIGVRGDRIKEIREKFDRVLISLPDQGQKRSPIKLRGPQEDIEKCESHLHKLMKEIAESSYIQEVPIFKQFHKFIIGKGGANLRKIRDETQTQIDLPAEGDDSDVITVRGKRENVEEAVKRIQQIHNEKANIVTEEVTIAPKYYNSLIGAGGKLIHSIMEECGGVLIKFPPAESDSDKVVIRGPIEDVEKAKQQLLAHASERELTSHTAHVRAKPEHHKFLIGKNGANIKKIREQTGARIIFPTEKDEDKEAIFIIGREAQVEEARKQLEAAVAEISNVSEGEMAVDPRHHRHFVARRGEVLRRIAEDCGGVQISFPRQGVNSDRVVLKGPKECIEAAKNRITEIIEDLEAKVTIECIIPQRHHRTVMGARGAKVKDITAEFDVQIKFPERDLTEGADIPLRNEDNAEPGQNDIIRITGRPENCEAAKKALLDQVPITIDVEVPNDLHRLLAGQKRRELMQTYDVHILMPPPNEEASDIVKVTGTPTNVEKAKVALAEKIVEMEKEKEDRILRSFELKFKVDPEYHPLVIGKGGSVITKIRTDYGVQINLPKRGEPDDDIITIQGYEDKAHQAKEAIMNIVHQLDNQYRDEVDIDPRVHRRLIGLRGKNIRRIMDEYKVDIRFPKQGDDSIVIITGDEDNVLDAKDHLLNLAEEYLQDVVDRYQRPAGPSLGDFGDVLNTENTNNGGAAAVQPSGGFVVKGGPWEQRAPDTASTHEFPTMPGAPRAAANPTPSSAWGPRR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: