MonarchBase - Protein-coding gene

DPOGS211197
Transcript	DPOGS211197-TA	3483 bp
Protein	DPOGS211197-PA	1160 aa
Genomic position	DPSCF300007 + 816483-824618
RNAseq coverage	235x (Rank: top 43%)

Annotation
*Heliconius*	HMEL012451	0.0	87.94%
*Bombyx*	BGIBMGA003185-TA	0.0	77.00%
*Drosophila*	CG2225-PE	5e-35	35.98%
EBI UniRef50	UniRef50_D6WKA8	1e-103	45.88%	Putative uncharacterized protein n=2 Tax=Tribolium castaneum RepID=D6WKA8_TRICA
NCBI RefSeq	XP_970727.1	6e-104	45.79%	PREDICTED: similar to AGAP009860-PA [Tribolium castaneum]
NCBI nr blastp	gi\|270007161	4e-103	45.88%	hypothetical protein TcasGA2_TC013697 [Tribolium castaneum]
NCBI nr blastx	gi\|270007161	0.0	40.98%	hypothetical protein TcasGA2_TC013697 [Tribolium castaneum]

Group
KEGG pathway
Orthology group	MCL17519		Insect specific

Nucleotide sequence:

>DPOGS211197-TA
ATGTTGCTTTATGATCGCGGGTGCGATGACGTTCAGCGTTCTCTGGAGCTCCTGGACCAGGTGTTAAGTGAATACGACGAGGGTGAACCGCGATCGTTGGAGGCGCGTGCGACGCCCGCCACACCAGCGACACCCGCCACACCAGCCACGCCCGCCACTCCAGCCACAGACGACGACTCGCCGCTCGCCGGTCACACCTCCGAGGACGATGGATACATGAGCATGAACGGCAGACGGGCGAAATTCGCGCTGGGCTTCCGACCAACTGAGGAGCGTGAGGAGGGATCGCCTCCGGACCCTCCATCACCACACTCCCCACCACCGCCTGAAGAAGCTCAAAGAATTATATCAACACTTTTACCTAAGGTGTCTCCCACAAATTCTGCAAAACATACAAACTTATTCAGCCATTCCGAAGCTGAAGAGAAATTGGACTCTATTATTAGCGTCAACGGAATTACAACTGCAACACAGACGACTTTTCCAAAGACAAGGCACCAGCGTCCTTATGGATGGGACAAAGAAATAGAAGCGAATGGGTTTCAGCTGCAGCAGGCTCCGGTTCCTCCTTACAAATTTTCATCGTTACAGCATGGATCCAGGCCGCCGCAAACTGAGATTGCTCCCACGTGGCTACCTCCGCGCCACTCAGCCCCACCGAGCAATCAAAAAAAGTCACCTAGTGTTGAGAACCCTCCTGTATTTCCTTTTATGGGGTTCTCGAGTGATTTCACTGACAAACCGTATAACGAGCATCCCGTGACCATTTATCCTGGACCAAATATCCAATACAGTCGTCAGTCACACTCACCAACTTACAAAATATCTCCTTCAAATTCCAAGAGTATTGAGAAAAAGAACAGTATGAAACGAGACAGTAGGTCTGATGGGGAAATTCTTTCACCAAAATGTAAAATACCTCCCCGGACTCTTGCCAGCTCTATGGAAAGACATAGAGAGGTGTGTAGAGATTCGACGGAGGATATAATGGAGAGTTGCAAAATGCGAGGAGCAAATAGAAGCAATGACGAAGATCATTTTTCCGACGATTCACTCGAAGAGTCCTTTCCGCCGCCTCCCCCCGCAGTTAGCACGCCTTCGAAACGCAATTCCATAGCTTGGGAAGTGTCTCTCGATGGTGACGATCCTCTTTTGACTCCCGGTAGCACTAAGGTTATAGGAAGAAGACGAAAGAAATCTGGCGATCAATCGCATTCCAGTACGAGTTCTATTCCTCAAAGGATTGATGATGACTGGGGTGAGGAATATTGGCCCCCGCCCCCTCCGTTGTCACAGTGTGAACCGATAGTTTCACCAATATCAGACGCGGAACCAGAACTTCGAAGGCCCCAGGACTTATCAACAGGGACATATGTCATTCGAAAGGGAAAAAATAGAAAACAATTACCAACCTTCAATAAAAATACAAGCAACAAACCACAATCGAATACAAATAATCTATCACAGAGTCATAGTTTGAATAGAAGCATTGAAAAATCAATAGACGGTTCTAGTATTTCAATAAGCGGGTCAGGCTCTGTAGGTTCTTATAACTCTAGGCCCAGTTCAGATCTGAGTCTACCTCAATCCCGATACAGCGCGGACCTTAACTCAAGACTAAGCCGTGAACTCAACACGCCCAACTCTAGATATAGCATTGATCTTTGTACACCGAATTCTAGATTAAGTAAGGAGATTACTTCACCGAAGTCAAGATTAAGTTTAGATCTCAATAATGGTCAAGATAGATATATAAATCCAGAATATTTTGGTCATAGTCCTAAAAGTAGGCAAGTAAATAGTGATAAAAATGTCGTCGGCTCTAAAACTAACAGTGGCCAAAGCAAATTATCACCTCAAAATAGATTTACTGATTTTAAAAAATATTCATCTACTTTCGATAACATTCAATCCCTAATTAAAGAAGGTAAAGTGGAAGAGGCACCACAAAATGATTGCAATGAAACTGTCACTGAGCTTTCTGTTGTCCCTCCGACTATGGTACGTGTCATATCACTGCCGAGTCTAGGAGCTGAGGCAGACAGCAATAGTGCTAGTCGTCAAGCCCTTATCACGACAGTAGAGGAAGAGGATGATCAAGAAAGTGGTGAAATCGATTCTAATGAAGATACCTCACCTTTAAGAAAAATTGAAAATAACATAAGTGCTATATTGAACCAAGGACGGGACCAAAAACATTTTACCCCATATACACCTAAAGACTGGAATATACATAAGGATGAGTACTGTGATGAAATATCTAAGGATATTTTAGAGAACAATTACCGTTATAGCTCTAGGGAAAGACAAAAAAGACACGATATCCAGAAATCATCGAGTCATAACGAAATCCAAAATCAGCGATCAATTGATCGACGCGATCGTTCTTCTGGGAGGAGATCAAATAGTATGCATAAGTCGACTAGTGCTAAGGATGTGCCCGTAAGCTTGATGCGCCAGCCTTCCTCCTCAGATTCTGCTGTATCAAGTGGAGGTGATTTTCCTCTAAATATTCAAATAGTGGAACATCCCTATAGGCACAATCAATTACCTCCATCGCCTAGTACAGGTCATGAGATGGGACCGCTACCTCAGACACCGGAATCCCCAAAATTCCCACCCTTACCACCTTCACCCGTTCAAGAAGTTGAAGATGAATACACAGAGATAATGCAGCCTACGGGAAGACGTCACATTAAAAAAGCCGATACGTTGCCAACACCAACTATGGAATCAAGGAGACGGCCATCAGAACCTCCCGCGGTGCCGCCTCACCGCGATACAACAAACAGCCTTAAAACGAGATCAATGGAAAACAACTTCAACAAGAATAGAAGAAATAGTAATTTCAAAAGTGGCTCAACAGACAGACGTACTTTGCCAACAGACACTGGAACCAGCGGCGCTCGCCGTCGTACGCTGCAGCGTCAGAATCGCGAATCCGGTTACAATGTTCGTGGACAGCTTCAGACATCCGCCAGCCTGCCCGAGACACCTGTGTTCGCTCGTGGCTGTGATGTCCCAAGAACTCCGCCAAGAAATACTGGCCCGCCCCGACATAACACCATCAACTCGATGCAAACTATAGGAAGCAGCGCTACCCTAGGCGGTTACGGGCGTGGATCTGTAATGGGGGCTTCGGGAGTGTGCACCGGCGCTGACCTTCTCCGTCTGGGAGGTCCCCCGCGTGGCTGGTATCCAAGACAACGGAACCGGCCTGCATCTATCGAGCACCTGGATAGAATCTCGACATCAGCGAAGGTAGCCGCCGACCATCCGGTGGCATGGGAGGCGTCTGGTGCTCGCAAGCCTCTCACTCTCCCCCCGAACTTGACGCCTAAGTTCTTCCAAAAGTCTCCGAGGGAAGCGCTGCGGCGGGTCACAAGTCTATTAATACGGAAAGGTAAGGGCGTTAGTAATTTTAAAATGATATTCGATGATGTGCAGTATCCTATAGATTCTAGAACACAGTTAAAATATTAG

Protein sequence:

>DPOGS211197-PA
MLLYDRGCDDVQRSLELLDQVLSEYDEGEPRSLEARATPATPATPATPATPATPATDDDSPLAGHTSEDDGYMSMNGRRAKFALGFRPTEEREEGSPPDPPSPHSPPPPEEAQRIISTLLPKVSPTNSAKHTNLFSHSEAEEKLDSIISVNGITTATQTTFPKTRHQRPYGWDKEIEANGFQLQQAPVPPYKFSSLQHGSRPPQTEIAPTWLPPRHSAPPSNQKKSPSVENPPVFPFMGFSSDFTDKPYNEHPVTIYPGPNIQYSRQSHSPTYKISPSNSKSIEKKNSMKRDSRSDGEILSPKCKIPPRTLASSMERHREVCRDSTEDIMESCKMRGANRSNDEDHFSDDSLEESFPPPPPAVSTPSKRNSIAWEVSLDGDDPLLTPGSTKVIGRRRKKSGDQSHSSTSSIPQRIDDDWGEEYWPPPPPLSQCEPIVSPISDAEPELRRPQDLSTGTYVIRKGKNRKQLPTFNKNTSNKPQSNTNNLSQSHSLNRSIEKSIDGSSISISGSGSVGSYNSRPSSDLSLPQSRYSADLNSRLSRELNTPNSRYSIDLCTPNSRLSKEITSPKSRLSLDLNNGQDRYINPEYFGHSPKSRQVNSDKNVVGSKTNSGQSKLSPQNRFTDFKKYSSTFDNIQSLIKEGKVEEAPQNDCNETVTELSVVPPTMVRVISLPSLGAEADSNSASRQALITTVEEEDDQESGEIDSNEDTSPLRKIENNISAILNQGRDQKHFTPYTPKDWNIHKDEYCDEISKDILENNYRYSSRERQKRHDIQKSSSHNEIQNQRSIDRRDRSSGRRSNSMHKSTSAKDVPVSLMRQPSSSDSAVSSGGDFPLNIQIVEHPYRHNQLPPSPSTGHEMGPLPQTPESPKFPPLPPSPVQEVEDEYTEIMQPTGRRHIKKADTLPTPTMESRRRPSEPPAVPPHRDTTNSLKTRSMENNFNKNRRNSNFKSGSTDRRTLPTDTGTSGARRRTLQRQNRESGYNVRGQLQTSASLPETPVFARGCDVPRTPPRNTGPPRHNTINSMQTIGSSATLGGYGRGSVMGASGVCTGADLLRLGGPPRGWYPRQRNRPASIEHLDRISTSAKVAADHPVAWEASGARKPLTLPPNLTPKFFQKSPREALRRVTSLLIRKGKGVSNFKMIFDDVQYPIDSRTQLKY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: