MonarchBase - Protein-coding gene

DPOGS207432
Transcript	DPOGS207432-TA	3627 bp
Protein	DPOGS207432-PA	1208 aa
Genomic position	DPSCF300087 + 513603-518140
RNAseq coverage	1215x (Rank: top 10%)

Annotation
*Heliconius*	HMEL015620	0.0	69.60%
*Bombyx*	BGIBMGA009332-TA	0.0	64.57%
*Drosophila*			%
EBI UniRef50	UniRef50_UPI00020627A8	9e-16	48.65%	UPI00020627A8 related cluster n=1 Tax=unknown RepID=UPI00020627A8
NCBI RefSeq	XP_002424198.1	2e-08	39.76%	glutamic acid-rich protein precursor, putative [Pediculus humanus corporis]
NCBI nr blastp	gi\|328724236	3e-15	48.65%	PREDICTED: hypothetical protein LOC100572668 [Acyrthosiphon pisum]
NCBI nr blastx	gi\|157106970	3e-22	22.41%	hypothetical protein AaeL_AAEL004658 [Aedes aegypti]

Group
KEGG pathway
Orthology group	MCL25600		Lepidoptera specific

Nucleotide sequence:

>DPOGS207432-TA
ATGATGTTATATGTGACCAGTAATAGTGATGTGGTCCGTCGACCGCCTCGGAGGCGACACATCAGCGCCAACATTAAGCGTCATCATGCCGGTATATCCCAGTCCTCGTGCAGTGACGGCTCTCTGCTCAGTGTGGGCTCCTCGGAGATGGATGACGACAGCAGCAGTGGACACCAGCTGGACCAGACACGACACGAGCACTCAGAAGTCTACACATCGTCCGAGCCTCCCTCTGGTGTGGCGCCACTATCGCACTCAGCCGCTCGACACAAGATGGCGGTGAGACCGCGACGCAACCACGCTTTGCCACGGAGGAAAAAAAACAACTCGATCGCTGCCTCAGCCTTGCCGATAACTCCCGAGCTGAACGAAGAAATGACACGAAGCACTACTCCTGAAGTCATCCTCAAATCCTCAGAAGTCGTTACTGAATCATTCTCTTCGACTACTGCGAAGCATCACATGATCGTTAAGGACCAACACCAACAGCTGAACCGGGAACTCCAAAAGGTTCTGGAAACACCGAGCGACACTAAACTGAAGTCCTCGTCCCTACCGCCCGGATTGGCTCTGAGTCAACTCGTTGGCCAATCACCTGTCAAACTGAGCATCGCTGACAATAATACCCCGAGATCGTCGATCAAAAGAAGCAAATCCAGTACACAAGAACAACCAATACGAGAGAGTTCACCGAAACTAAACGAAAGCCGACAACCGGAGGATAGGAACAAACACCGCTCTGACAAAAAACAAGCCGACGAACCTTGCCTCGAAAAGAAAACTAAGTCAGAGAAGAAAGTAGAGAACGAAGTCATACGGTCTTCCAAAAAAGAGGAATCGTTTTTCAGCAGACTGCTTCTGAGGAAAAGCGGAAAGAAATCTAAGAAGGATCAAACCGACGGCGACGGGCAGCAGGACGTGAAGAAAACGAAGACTGAGAAGACGACGGCGCAATACAAACCAGTGGACTCGGGCTGTTACTACGAACAAGGATACAAACACACAGACAGGTCCTATAAATCAGCCGGCCAGAAGGCGTTCGCTAATCAAATGCACAAGAGAATTGATAACAAAGGAGCCTACGTCCACGAGGGCGCGTACAAAGACGTCTACAGCGCTGCCAAAGTCACCGGCCTCGATTACAGCATAGATCTCAAAGCCGCCGAGGAAACCGATAAAATGTTGAACTACGAGATGAAAAACAGATTCAGCAGGAGGGACGAGTTCTGCGAGAAGATAGAAAAGAAACGTTCTTCGTCCAAAGAGGCGATCGATGACAAGAGGGAATCTTTCAATTTGCATCACGATAAATCGAAAAGACCCGCCTCCGTACAGAGATTGATCGAACCGTTCTCAACAAAAACACTTCTCGCCAACGAACTCGCTAACAGGACGGACGAAGACAGTCTGTCTCCTACATTCGAAGTTTCCGACGAAGATTCCATTAGAGGCCTGAGAATAAAAAACGTTAATAACGATTGCGTGTTCCACAGCGGCAGTATGCCCAAGAATATACCGTACTTCAATCCGAGCATCTCTGTCTCCGTGTCACCTGTGAAAAGCAAGACTCACAGCTCCGAAAACGTCAAGTATATGAGCCGTTCCACGGAAGCAGATTTCCACGGGATGGAAATAGTCAGCAAACGAGAAAACGTTCATCATGTTTGCAAAACTGATGAACCATACGTCGCTTCCGGTTTGAGATCTTTGGGTGACGAATACGTGGAAACTAGAAGCAGTATCGGTAAATCTCACAGTTTTCGTTACGCGTCCCAATCATCTTCGATCAGTTCCCAGGAAAACCAACTACCGAGTCTACCGGCCATCGTGGGCATCTCTGAACCGCTGCTTGAAAGCTGGGAAGTCAACTATAGGAGGAACGTTAGTGAGAGACACGACCACTCCAAGCGCATATCCGCCAGGAACTATAACATCCTGTCCGGTGAATCCGAGACAAACTACGACAGTCTACCGAGCACTGACAGCAGCTACCTAGACAGCCTCAAACAGGACATGAGCGAGGAAAGAAAGCTGTTTACAAACAGCATTCAAATCACAATAGATACTCACAAACGCGACAGCGATATCTCTCAGATCGAGGCTAAAATCGACGATATCATCAGCTCACCTAAGCCTATCATATCTCCAATACTCAAATCTAGTTCGTTAGATAGCGTTAAAAGTAGTCCCGAAAAACCTGCCGCAGACAGGCGCAAGACCATATCAGTAGAAAGTGCTATAGGACAGAGTAATAAAAATATTCAAAAAGAATTAAAGCAAGAGCCGGAGGGATTTATTTCAGTGACACACATAAATAGAGACAACGTGCCAGTTGTGATTAAGGCTGTTGAAATATCTAAGATAAATAAAAGCGACGAGAAGATACAAAAAACTGTAGCTAAGTCTGGAGTGCCGGAGTTCCTCAATATACAGCTGAACAAGGTTGACGCGAAACCAGTTACTAACGTTGTGTTGACAGCGAATGTGTCCCCAAAAAAGATTGACAGTCCGCAACCAGAGAAGGAACCGATCGTAGAAAATTTCGCCGCCCCTGATACGCAAATATCACAGAATATGAAAACCTCTAAGGAAATAACGAAAACGGTTGATGACACTGAGACTGTACAAGTTGAGGAGAAACCAAATGTGGTCGTGGCCAGAACACTGAGCACACCCGCGCCACAGAGTCCCATGACACCGAAGCATTTCTTTAAAAAGAAATTACTCAGCGTCGACTCACAGGAAAAAATAGAAAAACAAAGAACCAGTTCCGTCAGCACCGAAGGAAGCATCGAGAAGATCGATAACATATCCATGGACCAAAAGTCACATTCCAGTTTCGGCAGCAAAAGTTCCATTCAGAGTATCGACAGCGACGAGAACAAAATACAAGACAGACAGGAGGAAGCGGTCGTCTACAGAAGAAAACCCTTCGGCAAAGACTCCAAGAAACATGACGACGAACCAGAACTTATGAAGGTTTTCGCGAGGCGGTCCCTCAAACTCAAAGACTCGGAAGCAGACCACATAGCGCAGGACATAGCCGACACCAACAAAAACGATAATGTATCCAGGTCTAAAATACTCAAGAACGAGTTCAACGCTTCCATCAAATCTAGGGACAGCGACAAAGAGAACGAGGAACAGAAGGAACAAGCATTTGAGAATAAGCTGGTGGACATCGCGGCGAGGGTGAGTCAGTTCGGAAACTACCAGAGGAGCGTCAGCATCAGCAGTGTGACGCCCAAACGAGACAGCGCGCCCGCCTTCAGGAGCGAGGTGAACAAATACAAGAAAGAAGTATCCGACTCCACTCCCGAGAAGAGATTGAGGAACAGAACGTTCCCCGACTCATCCAACGACAGAGAGGACATCAAAAACGTTACCAAGAATGAAGCCATGGGATATAAAGCGGATACACTCACCAAAAGACCCTGGCAGAGGACCGAGTTCAGGCAGGTGGTGGAGAAAGAGAAACGAGACGTTACCGCGGTAGAAAAGGACGGGAACAATGAGAAAAGCGAAAGCGGGAAAGAGAAGGAAGAAGCGGACGCCTCACCACAGTTCAAAGGTATACTCCAAATGAGAGCGGAGTGGGAGAGACGAGCTCAAGGAATGACCAAATAA

Protein sequence:

>DPOGS207432-PA
MMLYVTSNSDVVRRPPRRRHISANIKRHHAGISQSSCSDGSLLSVGSSEMDDDSSSGHQLDQTRHEHSEVYTSSEPPSGVAPLSHSAARHKMAVRPRRNHALPRRKKNNSIAASALPITPELNEEMTRSTTPEVILKSSEVVTESFSSTTAKHHMIVKDQHQQLNRELQKVLETPSDTKLKSSSLPPGLALSQLVGQSPVKLSIADNNTPRSSIKRSKSSTQEQPIRESSPKLNESRQPEDRNKHRSDKKQADEPCLEKKTKSEKKVENEVIRSSKKEESFFSRLLLRKSGKKSKKDQTDGDGQQDVKKTKTEKTTAQYKPVDSGCYYEQGYKHTDRSYKSAGQKAFANQMHKRIDNKGAYVHEGAYKDVYSAAKVTGLDYSIDLKAAEETDKMLNYEMKNRFSRRDEFCEKIEKKRSSSKEAIDDKRESFNLHHDKSKRPASVQRLIEPFSTKTLLANELANRTDEDSLSPTFEVSDEDSIRGLRIKNVNNDCVFHSGSMPKNIPYFNPSISVSVSPVKSKTHSSENVKYMSRSTEADFHGMEIVSKRENVHHVCKTDEPYVASGLRSLGDEYVETRSSIGKSHSFRYASQSSSISSQENQLPSLPAIVGISEPLLESWEVNYRRNVSERHDHSKRISARNYNILSGESETNYDSLPSTDSSYLDSLKQDMSEERKLFTNSIQITIDTHKRDSDISQIEAKIDDIISSPKPIISPILKSSSLDSVKSSPEKPAADRRKTISVESAIGQSNKNIQKELKQEPEGFISVTHINRDNVPVVIKAVEISKINKSDEKIQKTVAKSGVPEFLNIQLNKVDAKPVTNVVLTANVSPKKIDSPQPEKEPIVENFAAPDTQISQNMKTSKEITKTVDDTETVQVEEKPNVVVARTLSTPAPQSPMTPKHFFKKKLLSVDSQEKIEKQRTSSVSTEGSIEKIDNISMDQKSHSSFGSKSSIQSIDSDENKIQDRQEEAVVYRRKPFGKDSKKHDDEPELMKVFARRSLKLKDSEADHIAQDIADTNKNDNVSRSKILKNEFNASIKSRDSDKENEEQKEQAFENKLVDIAARVSQFGNYQRSVSISSVTPKRDSAPAFRSEVNKYKKEVSDSTPEKRLRNRTFPDSSNDREDIKNVTKNEAMGYKADTLTKRPWQRTEFRQVVEKEKRDVTAVEKDGNNEKSESGKEKEEADASPQFKGILQMRAEWERRAQGMTK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: