MonarchBase - Protein-coding gene

DPOGS215991
Transcript	DPOGS215991-TA	4041 bp
Protein	DPOGS215991-PA	1346 aa
Genomic position	DPSCF300078 - 54069-66217
RNAseq coverage	2699x (Rank: top 5%)

Annotation
*Heliconius*	HMEL008524	2e-08	30.15%
*Bombyx*	BGIBMGA001182-TA	0.0	49.96%
*Drosophila*	CG8086-PE	6e-137	35.34%
EBI UniRef50	UniRef50_Q7KTI6	1e-134	35.34%	CG8086, isoform E n=11 Tax=Drosophila RepID=Q7KTI6_DROME
NCBI RefSeq	NP_995650.2	2e-135	35.34%	CG8086, isoform E [Drosophila melanogaster]
NCBI nr blastp	gi\|221473669	4e-134	35.34%	CG8086, isoform E [Drosophila melanogaster]
NCBI nr blastx	gi\|221473671	1e-161	34.84%	CG8086, isoform F [Drosophila melanogaster]

Group
KEGG pathway
Orthology group	MCL16678		Insect specific

Nucleotide sequence:

>DPOGS215991-TA
ATGGGAGTTCGTCAGAACCCTTGGACACCAACCAAAAGACGAGGACCCATCGCTGCGGAAACTGCTAGTCCTGGACCAGCTGTCGTTTCTCTTCCTTCTCTTATAGGTAAACCTCCGCCGGAATCTAGAAAGACTAGAGCACCAGCGTTCACGTTTGGACAGAAATTGGAAGCTGCGGGTAAGGATAAGAGTGGCCCCGGTCCCGCTTCTTACAACACGGAAGGCATGACAGCTAAAGGTAAACCTCCGCCGGAATCTAGAAAGACTAGAGCACCAGCGTTCACGTTTGGACAGAAATTGGAAGCTGCGGGTAAGGATAAGAGTGGCCCCGGTCCCGCTTCTTACAACACGGAAGGCATGACAGCTAAAGGACGGGCGGGGGGCCCGGCGGCGTCTTTGCATGGTCGATGGCCACCACCTCGAGTAACGCCTACACCGGCTCCTTGCGACTACGAGCCCAGCAAGGCTGCCCGAGCTGTTCTTGATCATGCTCCAGCATTCTCGATAGGTCTTCGCGTTTCTCCCCCACAGGCTGGAAATAAAACACCAGCGCCTAACGTTTATTCTATGCCACCTGTTCTTGGAGAAGCGAGAGAAGGCAGTAAGCGAGCGGCACCGGCATTCAGTATCACGGGTCGTGGCAAAACGATCGAGTCGAAGACACCGATGCCTGGTCCTGGCACTTACACGACGGATAAAGCGGCATCTGTTATTACTAAACGTCCTCCAGCCTACACGATGGCACCTAGACGGGAGCTGAAGCCCCCAACCGCAGCTGTTCCTGGTCCAGGAGTCTATTGCCCGGAAAAAGTTAAGTCTCATCGTACACAATCATCAAAGCTCACAGTAAAGTCATCTAGCAAAATTCAAAAAATAGAGCAGATACCAGCGCCTAATGCTTATAATCCCGAAAAAGCAGATAGGATTTTAAGAGAAAAATCTCCAGCGTTTTCTTTTAGAACTAAATCAGAAATAATAAAAATTCAGGACGCTCCTGCACCGAATGTATATTCTCCGGAAAAATCTTTACATGCTTTGAAAAACGGTCCTAAATATACTCTTTCTGGAAAAGGAACTGCGGAGAAACATGATGTTACCCCTGCGCCAAATTCTTATAACCCCCAAAAAGCTGATAAATTGTTACGTGAAAGTTCACCAGCTTATACACTGAGATCAAAGGAAATACTTGAAAAAATTGATGACACACCAGCTCCTAATGTATATGCTCCAGAAAAATCTTTGCACATGTTAAATGGTGGCCCAAAATTTACAATTCTGCCTGCTCCTAACAGTTACAATCCCGAAAAAGCTGATAAGATTTTACATGAAAGCACTCCAGCATATTCTTTTAGGGTAAAAGACCATCCAAATGTAAGGAGTGAATCACCAGCTCCGAATGTTTATTCGCCTGAAAAGTCTATGTATTCATTAGACAGTGCTCCAAAATTTTCAATAAGTGGAAAAGGTTACTCTGAAAAAATCGCGGATACTCCAAGCCCAAATGCCTATAATCCTAATAAGGCGGATAAATTATTACACGAATCCTCACCTGCTTACACGTTTCGAGCAAAGGATAAAATATTAAAAACTGATAATTTTCCTGCACCTAATGTATATTCGCCAGAAAAGTCAATACATTCATTAGATAGTACACCAAAATTTACCATGGCAGGCAGAGGTTCTTCTCCGAAAATTGAAGATGTGCCGGCTCCTAATGCATACTGCCCTGATAAAGCTGACAAACTTCTTCACGACTCTTCTCCTGCTTATACGTTAAGACCTAAAATTTTGGAGGGGAAACTCAGTGACACTCCAGCACCTAATGCATATGAACCTCGTCTTAAAGATGATGCTCCAAAATATAGCTTGTATGGAAAAGGACATGATATTAAGCCATCTGATACTCCTGGACCTAACGTCTATGAGCCGCGCTTACTTGATAATACTCCTAAATACTCTTTAACAGGGAAAGGTCACGATGCCAAAATATTCAATACACCTGGACCTAATTGTTACGATCCTCATTTACCTTCAAACTCGCCAAGATTCACTATGTCAGGGAAAGGTCCAGATGAAAAATTTCCTGATGTTCCTGCTCCAAACTCCTATAATGCTTCTTTACCTAATAATGCACCTAAATTCACGATAAGTGGAAAAGGTTATGATCCCAAAATGTTTATTACTCCTGGACCTGATTGTTATGATCCACATTTACCTCAAAATAGTCCAAGATATACAATGGGTGGTAAAAGTAATGACCCAAAATGTTTTGAAGTCCCAGCACCTAATGCATACGATCCACATATTATAAATGAATCTCCTAAATATACAATGTGTGGAAAGGGACACCCCGATAAAATAATTGACACACCTGCTCCTAATGCCTATGATCCAGATAAATATCCACGCAGTGGCGAGCCAAAGTACAGTTTTGGTATCAAAAGACCACCACTAAAAACTGAAAATTATCCGGCTCCTAATGCTTATTATGCTGATCGGGCTGATAAAGTTTTACATGAAACTTCACCGGCATATACATTCCGACCTAAAATTGAAGACAACAAAAAACCAGATACACCGGGTCCCAATGCATACAATATAGAGAAGGCTGATAAAGTCATTTTAGAACATACCCCTTCATATAGCTTATCACCGAAAGGAAAGGATGCCAAAATAAATGATACCCCGGCACCAAATGTTTATAACCCAGAAAAAGCTGACAAGCTCTTATTAGATAACGCACCACGATACTCGTTCAGAATGAAGACAAATCCACATAAATCAGATAATAATCCAGCCCCCAACAATTACAACCCTGATAAGGCCGATAAACTTTTACACAGTGCTCCACAGTATACATTTAGAATCAAACCTGATGACATAAAAGCTATAGATACTCCTGCACCTAACTCTTACACCATCCCAAATCTTCAAAAAACTCCACTATACACGATTTCTGGAAGACATAAAGAGCCGATAGATGAACGTCTTAAAGTTCCCGCTCCCGGGGCTTATAACCCAGAAAAAGGCTATAAATTTGTTTTGACGTACTCACCGCAATACACTTTTGGCGTTAAAATTCACACTGACAAATATGCTGATACGCCAGCTCCCAATAGTTATCGTATTCCGTCTGTACTGGAGAGTCCCGTCTACACTATGGTAGGTCGTCCGAAAGAGCCTAAGGATGATCGTTGTAGAATACCCGCACCAGGAACATATTCTCCGGAGAAAGTACAGATAAATAAAACCCCGCAAATCACGTTTGGAATAAAACATTCTCCTCTTCTGGGTCAACTTAAGCCAATTGAACCTCCTCGTCATGGTATGCAAACAATGAAAAAACCTGTTGAGAAAGAAGTGCACGACGATAATTACAGAAACTTGTCCCAAACTTGGGAAAAAGAAAGTATAGTGATCAAAACAAATGGCGATGTCAACCAACCCAGAACACCTGAAACAAATTCACGACAATCTATGTATGAGTCTATGGATTCCAATAATGATACTCGCAATATGCACACACATGTGACACAGGTTAGAAATGAAATAAGAAGTTCTACAGCTACACCGGAGCCTGTTCAAGAAAGGCTCACCCAAGAAATAGTTTGGGTCCCTGAAACCCAGCCTCGACGAGGTTCTTATACAATAGAAAAATCTGATGGCAATGGATTTATTGAACGTTATGAGAATAGTGAAGTCATTCCGGTTGAAAATGGAGCTGTTCATATATCTGGTAGCGGAGTAAGAGGGGCGTCGTGTACTGAGGAGCATAGTAGCGAAGTGGTTAAAAAGGATGGCTTCCTGCAAAATGTTAATAAAAGAGTAAACAATTCCAGCGCTCATGAGCAGAGTCAGAAATCTAGCGAGGAAGTTCGTACTGGAAGTGATATTCAGCACTTACCAGACGGTGGTATTGCGCAGACCACTACAACAACAACCATAAAAAAAATTGGAAAATCAGCCAAAACAGCGAATGCTACGACCACAGTCACTCGAACCAATACTGTTGTAACTGCACGCGATGTCGGCGCTAAATGA

Protein sequence:

>DPOGS215991-PA
MGVRQNPWTPTKRRGPIAAETASPGPAVVSLPSLIGKPPPESRKTRAPAFTFGQKLEAAGKDKSGPGPASYNTEGMTAKGKPPPESRKTRAPAFTFGQKLEAAGKDKSGPGPASYNTEGMTAKGRAGGPAASLHGRWPPPRVTPTPAPCDYEPSKAARAVLDHAPAFSIGLRVSPPQAGNKTPAPNVYSMPPVLGEAREGSKRAAPAFSITGRGKTIESKTPMPGPGTYTTDKAASVITKRPPAYTMAPRRELKPPTAAVPGPGVYCPEKVKSHRTQSSKLTVKSSSKIQKIEQIPAPNAYNPEKADRILREKSPAFSFRTKSEIIKIQDAPAPNVYSPEKSLHALKNGPKYTLSGKGTAEKHDVTPAPNSYNPQKADKLLRESSPAYTLRSKEILEKIDDTPAPNVYAPEKSLHMLNGGPKFTILPAPNSYNPEKADKILHESTPAYSFRVKDHPNVRSESPAPNVYSPEKSMYSLDSAPKFSISGKGYSEKIADTPSPNAYNPNKADKLLHESSPAYTFRAKDKILKTDNFPAPNVYSPEKSIHSLDSTPKFTMAGRGSSPKIEDVPAPNAYCPDKADKLLHDSSPAYTLRPKILEGKLSDTPAPNAYEPRLKDDAPKYSLYGKGHDIKPSDTPGPNVYEPRLLDNTPKYSLTGKGHDAKIFNTPGPNCYDPHLPSNSPRFTMSGKGPDEKFPDVPAPNSYNASLPNNAPKFTISGKGYDPKMFITPGPDCYDPHLPQNSPRYTMGGKSNDPKCFEVPAPNAYDPHIINESPKYTMCGKGHPDKIIDTPAPNAYDPDKYPRSGEPKYSFGIKRPPLKTENYPAPNAYYADRADKVLHETSPAYTFRPKIEDNKKPDTPGPNAYNIEKADKVILEHTPSYSLSPKGKDAKINDTPAPNVYNPEKADKLLLDNAPRYSFRMKTNPHKSDNNPAPNNYNPDKADKLLHSAPQYTFRIKPDDIKAIDTPAPNSYTIPNLQKTPLYTISGRHKEPIDERLKVPAPGAYNPEKGYKFVLTYSPQYTFGVKIHTDKYADTPAPNSYRIPSVLESPVYTMVGRPKEPKDDRCRIPAPGTYSPEKVQINKTPQITFGIKHSPLLGQLKPIEPPRHGMQTMKKPVEKEVHDDNYRNLSQTWEKESIVIKTNGDVNQPRTPETNSRQSMYESMDSNNDTRNMHTHVTQVRNEIRSSTATPEPVQERLTQEIVWVPETQPRRGSYTIEKSDGNGFIERYENSEVIPVENGAVHISGSGVRGASCTEEHSSEVVKKDGFLQNVNKRVNNSSAHEQSQKSSEEVRTGSDIQHLPDGGIAQTTTTTTIKKIGKSAKTANATTTVTRTNTVVTARDVGAK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: