MonarchBase - Protein-coding gene

DPOGS211813
Transcript	DPOGS211813-TA	3312 bp
Protein	DPOGS211813-PA	1103 aa
Genomic position	DPSCF300031 - 312544-321753
RNAseq coverage	51x (Rank: top 70%)

Annotation
*Heliconius*	HMEL004276	0.0	56.75%
*Bombyx*	BGIBMGA008152-TA	2e-164	52.62%
*Drosophila*	CG30263-PB	6e-48	61.74%
EBI UniRef50	UniRef50_D6WHW5	3e-51	40.05%	Putative uncharacterized protein n=1 Tax=Tribolium castaneum RepID=D6WHW5_TRICA
NCBI RefSeq	XP_969178.1	5e-52	40.05%	PREDICTED: similar to Y97E10AL.1 [Tribolium castaneum]
NCBI nr blastp	gi\|91079198	1e-50	40.05%	PREDICTED: similar to Y97E10AL.1 [Tribolium castaneum]
NCBI nr blastx	gi\|221330511	5e-56	25.40%	CG30263 [Drosophila melanogaster]

Group
KEGG pathway
Orthology group	MCL25434		Lepidoptera specific

Nucleotide sequence:

>DPOGS211813-TA
ATGGCCCAAATGGCTACACTACCCCCACCGGGGCCGGTTCATAGACCGCCGAGAGATTTTCTTAAAGAAAACATGGAAGAAATTAGAGAGCTCAGTGAATTGAACAGAGAAAAGAATGAAGCCGAAGCCGAGAAGAAGAAAGTAGAAGAAGAAATAGCTCTGTTGAAGGAAATGGGTCTTATAGACAAGAAAGGTGAAATAAAAAGCGTAGTAAATTCCAGAGCAAATTCTCGAAGCAGTTCGCCAAATAAGTTCATTTTACGATCAAGATCCAACTCACCTTCAGCTATTCTACTCGAAGCTAGGAGTTCCGAGTATCTTAACAAAGATGGAGGGAAACCTGTATCTCATCGTTCTAGAGTTCGATCGATATCTAAATCTCAACCTCAATCTGGTAATGGATCTCCAAAACATTCTAAAATACCGACGAGACAAAATTCAGTTTCTCCAACCAGGTCGAACTCAAGACAATCTATGGATAAAAGCCTTTCAAAAAATCAAAGGCACATATCAAACAGTACCAGTAGTATTCACGAGTCCATAAGGATAGGAAGTACGGTTCATGACAAAAGGGCCAGTCAAAGTACTGATCTTTTGAATATCGGACCGACTAATATTAAAAGTAAGCCACCGATTTCTCCTGGCAGAATTGGACCACCTCCCTCCAATAAATCAATAAACCCAAAAAGATTATCACCAATAGTTGGAACACCAAGTAAGAGTCCTCTGGAAGATTCTAAGCCTTCGTCAGCAAAAATATCGGTTAACTCAACAGCTACCAAAGGCACTAAACCTGTTAAAGCCTCTGGCAGTACTCCGGCTGCTTCTAGATTAAATTCTAGACAGGCAAGTAAAGCTACCAGCCGTGACACCAGTCCAGACAAACGTAAAACGAGTACTGGAGTATCTAAAACGAACAGTATTACGAAAACTGCAACAAAGCCTCCTAATACACGTTCCAGTCAGAAACCTCCTGTTGCCAATAAATCTGAGCCTAAAAAACCTATAAGTAGAACGAACAGCGTAAAAAACTTAAGTAGAGCTCCAAGCACTAAAGCATTAAATGAGAAGCCTCCTTTAAGTAGACAATCGAGTAAAAAGGATATAACTGAGAAAGCAAAACCGGTAAGTAAAAAGAACGAGATGACGTCCAAAGTCGATGTTACTGAAAAAACTGTGATGAAAACAGATGAAAGTAAAAATGAAGTCATTGAAAATAAAGACAAGAAAGACGATGACAATAAAGTGGATGCTAATGTTGGAGACTCGATCGAAAAACATGACAATGAAACTCAATACGATAAGAAGCCAGCCGACACGGAAGAACTTGTTATAATGACTAAGAAAAATGTTGTCTCTATGACCACTGCGGCAATTACCTCTCAACCATTAGAAGTTGTAGCGACAGTGACGAACCAGTTACCAGCAGCTCTGGAGAAAGCCAGGGAAAAGGCGGAGATTGAAAGGATCAGTTCTAAAGATTCATTACTAGCAGTGGAAGATGAAAAAGTGACAAAAACTCCAGATGAAACCAAAGTAGAAAAAGAAGACAAGAGAACATCAAAATCAAAGTCGGAAAAAGCTTTTGATGAAAGTGTTAAACTTAGACCGTTACAACCGCCCTACAACAACCCTCAAGTAGAGAGAGTGAAACAAAAAATAGACTCCATATTAAAAGAGCCCGAAATATCGACAGAAAATATTTTAGCAGCTGCAAAACAGAAGGAAACACCGAAAGCCACTGCCGATAAAACTAGAGACTCCATTAAATCATTAAAAAGTGATATAATAGAAAAGAAAGAAAAAATAAAGAAGCAAAGTGAAGAAATTACAGAATTCAAAAAAGAAGCGAGCAAAATAGTTGACAGCATCATAACACCTGTTGAAGAACCGAAAGAATTAATGGAAAAAACAAAAGATGAGATTAAAAAAGACATAGAACCGATAGTGAAGGTGGTGAGTGAAAGGAAGAAGGAGGTTAAGGCAGACGTGGAGAAAATGACGGAGACCTTAGTACAGGGGGGGCCCGAGCTGGAGGTCCTCAGCTCCAACGTGTCCACACCTGGAGCGGCTGGGAAGAGGAAGGTGGCTGACGGCGCATCAGACAAGTCTCACAGCAATGGAGGGGTCGGCGGTGAATCAGCTCTTATGAGGTTCCCTCAAAGTACGAGCACCACACCAAAACCACCGCCACGAGCACATCGAGAAGCGAAAGATAAATCACCACCAGCTCAGGAGACACAGGCGCCCCAGGACGGAACCACCAAGACGAACATTTGTACCAGGTTTATTGGAAAATGTAGAACTGCGTGCTCCTGTTGCACCAAAACACAATTAGATGGGATAGAAGAACAGAGAGACATAGACGAGGAGCAACCAGCGAAAAAACATTTTCTCCAGAGATTGAACTGCTTCAAGAAGAAGATTCCTGAAGAAGATATAGAAGCTGCAGCTGGGAAAGGAACTACGATAGAGTTTGAAAGCGAAACGAAAAGAAAACGTAAAATACGAGACGTCTTATGTGGGTGTTGTCGTCGTGACCGTGTCGCCGACGTGTCGGAGCCGCGTGCCGTGGACGTGTCGCCACCCGTCACGACATCGGACGTGGTCCAGGAGGGAGGATGCTGCGGGAAGAGGAGGGAGATCGAGAGGAGGGACAGTATCCTCAGCGAGCAGCCGACATCCAGCTGCTGCAGCGCTTTCAACCGCTGGATCGTTGGTGCTTGTCGTCGCTCGTCCGAGGGATCCTCTAGCCGTCGCACCAGTCTGTTCTCCAAGAACAAGAGTCTGTCACCAACACTACCGCCTGAGGACATATCTTCATCACTTCCATCACCGAAACCAAAAATAGTTCTCACTGATGACCAAAAGAGTGACATTACATTAGTCAGTGAAGATGATGAGGATACTCGCAAGAAGTTGGATTCATCTCTGATCGAACACACGAGTGCGATGCGCGGCGCCATACCCGTACTGGCCTTACCGCTGGCCGTCTTCTGTTTGATTTGTAACATCCTGATACCGGGACTTGGTACTATATTCAGCGGCTTGTTTTGTCTATGTTTTGGGATTCCCCGTTTCGGTGTTTACGACGGAGCAAAACATAGAATAGGATCCCTGGTGATCAACCTGCTGGTGGGTTGCAGCCAACTGTTCACTGTTCTGTTCTGTCTGGTGGGATGGGGCTGGGCTATCTGGTGGGGAGTCATCATGGTGCAGGTTTCTCGTAAATACAAAAAATTGAAAGCAGACGCCGCTGCAGCGGAAGCGGAAGCTCCTCCTGTCACCAACAACAACCACACAAGACCCTGA

Protein sequence:

>DPOGS211813-PA
MAQMATLPPPGPVHRPPRDFLKENMEEIRELSELNREKNEAEAEKKKVEEEIALLKEMGLIDKKGEIKSVVNSRANSRSSSPNKFILRSRSNSPSAILLEARSSEYLNKDGGKPVSHRSRVRSISKSQPQSGNGSPKHSKIPTRQNSVSPTRSNSRQSMDKSLSKNQRHISNSTSSIHESIRIGSTVHDKRASQSTDLLNIGPTNIKSKPPISPGRIGPPPSNKSINPKRLSPIVGTPSKSPLEDSKPSSAKISVNSTATKGTKPVKASGSTPAASRLNSRQASKATSRDTSPDKRKTSTGVSKTNSITKTATKPPNTRSSQKPPVANKSEPKKPISRTNSVKNLSRAPSTKALNEKPPLSRQSSKKDITEKAKPVSKKNEMTSKVDVTEKTVMKTDESKNEVIENKDKKDDDNKVDANVGDSIEKHDNETQYDKKPADTEELVIMTKKNVVSMTTAAITSQPLEVVATVTNQLPAALEKAREKAEIERISSKDSLLAVEDEKVTKTPDETKVEKEDKRTSKSKSEKAFDESVKLRPLQPPYNNPQVERVKQKIDSILKEPEISTENILAAAKQKETPKATADKTRDSIKSLKSDIIEKKEKIKKQSEEITEFKKEASKIVDSIITPVEEPKELMEKTKDEIKKDIEPIVKVVSERKKEVKADVEKMTETLVQGGPELEVLSSNVSTPGAAGKRKVADGASDKSHSNGGVGGESALMRFPQSTSTTPKPPPRAHREAKDKSPPAQETQAPQDGTTKTNICTRFIGKCRTACSCCTKTQLDGIEEQRDIDEEQPAKKHFLQRLNCFKKKIPEEDIEAAAGKGTTIEFESETKRKRKIRDVLCGCCRRDRVADVSEPRAVDVSPPVTTSDVVQEGGCCGKRREIERRDSILSEQPTSSCCSAFNRWIVGACRRSSEGSSSRRTSLFSKNKSLSPTLPPEDISSSLPSPKPKIVLTDDQKSDITLVSEDDEDTRKKLDSSLIEHTSAMRGAIPVLALPLAVFCLICNILIPGLGTIFSGLFCLCFGIPRFGVYDGAKHRIGSLVINLLVGCSQLFTVLFCLVGWGWAIWWGVIMVQVSRKYKKLKADAAAAEAEAPPVTNNNHTRP-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: