MonarchBase - Protein-coding gene

DPOGS202240
Transcript	DPOGS202240-TA	3918 bp
Protein	DPOGS202240-PA	1305 aa
Genomic position	DPSCF300032 - 897182-908403
RNAseq coverage	70x (Rank: top 66%)

Annotation
*Heliconius*	HMEL002592	0.0	79.06%
*Bombyx*	BGIBMGA004832-TA	1e-162	74.55%
*Drosophila*	Atg2-PA	3e-41	41.47%
EBI UniRef50	UniRef50_UPI000224793F	4e-127	43.38%	UPI000224793F related cluster n=3 Tax=unknown RepID=UPI000224793F
NCBI RefSeq	XP_001122229.1	7e-121	43.93%	PREDICTED: similar to Autophagy-specific gene 2 CG1241-PA [Apis mellifera]
NCBI nr blastp	gi\|345495823	1e-126	43.38%	PREDICTED: LOW QUALITY PROTEIN: autophagy-related protein 2 homolog A [Nasonia vitripennis]
NCBI nr blastx	gi\|345495823	8e-131	43.48%	PREDICTED: LOW QUALITY PROTEIN: autophagy-related protein 2 homolog A [Nasonia vitripennis]

Group
KEGG pathway
Orthology group	MCL30007		Insect specific

Nucleotide sequence:

>DPOGS202240-TA
ATGTTGTGGTATCTACCATGGTCCGAAAGCATAAAAAAAAGAGCCTGCCGATATTTACTCCAACGATACCTTGGAAATTATCTTGAAGAAAAACTTACTTTGGATCAGCTGAGTGTCGATCTTTACAATGGGACTGGTACCGTTTCAGATGTTAGCCTTGACTGCGAGGCCCTCAATGAGTTGGGGGACAGTCAAAATTGGCCATTGGAAATAGTTGATGGTCAAATGAAAGAAATAACAGTCACAGTACCCTGGTCTACGCTTCTCAAAGATGATTCTGTTGTGGAAATTAATGGACTCTCACTTACAGTCCAACCTAAAGTTAGGCCTGAACCTGCATCATCAATGCTGGAGTCTATGTGGTCTTCCATGTCATCATCAATGCAACTGGCGGCAGAATGTCTTAGGGAAGAGGCTGGCCCACAGGAATCAAACCCCGTTGAAGGCATTGAGATGTTTGCGCATGCTATAGATTCAATTTTGAGCAGAGTGAAGGTAAAATTCGTGAATACAAAAATAAGAATAGAACATGTTCCAAAAAATGGTGACAAGGGCATCGCACTGGAGGTCCATATTGAAAATATCGACTATTTCGACGAAGCCGGAACGGAACCATCACCGGAAACGACGGATCCAGATAAAACTAAAACCTACATCGTGTCAACATACACAAATAAAAAAATCAAATTCAATGGCGTCGTGTTCAACATAGACGAGTTCCCATCGAAGCTGCGTACAATGGCTCCGAGTCTGATGGAAAAGTCCGCGTCATCTGTCGACAGGTCCGACGGAGCGTCAGTCGACACCCCTAACTCAAATTACCAGAGCACAATGTCCGATGTGTTCTATGAAACTAGGAGTGTAATGTCTACAATAGATTCGGATCCTGTTAAGGAGATAATTGAAGAGAGACATATCGGAAGCGCAAGAGAGTCGACTCCGCCGGACAGAACCACGCAAGCAGACCCAATACTATTTGCAAAATTAACTGGTCAACAGGAATTAGCCCTCAAACTTAAGCATTCGGAGGAAGTTGAGGGGCCAAAGGTCGAGGTCAAAATTCTATTAGGGTCATTCTTGATATTCATAACGCCGAGGCAGATGCGTACAATCATTGAACTCATAGATGCTTTGAATCAACCGCATCTTGAAGATACGAGTAATATTCCAGTCCGACCCAGCAACATTAACATGCAATGCAAGCCGATGAAGCAGGCTGACTTTCAGCTGATAGAAGCACAACTGCTCGGTAACTTGGACAAGCAGCAAGCCAAACCCAGCAACATGTACGGCTGGTCCGGTCCTAGTTTTGAAGACGGTGAGACTGATGAGAAATTCCTGCCGATGACGTCACAGGGCCTTATGTCTGAGAGCTTCACCAGCTCCATCAGCTCAATGAGCAACAGCATGACGTCCAGCATGAACATATCCAGTCAGCCGAGGATCAAGAGAAACAAGAAAGTTCCTCACATTGAAGGCGATCCCACCGCTGAAGTGTCACATATAAGCTTGAGGGTGGCCTCAATATCGTGTGTACTACTACATAAGGATATCCTCGCCCCAACACCACTGTCCTTGGACAGCGTCTCCTACTCCAGCGCTTATAAAATGCAACAAGTAGCGACGGAATTCTTCAACCGTATAGAAACATTCAGCAAGTTCGACGAGAGAAGAAACATACATCATGTCAACGACTCATTGGATGCAGCCACCGACAGAGATCATTTAAGATTGTTGATGTCAGAGATCAGTGTGGATGGCAGCGAGAAGGTGACGTCACACGGCAGCCACACGGTCTGCGAGGCGGCCGTGCATGAAGCGTTACTCAGAGAGTGTCTGTACCACGAGGGACAGAGACAAACATATGACTTGATTCGATTCGATAGAGTTTTGAGCAGAGTGAAGGTAAAATTCGTGAATACAAAAATAAGAATAGAACATGTTCCAAAAAATGGTGACAAGGGCATCGCACTGGAGGTCCATATTGAAAATATCGACTATTTCGACGAAGCCGGAACGGAACCATCACCGGAAACGACGGATCCAGATAAAACTAAAACCTACATCGTGTCAACATACACAAATAAAAAAATCAAATTCAATGGCGTCGTGTTCAACATAGACGAGTTCCCATCGAAGCTGCGTACAATGGCTCCGAGTCTGATGGAAAAGTCCGCGTCATCTGTCGACAGGTCCGACGGAGCGTCAGTCGACACCCCTAACTCAAATTACCAGAGCACAATGTCCGATGTGTTCTATGAAACTAGGAGTGTAATGTCTACAATAGATTCGGATCCTGTTAAGGAGATAATTGAAGAGAGACATATCGGAAGCGCAAGAGAGTCGACTCCGCCGGACAGAACCACGCAAGCAGACCCTATACTATTTGCAAAATTAACTGGTCAACAGGAATTAGCCCTCAAACTTAAACATTCGGAGGAAGTTGAAGGGCCAAAGGTCGAGGTCAAAATTCTATTAGGGTCGTTCTTGATATTCATAACGCCGAGGCAGATGCGTACAATCATTGAACTCGTAGATGCTTTGAATCAACCGCATCTTGAAGATACGAGTAATATTCCAGTCCGACCCAGCAACATTAACATGCAATGCAAGCCGATGAAGCAGGCTGACTTTCAGCTGATAGAAGCACAACTGCTCGGTAACTTGGACAAGCAGCAAGCCAAACCCAGCAACATGTACGGCTGGTCCGGTCCTAGTTTTGAAGACGGTGAGACTGATGAGAAATTCCTGCCGATGACGTCACAGGGCCTTATGTCTGAGAGCTTCACCAGCTCCATCAGCTCAATGAGCAACAGCATGACGTCCAGCATGAACATATCCAGTCAGCCAAGGATCAAAAGAAACAAGAAAGTTCCTCACATTGAAGGCGATCCCACCGCTGAAGTGTCACATATAAGCTTGAGGGTGGCCTCAATATCGTGTGTACTACTACATAAGGATATCCTCGCCCCAACACCACTGTCCTTGGACAGCGTCTCCTACTCCAGCGCTTATAAAATGCAACAAGTAGCGACGGAATTCTTCAACCGTATAGAAACATTCAGCAAGTTCGACGAGAGAAGAAACATACATCATGTCAACGACTCATTGGATGCAGCCACCGACAGAGATCATTTAAGATTGTTGATGTCAGAGATCAGTGTGGATGGCAGCGAGAAGGTGACGTCACACGGCAGCCACACGGTCTGCGAGGCGGCCGTGCATGAAGCGTTACTCAGAGAGTGTCTGTACCACGAGGGACAGAGACAAACATATGACTTGATTCGATTCGATAGAGGTGATGAAGATACAACTGTATCAACGAAATCAAATATACGAATGAATTTCAAACAGACATCCAAATATATATCAACATCGGGAGAGAGGAAACTTGTCTACCCTACAACGGATATTGTGTTGAAGTGTACTCCGTTCTACATAGATGTGGACCTGACCTTATTGGAGCGCATGTCTTCAACATTCTTCGGTGGGCCCCCTCCCCCGCCCTCCCCGCACGTCGCTTCGCCATCAAACAAGTCACAGAACCAAGTCAACTTCTCACTACAATGTCCTAACTTGGATATTATACTAAGATTCCCCATAGCGGATCTTCGTCCAGGAGGTCGTTCTGAGGCTCGCTCTGTCCGTCCCGACTACCTCCTCTTCAAGTTACACAACACCAACGTCGGCCTCCAACAGCTCGCCAGCGCTCGGCCACTGCCGACCACTATATCAATACGAATGACCACCCTGGATCTATACTACTATGTATGCACTTATAATCCCCTCTCTAACTTAAACTTTTCCTCTATAATTGACCAAGTATATGATAAGATATATACATATATATCTATAATATACGATTGCTTACTTTCCCTTTTATTTCATAGCAAAATAATGTCATATATTCTATTGTAA

Protein sequence:

>DPOGS202240-PA
MLWYLPWSESIKKRACRYLLQRYLGNYLEEKLTLDQLSVDLYNGTGTVSDVSLDCEALNELGDSQNWPLEIVDGQMKEITVTVPWSTLLKDDSVVEINGLSLTVQPKVRPEPASSMLESMWSSMSSSMQLAAECLREEAGPQESNPVEGIEMFAHAIDSILSRVKVKFVNTKIRIEHVPKNGDKGIALEVHIENIDYFDEAGTEPSPETTDPDKTKTYIVSTYTNKKIKFNGVVFNIDEFPSKLRTMAPSLMEKSASSVDRSDGASVDTPNSNYQSTMSDVFYETRSVMSTIDSDPVKEIIEERHIGSARESTPPDRTTQADPILFAKLTGQQELALKLKHSEEVEGPKVEVKILLGSFLIFITPRQMRTIIELIDALNQPHLEDTSNIPVRPSNINMQCKPMKQADFQLIEAQLLGNLDKQQAKPSNMYGWSGPSFEDGETDEKFLPMTSQGLMSESFTSSISSMSNSMTSSMNISSQPRIKRNKKVPHIEGDPTAEVSHISLRVASISCVLLHKDILAPTPLSLDSVSYSSAYKMQQVATEFFNRIETFSKFDERRNIHHVNDSLDAATDRDHLRLLMSEISVDGSEKVTSHGSHTVCEAAVHEALLRECLYHEGQRQTYDLIRFDRVLSRVKVKFVNTKIRIEHVPKNGDKGIALEVHIENIDYFDEAGTEPSPETTDPDKTKTYIVSTYTNKKIKFNGVVFNIDEFPSKLRTMAPSLMEKSASSVDRSDGASVDTPNSNYQSTMSDVFYETRSVMSTIDSDPVKEIIEERHIGSARESTPPDRTTQADPILFAKLTGQQELALKLKHSEEVEGPKVEVKILLGSFLIFITPRQMRTIIELVDALNQPHLEDTSNIPVRPSNINMQCKPMKQADFQLIEAQLLGNLDKQQAKPSNMYGWSGPSFEDGETDEKFLPMTSQGLMSESFTSSISSMSNSMTSSMNISSQPRIKRNKKVPHIEGDPTAEVSHISLRVASISCVLLHKDILAPTPLSLDSVSYSSAYKMQQVATEFFNRIETFSKFDERRNIHHVNDSLDAATDRDHLRLLMSEISVDGSEKVTSHGSHTVCEAAVHEALLRECLYHEGQRQTYDLIRFDRGDEDTTVSTKSNIRMNFKQTSKYISTSGERKLVYPTTDIVLKCTPFYIDVDLTLLERMSSTFFGGPPPPPSPHVASPSNKSQNQVNFSLQCPNLDIILRFPIADLRPGGRSEARSVRPDYLLFKLHNTNVGLQQLASARPLPTTISIRMTTLDLYYYVCTYNPLSNLNFSSIIDQVYDKIYTYISIIYDCLLSLLFHSKIMSYILL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: