MonarchBase - Protein-coding gene

DPOGS202241
Transcript	DPOGS202241-TA	3666 bp
Protein	DPOGS202241-PA	1221 aa
Genomic position	DPSCF300032 - 884670-895968
RNAseq coverage	451x (Rank: top 27%)

Annotation
*Heliconius*	HMEL002592	0.0	78.96%
*Bombyx*	BGIBMGA004832-TA	0.0	71.65%
*Drosophila*	Atg2-PA	2e-161	31.68%
EBI UniRef50	UniRef50_UPI000224793F	0.0	40.77%	UPI000224793F related cluster n=3 Tax=unknown RepID=UPI000224793F
NCBI RefSeq	XP_969083.1	0.0	38.78%	PREDICTED: similar to autophagy-specific gene 2 [Tribolium castaneum]
NCBI nr blastp	gi\|345495823	0.0	40.77%	PREDICTED: LOW QUALITY PROTEIN: autophagy-related protein 2 homolog A [Nasonia vitripennis]
NCBI nr blastx	gi\|345495823	0.0	40.85%	PREDICTED: LOW QUALITY PROTEIN: autophagy-related protein 2 homolog A [Nasonia vitripennis]

Group
KEGG pathway
InterPro domain	[1125-1213] IPR015412	3.4e-16	Autophagy-related, C-terminal
Orthology group	MCL11314		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS202241-TA
ATGAGGGAATTCACAAACAGCTCCGTAGAACATTCCGCTATACATCTAGACTTCAGTCTGCCCATCCTCAGCTTACAACTGGAATCAAAGCAGCTGTACGAGATCCTGTACAACCGCATTAGTTCCGAGCTGCTGCTGTGGTCTCCTCGTGAAGAGTTTGATATCGCCCCCCCTCCGCCACCCTCCTTCGAACCATGCCGTGGAGGATACGATTCAGACTCGGAGAGCTCGTCGTCTCAAGAGGACAATTTATACTATTCAACATATGACAACAAATTGAAGAAAGGCATCGGCAACACAAGACCGTTCTCAGACATCAGACAATGTGAGACGCACAACTTCTGTCTCACATTCAATGTTGACAAGGGGCTTCTCTCTATATTAGCGCCTGTGAGGGATAGCAACAAAAGAGTTGTCCCGGGACAGATGGGTGAATTAGTTTTGGAGGCGCATAAGCTGTCTATGTGTCAAGTCAGCGGGCTCTATGGAAAAGCTAAGACGGCCCAAATGTGTCTGAGGGCTGCCAAGGCGACTCTATACCATGAACCGCTCCTGACTATACCGTCAGACAGGCCACCGTTACGTTTGTACGGCTCAGTGTTGCCATCACACCTCAAGAAGACAATATATCCGTCGAATAAAGGCGTCATAATAAAAGATAGATTGAAGCCTAAGGACATGTTCACAATGGCGCTGAAAACTGAACCTGACACTGAGACGCCCAATTTGAAGACAATATGCATAGCCCTGGGCATTGAACAGGCCACCCTCCGACACAGAGGCGACAAGGGTATAGCGTGGCTCAGTCAGCTGTTGGATGTACTAGATGTTATAGACTACCCTGTGCCGGGATACACGCCGTCGCCAGTACTATCAGAATTGCATGTGCATGTGTGGGACTGCGCTGTGGACTACAGGCCGCTGTATCTTCCAATACGTAGCGTGGTGACGCTTGGCAACTTCAGCGTTTCCAGCAACCTTATACCGGAAACCAACACGTCCTACCTCCGCTTCCTCGCTCAAGAATGCTCACTCCACCTCAGCTATCTCCACAGCAAGACTGTAGCGCCAGACGACAGAGCACCAGATCTCCACAAGGAATACGTCTGCGTCATTGATGTCGGACTGTTTGAACTGTCCCTTAGAATGGAAGATAAAAGCAATGGCAGCCAAGACCATCCTCAGGTGGACCTGACGGCGTCCAACAACATGGTGACTATGTTCACGTGTTGGGATTCCGCGTCCGCGCTGTGCCGTCTGTTGACTTATGTGGCGTCTGACGGGGACTCGCAGACTTACGACTCCCGACACACCAGCCTGTGCTCTGACCAGCCCTTGGAACAGTTGGTTGGGTTAGAAGATCGACCGATAGAAGAAATAAGAGAACTGTCGCCGAGTGAAATCCAACAAGTGAACGATTTGATGGCGGAAGCTATGAAAGAGAGTCCCAATAATACAATTGATGATGAGGATTTCGTGAGCTCGACGGAAAAGGAAGGTGTGGAACTGTTCTACTTTCCTGATGAGTCAAATGTGAAGCAAAAGCAACTCGAGACAGCGGACGCCGAGAGCGAAACTAAGTCAGTTGAATACGAAGACATGTCACACGTTGAAGAGGCCCAGGAGGCGACGCCGACCAACATGCAGGTCGCCAGGGATCTAGGGGACCCGACTGTCACGCCGAAGTCGACGCCAAAAAAATCAAAGCGGAAAAAGATGAGCTCGTGCGGCAGCGGCAGTAACACGGACGACGAGTACTGTGTGGTGGAACAGCTGGCTGGTGACATGGAGATGGAGGAGCCGGTGGTGACCTGGCTGGCTGGACCCGTCACTATGTTGAACGACCACTTCAGTGTACCACCAGCGAAGTCAGACGTACTCGCAGCGCCCAAGAGCTTCCCGCCACCAGTGCTCAGGTACACTCTGTGTGAACTGAGCTTAACCTGGAATATGTTTGGAGGCAGTGATTTCAAACCGAAAGAAACGTCCAAGAAATCAGTCTCCATTGATGATCCTAGGGGAGGGGGCTCGCCTGTTAGTTCTGCGCGCAGCAAGGACTACGAGCCATACGAGAGCCGTCGCTCGTTGGCGTCCTCATACCGGCACGGGGTCAGTTGGAGCGCGGGAACTGACCGGGTGCGGGCGACTCACACAAGAAAAAACGACTCCCGGGATCATCACACTTGTGTCAAGCTCTGTCTTACTAAGGTGAAGTTCCAACACGAGGTGTACCCGCCCGGATGCACGCAGGCTTCCAGACAGACCCTGGCTATCGCAAAAATAGAAGTCTTAGACAGATTAGTGTGCAGCGACATCAACAAACTGCTGAGTCAATATAAACTTAAAGACGAACCCGAGAGAAAAAACGCTCATATGTTAATAGTGAAAGCGGTCCACCTGCGAGCCGACGCCTCGCTCCCGGTGCAGGAGTGCTGTCTAAAGGTGTCTCTACTACCGCTACAATTCAACCTGGACCAGGACACTCTCGCCTTTTTAGTTGATTTCTTCTCTAAATTGGGCAGTGATGAGACCAATGAGGAAGACACAAAGAGCCTAGGGGCTGTCTCAACGGAGTCAGGATCCCGTCAAAGTACGCCCACACATAGGCCGCCCGTGATGAGCGTGGGTGCCCATTTAAAAGACCCACCGCCCACGCCCACATCCTTAGGAGATGCCGACTGTCTCTCGCTTAACGAAACTGTTATTCGTGACGACGAACCGCTCATGGAGACGTATGAAGCTGAACGGCTGGTGTCCGAGAATCTCATACAACTGGAGGAGGACTTTCAGCGGCTCGGCATCAGCCACGAGAAGCCGACCACCAAAGTGCAAGACTGTGAACCCGTCGATGACTCGCCTATATACTTCCGTCGTGTAGTATTTTCTCCTGAGGTGCCAATACGTCTGGACTATGTGGGTAAGCGTGTAGACCTGTCAGCTGGTCCTGTGGCCGGACTGCTCATGGGACTCGGACAGCTAAACTGCTCAGAGCTAACATTGAAAAGGCTCGATTATAAGTTGGGCCTGTTGGGCCTTGAGAAGCTGGTGCAATGGGCGCTACACGAATGGCTATCAGACATCAAAAGACATCAACTGCCGGGGCTACTCAGTGGCATTGGGCCCATGCATTCCTTACTACAGATAATCACCGGCATCCGCGACCTGGTCTGGTTGCCGGTGGAGCAGTGGCGTCGCGACGGGCGTCTGGTCCACGGTCTAAGACGCGGCGCCGCCTCCTTCACAGCTAGAACTGCTGTCGCTGCTCTGGACATCACCGCACGCATCCTACATCTCATACAGGCGACAGCTGAAACGGCGGTGGACATGTTGACACCGGCTCCGGCTCTGCCCCTGTCGACCCAGGGGAGGAGACGTCGCAGAGACCGCACTAGACAACCCGCTGATATACGGGAGGGAGTTACCAGCGCATATAACACTGTTAAAGAGGGTTTCGCGGAGACGGCCGCATCATTATCAGCGGCGGCTCGTCGGGGGAAGGGCGCGGGGGTGCTCCGTCAGTTGCCGGGGGCTGCGGTCGCGCCCCTCGCCCTGGCCGCGGCCGGCGCCGCCGACGTCCTGGGAGGTGTCCGAGCACACCTCGCACCGCACACCACGCGTGATCACGCAGACAAATGGCGCAGACCATTCACAGATACGACTGATTAA

Protein sequence:

>DPOGS202241-PA
MREFTNSSVEHSAIHLDFSLPILSLQLESKQLYEILYNRISSELLLWSPREEFDIAPPPPPSFEPCRGGYDSDSESSSSQEDNLYYSTYDNKLKKGIGNTRPFSDIRQCETHNFCLTFNVDKGLLSILAPVRDSNKRVVPGQMGELVLEAHKLSMCQVSGLYGKAKTAQMCLRAAKATLYHEPLLTIPSDRPPLRLYGSVLPSHLKKTIYPSNKGVIIKDRLKPKDMFTMALKTEPDTETPNLKTICIALGIEQATLRHRGDKGIAWLSQLLDVLDVIDYPVPGYTPSPVLSELHVHVWDCAVDYRPLYLPIRSVVTLGNFSVSSNLIPETNTSYLRFLAQECSLHLSYLHSKTVAPDDRAPDLHKEYVCVIDVGLFELSLRMEDKSNGSQDHPQVDLTASNNMVTMFTCWDSASALCRLLTYVASDGDSQTYDSRHTSLCSDQPLEQLVGLEDRPIEEIRELSPSEIQQVNDLMAEAMKESPNNTIDDEDFVSSTEKEGVELFYFPDESNVKQKQLETADAESETKSVEYEDMSHVEEAQEATPTNMQVARDLGDPTVTPKSTPKKSKRKKMSSCGSGSNTDDEYCVVEQLAGDMEMEEPVVTWLAGPVTMLNDHFSVPPAKSDVLAAPKSFPPPVLRYTLCELSLTWNMFGGSDFKPKETSKKSVSIDDPRGGGSPVSSARSKDYEPYESRRSLASSYRHGVSWSAGTDRVRATHTRKNDSRDHHTCVKLCLTKVKFQHEVYPPGCTQASRQTLAIAKIEVLDRLVCSDINKLLSQYKLKDEPERKNAHMLIVKAVHLRADASLPVQECCLKVSLLPLQFNLDQDTLAFLVDFFSKLGSDETNEEDTKSLGAVSTESGSRQSTPTHRPPVMSVGAHLKDPPPTPTSLGDADCLSLNETVIRDDEPLMETYEAERLVSENLIQLEEDFQRLGISHEKPTTKVQDCEPVDDSPIYFRRVVFSPEVPIRLDYVGKRVDLSAGPVAGLLMGLGQLNCSELTLKRLDYKLGLLGLEKLVQWALHEWLSDIKRHQLPGLLSGIGPMHSLLQIITGIRDLVWLPVEQWRRDGRLVHGLRRGAASFTARTAVAALDITARILHLIQATAETAVDMLTPAPALPLSTQGRRRRRDRTRQPADIREGVTSAYNTVKEGFAETAASLSAAARRGKGAGVLRQLPGAAVAPLALAAAGAADVLGGVRAHLAPHTTRDHADKWRRPFTDTTD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: