MonarchBase - Protein-coding gene

DPOGS214248
Transcript	DPOGS214248-TA	3996 bp
Protein	DPOGS214248-PA	1331 aa
Genomic position	DPSCF300014 + 1290678-1300579
RNAseq coverage	448x (Rank: top 27%)

Annotation
*Heliconius*	HMEL004440	0.0	78.19%
*Bombyx*	BGIBMGA005967-TA	0.0	69.57%
*Drosophila*	CG1347-PB	3e-117	37.39%
EBI UniRef50	UniRef50_Q7PWR9	3e-147	30.82%	AGAP008873-PA (Fragment) n=1 Tax=Anopheles gambiae RepID=Q7PWR9_ANOGA
NCBI RefSeq	XP_319618.4	6e-148	30.82%	AGAP008873-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|158299500	1e-146	30.82%	AGAP008873-PA [Anopheles gambiae str. PEST]
NCBI nr blastx	gi\|170040675	5e-155	30.01%	conserved hypothetical protein [Culex quinquefasciatus]

Group
KEGG pathway
InterPro domain	[1102-1195] IPR019460	4.2e-12	Autophagy-related protein 11
Orthology group	MCL13245		Single-copy universal gene

Nucleotide sequence:

>DPOGS214248-TA
ATGTTGTATGTATTCCATGTTGACGCCGGTCAAATGACCACTTATGACATGGAGCTCACTTTACAAAGTGTTGCAAGCTTAAAAGCAGCTATAGAGAGAAAGACGAAAATACCGTCATCCTCTCTAGTGCTCCTCATAAGTGGGGGAGAGGTACTGCAGTCGGATCACATGGTATCCTCATATAGTGCAGGGACGGATTCTAACCCTATATATATGTTTAGTAAACCATCTGTTAAAGAAAGCCATTTGAAACAGTCCATGTGTGATTTGAGTCCAATAGTCGAGCTCAGTACTGGTGAATTTCGTAGTGATATTCGGAGTGCTTTCGATGGCAAGTCAGTGGCAGAATTAAAGAATGCCGTAGAATTATGTTGTTCACTCCCACCTAATATACACACTGTGATATCATATGCTACATTGGCCCAGCAGTTTGGTGACTTAGCTCATGAGGTGTCAAGGAGTTGTGATCAGTTGGTCCATGAACAGCATTTACAGCATCAGGGTTGGTCAGCGGTCATTGCTAATTTAGAGGACATATTCAATGAGTTCTGTGAGAGGTCGAGAAGTTTCAAAGAGTCATTCAGGAAACACAGACTAAAAAAGGAAGAGTATCACGAGAAACTAAACACATTGAATGAAGTACTGGAGTCATTAGGGAAAATACCAATTTTGCCTGCTCTTCAGTTAAATGCAGAGGCTCATAGGTTTTCCGCTTTTGATGTATTTGAAGAGACGGACTTTGAAGGTCATCATTATGGAGCTAAGGAGACTTTGGATAGCAGCTCAGAGAGAACTGCAGATTTTGGAGTTGGGGTGTTTAAGTTATCTGAGGAAGATGTATTTGAGCAACCATCAACAAGTAATGAGGGGGCCTCAGATGAGGCCCCAGATAAAATGACAGAGGGGGCCTCTTCTTCTGGTCAGTCAGAGGGCGCCACATTCAAGGTCAATGAGGAACATACATTGTTACACTGGATCTTGGCTCAAGGGAACCAGGCATCACTTCAGGACATATTGGATTACTGTCAGAAAGGACTCGCTCTGATCGACGCAGAGCCTCTGAAGGAGAGGGAGGCGGAGCTATACAATATCTTGGAGTACGCTAATGTTCACGGCTTGAAACAAATCAAAGGCATCGAGGATAGGCTGTACGCGTTGGAACAGCTGCTGAGTGACGTCAAGAAGAAGGAGAACGAGCAGCACGTGGTCGCCGCCTCGCTCATACAGCACCGGGATCGTCTGAACTCCGGCTGCGACCCGTCCGTCCTGCCGACGTTGTTGGAGTCCAACCAGTGTCAGTTGGGGAGACTGTTGAAGGGACACGAGCTGCTGGTCGATATTAGAAGGAGGATCATGAAGTCCAAGGACGAGTTGTCCAGGATACTGAAAGCGAGATTAGAGGCCGTGCTGGTGATAGAGAACTCGATGTCGGTGCAGGACGCGCACGCGATGCTGTCGTTCCAGTGTTTCAACCGTCTCGCTCGTTACTTCGGTATAGTGGCTCAGCTCCACCGAGCTCCGGCCGTATTCGTGAGAGCTGTCCACGAGGTCGCCAGGAGGAGGACCTTCTCACAACACCATCTCCAGTGGGCTACCGATCTCGCCAGCAAGCTCATAAAGATACACGAGGAGGAGATCAGCAGACGCCAGGAGTTCAACTCTCACTTCGAAGATCACTTCCTGAAGAGCCTCTTCCCCGGCATGACGGACCTGCCTCCCCCATTCGCTACACAGGCGCCATCTCTATACGACTCACGCCTGCCCGAACTCACTGATACGGATGTAGAGTATATATCAGAAGCTCTACCCGACTGGACTAGTGATGTACCCAAATACGATATGGAATCCACCGTTAAATTCTTCCAGCAAAGGCTCAATACATCTGACCACGAAGATAAAGACGCCGATGTTCAAGTAGATTTTGATAAAGATTTTGAATCAGAAACCGACACGGATTTTGAGAAGCTGAGTCGTCAGAGCGAAAAGCAGAAGAATGATATATCTACGAGCTGCGTCCCTCACACGATGGCCGTCTCTACAGTGACCGAGGTTGGGACTCTACCCGTTATACCGGAAAGCCCTAGAGTGGAGTTCCTTAACTCTGAATTTTATATAGAAGAATCTCTACCGTCCAGTCTGGAATGGGGCCGGGATGAACGACAGGACAATATGGACACTCACAAAATCAACATGGAGAAATTGCAAGATTTGTTCGTGAAGTTGTTTAATGTATGTAAAATAAATATTGTGTTGATAAAAGACGAGCTTACTAAGTTAAAGAGCGAAGTGGACGGTCAGAAGAAATTCATAAACACAAAATATCTAGAAATTACCGAGGCCTGGGAAAAGGTAAATGAACACGCTGAAACAAGATTCCGCGAGCAAACCCAGAGGCTGACGGTAGATCACGAATTAGAATTGAGTGATATGAAGGCGGCACTCAATGAAAAGGATGACGTCATCAGCAACCTGAAGAAAGAGACGGAAGATATGAAAATGGAACACCAGAAGGAGACGGAGAGGTTAGACAAAGAGCATAAAAGCACTAAGGAGTTGTTAGATGAAACTCGGAAAGAGATAAAAGCTTTTGAGAAGAAATTAGAGGAAGCTGAGGTTCAGAAACAAAAAGATATCAAAGAGATGCAGGAGAAGATGCATCTTGAATATAAAGCAGAGATAGAGTCGCTACGGTCGAGGTTCCGTCTCGTGGCTCTAACGAACAACATGGACAGGTCGCCGTCGGAGTCCAGCCTGGAGAAAATCGAGAGGACCGACGTCATAGAGATAGTCAGCCACAACGCTATACTGATGCAGACGAAGCAGAACGCTGAGGTGGAGAAGGAAGAAGCGGTCAAGGAGGCGGTGGAGAAATGTAAGGCGGAGTGGGAACAGAAGCTTAACGCTGAGATATGTCTGCTGAAAGCCAAGTATGAAGCTGAGAAGCAGGTGACGATAAACGACGTGACCCGTCGTCTTCTGTCAGAGAAGGATCGCCAGTTGGAACTGCTCCGGGAACGCGAGCAGACCCTCGTTCGCGAGTGCTGCAAATACAGGGACACTATACAACAACTCACTGATCCAGAGACCAACGACTACGATAGTCTCTTGAAGACTCAGTTTGCAACATTTGAAAACGAAAAGGCTGTGCTATTGCAACAAGTTGCAAGCTTGAAGGCGGAGTTAGAGAAGAAGACTGAGGAGGCGGACAAGAGGAGGGAGGAGGATAGTGACGGCAGGTCGTCTCCTCGTCGTGATATCCGTCGCCGGAGTCACACGCCGCTGGGTCTGTCTCCGGGCGCCCTGACCCTCGCCCTGGGCCAGTACCCCCAGGGTCACACCGTGCTGGTCATGTGGGACCCTGCGCATCTCAACTACACCGTACTACAGGAGGCGTCCATAATGCACTTCGTCCACAGCGACTGTCTGCCGTCCCTGGACCTTAGTATCCACGTGAAGAACGAGAGTGAGAGACGTTTGTATGCTGTGGCCACCGTGGAGTCCAAGGAATACTGCTACGCTAAGAGGGGTGTGAATAGATATCACATGCCGCGTGGATCTCGCTTCTATAGAGTCCACGTGAAGCCCCTCAAACCGCCGCTACCTCCGCCAGCCTGCTGTGATCACAAACACAAGCCTGACATGCAGAAGTCCATCGACACCAGCCAGTCGTCCAGCTCCAACGCCGATAAGACCGGTGTGGAGGTGGCCACGGCTACGCTCATCAACCTGGAGTCCCCCGTGTCTGCTGGGGAGCCTCCCGTGCCCATGATAGCGCCCGAAGACCAGCTCGACTCCATAGAGACGGAGCACAAACAACACAAGATGCAACTGTCTACAACCAGTGCTGTTTCCGAGATGGACCTCAGCGTGGGTCGTGTGGTGGGGGCGGAGGCTCCCGGGGCGGAGCCCGTGGAGCTGACGGTGAGCGCCGTGTCGGTGGTGGCGAGGGGCTCCGCGCCGCCCGGATCAGAATTGGCCGAAGAGGCCGCGCCCTGA

Protein sequence:

>DPOGS214248-PA
MLYVFHVDAGQMTTYDMELTLQSVASLKAAIERKTKIPSSSLVLLISGGEVLQSDHMVSSYSAGTDSNPIYMFSKPSVKESHLKQSMCDLSPIVELSTGEFRSDIRSAFDGKSVAELKNAVELCCSLPPNIHTVISYATLAQQFGDLAHEVSRSCDQLVHEQHLQHQGWSAVIANLEDIFNEFCERSRSFKESFRKHRLKKEEYHEKLNTLNEVLESLGKIPILPALQLNAEAHRFSAFDVFEETDFEGHHYGAKETLDSSSERTADFGVGVFKLSEEDVFEQPSTSNEGASDEAPDKMTEGASSSGQSEGATFKVNEEHTLLHWILAQGNQASLQDILDYCQKGLALIDAEPLKEREAELYNILEYANVHGLKQIKGIEDRLYALEQLLSDVKKKENEQHVVAASLIQHRDRLNSGCDPSVLPTLLESNQCQLGRLLKGHELLVDIRRRIMKSKDELSRILKARLEAVLVIENSMSVQDAHAMLSFQCFNRLARYFGIVAQLHRAPAVFVRAVHEVARRRTFSQHHLQWATDLASKLIKIHEEEISRRQEFNSHFEDHFLKSLFPGMTDLPPPFATQAPSLYDSRLPELTDTDVEYISEALPDWTSDVPKYDMESTVKFFQQRLNTSDHEDKDADVQVDFDKDFESETDTDFEKLSRQSEKQKNDISTSCVPHTMAVSTVTEVGTLPVIPESPRVEFLNSEFYIEESLPSSLEWGRDERQDNMDTHKINMEKLQDLFVKLFNVCKINIVLIKDELTKLKSEVDGQKKFINTKYLEITEAWEKVNEHAETRFREQTQRLTVDHELELSDMKAALNEKDDVISNLKKETEDMKMEHQKETERLDKEHKSTKELLDETRKEIKAFEKKLEEAEVQKQKDIKEMQEKMHLEYKAEIESLRSRFRLVALTNNMDRSPSESSLEKIERTDVIEIVSHNAILMQTKQNAEVEKEEAVKEAVEKCKAEWEQKLNAEICLLKAKYEAEKQVTINDVTRRLLSEKDRQLELLREREQTLVRECCKYRDTIQQLTDPETNDYDSLLKTQFATFENEKAVLLQQVASLKAELEKKTEEADKRREEDSDGRSSPRRDIRRRSHTPLGLSPGALTLALGQYPQGHTVLVMWDPAHLNYTVLQEASIMHFVHSDCLPSLDLSIHVKNESERRLYAVATVESKEYCYAKRGVNRYHMPRGSRFYRVHVKPLKPPLPPPACCDHKHKPDMQKSIDTSQSSSSNADKTGVEVATATLINLESPVSAGEPPVPMIAPEDQLDSIETEHKQHKMQLSTTSAVSEMDLSVGRVVGAEAPGAEPVELTVSAVSVVARGSAPPGSELAEEAAP-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: