MonarchBase - Protein-coding gene

DPOGS211108
Transcript	DPOGS211108-TA	4746 bp
Protein	DPOGS211108-PA	1581 aa
Genomic position	DPSCF300007 - 708856-720617
RNAseq coverage	185x (Rank: top 49%)

Annotation
*Heliconius*	HMEL012447	0.0	58.66%
*Bombyx*	BGIBMGA002983-TA	0.0	48.42%
*Drosophila*			%
EBI UniRef50	UniRef50_E0VF11	2e-49	41.47%	Putative uncharacterized protein n=1 Tax=Pediculus humanus corporis RepID=E0VF11_PEDHC
NCBI RefSeq	XP_973331.2	7e-54	39.22%	PREDICTED: similar to Activating molecule in BECN1-regulated autophagy protein 1 [Tribolium castaneum]
NCBI nr blastp	gi\|189237803	1e-52	39.22%	PREDICTED: similar to Activating molecule in BECN1-regulated autophagy protein 1 [Tribolium castaneum]
NCBI nr blastx	gi\|189237803	2e-54	28.94%	PREDICTED: similar to Activating molecule in BECN1-regulated autophagy protein 1 [Tribolium castaneum]

Group
Gene Ontology	GO:0005515	3.3e-21	protein binding
KEGG pathway
InterPro domain	[1435-1579] IPR015943	3.3e-21	WD40/YVTN repeat-like-containing domain
	[133-250] IPR011046	3.2e-16	WD40 repeat-like-containing domain
	[135-175] IPR001680	1.1e-07	WD40 repeat
	[136-175] IPR019781	1e-06	WD40 repeat, subgroup
Orthology group	MCL26737		Lepidoptera specific

Nucleotide sequence:

>DPOGS211108-TA
ATGAACGTGCCGCGCATTCTCAAAGGAAACAATCTAGCATTCTACCGCAAGCCGTTTGAGATCGGAATATTCAAGCGATTTCTCACTTTTCTTATTCTTCACCTATCACAATTTAAAAAGGTAATGGATCCAGTTATTGACAATGAATGGCTGGGATGTAAGAATGATCCGATCGATGAACCACCGACATTTGGCAATATAGCACGGAGCTGGCAGTGGCGGGAGAGGGGAGTCAATGCTCCGAACTCACCGTCAAACAAGACAGTACTTGAGAATGTTGCTGAGGATGTACTTGTACAAAAGCCTCTTAAGATACGAGGGGAGTTTCCACTGATAAATGGCAACTGCTTAGTGTTTGGTCGCCTTGTGACCACAGCCTGTGCGACTTGGGCCAAATTAGCTAGTGGGAAACATGTGAGGATTTTGAAAGGTCATCCTCGGACACCGTGGTGTATCGCTTTCCATCCATCCCATCCACAGCTCATAGGATCTGGATGTCTTGCCGGACAAGTGAGAGTGTGGGATATATCGAGTGGTGGCAGTGAAGTGTGGAATGTGAGGAACGAGACTGTCATAGCCTCGATAGCTTTCCATCCAAGGGTACAGTTGTTGGTGATTGCTACGTACAATGAGCTATACTTCTGGGATTGGAGCCAACCAGCACCAATGACTAAGGTCTCCACCAATAACATCAATGAAAAAGTCAGATACGTGGCATTCGATTCTCTCGGCTACAAGTTAATAACCGGCATATCGTTGAGCGCGATAAGGGGTGGTGTAGACGCGACCGTTCTCCAGCACGCTCCATCAAATCCCCAAAACAACAGCAACCGTAGTCTCCACCCCGATGATAATGACGGCAGCAATAGACCAGACACGGCTGGGGCGACACAGGACGTTATAGTGAATTCATATCAGTATCTGGTACAGAGGTACGACAGTCTTGTCAGGAATTATCAGAGGCTGTTCATGGTTAGGAACCGGCTCGCTGTCACACCGCCGCCTAACACGACGGACAGAGGAACTGATCCAATGGAAACAGACCCAGCTCCAGAAGCAAACAGCTATACACGCACGGCTCGCTCCTATACAGCCACAACACAGTTGGATGACGAAAACCAAAACTCGAATACAAGTAATAGTAACACCGCTGAAGACACCGCTGACGCTGCTGAAGAAGGGAGTAGCGGTCTTCTGAATCTTGACGCCCTTTCCTTTGATAGGGCACCTCCTGGAGAGAGAAACATGTCGAGACTGGAACTTGCTATATTCGGTGCGCGTCCGTCAGCTTTTCATCCGCTCACCAACGAAAATCCCGGACGATCTTTCAGAACGGTCGATCAAAATGAAAGAGCCTCAAGACTTTTGCCAAATCCTTTTTCAAACACAAACGGTACACCGCGGCCCAGCCGCGTCTCATTCGCCAGTAGTCCGTTGACCCAACAATCAAACAACGATAACGCGCCAAATGCTTCTCGTACCAGTATTTTCACGTCATACAGACCTAATTCTCCGTCTGTGTTGGATTTATCGTCGCGCAGGTGGAGTGGTAATCGTAGAGTATTTATTCCAAGACCCAGCGACTCACAACCGTCGAATAGCAATTCGTCTACAAGATCCCGTCAGGAAGATGCTTCTTCCAACACAACAAATAGGAACACAGCAACAAATACCAGTGCATCTTCAAATTCGAATTCTATTCCAAATATATCTTTGAGTAATAATTCATTATCCACTGGCAATACGCCTACAGATACAACCCCCTCTACAAATAATTCAACCAGAAGAACGTCATCACCACCTCAAGGCTCGCCAGTTGACGCGCAGACGATTAACGAGAGTTTAGATTTAATACGAGACATTCTCAGAGATTCCGGAACGAGATTGTTAAACTTAATCACAAACATGTCCGCTTCAAGTCTACCTCACGTGGGTCCGGAAGTTCCGAATAGACGCGTCAATATAAGAGCCCATTCGGACGATAGCGGTGAAAGTGAACGACCGAGGGGAGCACGACCACGGGTTCGCCTATTCAGCTCCAACTTGCAGCCCGAAATACTATCTTCGAGTTCAGAATCTGATAGTGACCAGTCCTCAGAGGTAAATATTCTTAGGACTCCGAACACGACGTTCAGAGAAGAAGACTCGCGAGAAGAATCGTCTCGAACTACCGAAATGCCGGGACCGTCTAACAGATCAGCGCCTCCCTCTGATAGAGCAGACTCCGAGAACGATGACAATACACCCAACACTGGCATTGATACTGAGAGTGTTTCTACAGCAGCAAGTGCAAGTAGTAGTCGTAATCGACCGAGAACACAAAATAATGATGCAGGCGAGGGGCCTAGCACATCAAGTCACGCGTCTGACGAACCAGAGAACTTAGCTCAGAACAGTTCAAACTATTTCGATTCTAGTAGACCTTCCACAAGTGGAAACAATATATGGACGAATGGGGCCACAGTGCCACCAGAAGAAGCGTTTAGAAAAGTTCGGGGCGGTGTGAACGCGTTACAGAAACACACAACTCAACTGACTAATATGTGGGTACGCGGGAACCGCACTACAATGCGAGAATTACGTACCATGTGGGAGAATTTACGTAGACGAATCATAATGTTACACAGGGAAACCGGCCGCCAAGACTTACCTAACTATTACACGAGATCTCTTTTAGAAAGATGTATGATGTTGACTGAAATGACAGGAGAAGCGAGTCGTAATGCCACGAGAAATTATAGATCGCAATCTAATATGTCTTCTTATGAGCCCAGGCCTAGCACGTCTAGAGCTGTTCCGGAAGACAATAGACCCTCACTATCAGGAAGATCTCCATCAAAAAAAACACCCCAACGATCCTTATCGTCATTATTATCAAAGAGACTTCAAGCAGCCTATTGTAGATGGCGGCCAGAAGACCGAAGACGCAATCCGATTTCAAGTCGTATGTCTCAACGATATCTACATAGACCACGAAGGGAATATACAAGGTTAATAGAAATAAGTGCGACAAGGCATGAAATTCGCATGCGTGCTATGCAAGTGTTGTCCGTCATGTTTAACATGATGATGTTGTGTTTAGAGGAGCGAGGATTGAGTTCGCTGATCATAAATATGTTACGCACTCTAAAAAAGGCGCTGGCATTGACATGTTTGATGCTAATGACAAATAGGTACAACCCACGCTCCAATAATAACGATTCTCCGCAGAGAGTTGATTCAATGAATGTTATACGTTTGCAAAATGTTGATCACACCGGTCCCGTTAATGTGGACGGTCCAGATGAATCTCCGCATCATTCAATATCCAGCGAAACGGAAGAGGATCGATCGACTACACAATCTGTAGCTACAGAAAATCCTGCAACAGATGACACAACACCACCGACGGCACCCGCTAGCCAAGAACCAACCCAAAGATGGAGCAATCGGTTAGCAGTACAGATTGCGGCTGCCAATCGAAATACTTCAATGACCGCTAGAACGAGACGAGATTTGTACGTAGAAAGCAAGAGACAAAAAGCACTACATAGAACAAATCCGTTAGCCCATCCGCTAATTAAGAAAAAGGTGCTACCACCCGTATCCACATACAGAATTCCTTCGTTGCGTTTGACACCTCGAAGATTAAGTGTCAGGAATAGCGCGTCCAGGGCCAATCCAGCAAATGGAGAACCAATAGCTGGGCCGTCTGGCATTCTTTCTGGCACCGGTACCGTTCGTGGCGGACCGTCAAGGCTCCCTCCGGAAATGAGTAATGAGTTTGAACACAGAATCAATTTAATAAGAATGGCGCACATGCAAGCTGTAAGACTACGTAATGCTGCTAGAAGTAGATTTCGCCGTTTGCAAACCATCCGTCTGTACACCCCATCTTCAGTGCGAGAGATGTTCACCCTGCAGCCTGAGGGTGACAATCCCCACGAAAGCCGACCATTACAAAATAATTCTGAACCCAACCGGCGATCGCTCACGTCCTACGACTACAGGCCTCATATACTGACTCGGGAGAGAATCTTCTCTAGAGGAGCTGCTAATAGACCTTCAGAAGATTCAGGACAATTTCACGCGGTCATCAGCAACACGGGTATGCCACTGATGCAGGTCAGTGACCTCAGCATCAGCAACCAAGATGGTCAGGGCAACCAGAACCAACGGCTACCGAGAATCCATGAATACTTGCAACCGATTATTTTGGCCCAAAACGCAATGGTGGTTGATGAGGAGAGGGGTGAGGATGGGCCTGGAGGTCCGGGAGGGTCGGGGGGAGCTACAAAAAACGTGGTGGTTCAACGTTGCCGTATCCACAATGACGCGAGCATCGACATATCCAAAGACGGCAGACTGTTGGTGGCTCTCCTACCAGTACCGCGGCTCAGGAACGCGAACCATTGGCTCGGTGTTTATTCCTTGGAGTGGTCCCGTCTGGGTCAATGTCTCCACACAGCGGTGTTGGAACAGAATGCTGTTTCAGTGGCACTGTCACCAACAGCAAGACATCTGGCTGTAGGTCTTGGATCTAGAAGATTCACATCAGCAGCTCACAGTAGGAACAATGTGTTTGCACTGCTGTACAGATTAGATCCACTTGAGAATTCAAGCCGCACTGGTTTATCACCTATCAAAGAATTGGAACAGACATGGGAGCATGGCTTCACCAGCCTGAATTGTCTCCGTTGGGCCCCGCAACCCGGCCAAGGACTGGTATATGCCAATAATACAGGACAACTGATAATTATGAGCTAA

Protein sequence:

>DPOGS211108-PA
MNVPRILKGNNLAFYRKPFEIGIFKRFLTFLILHLSQFKKVMDPVIDNEWLGCKNDPIDEPPTFGNIARSWQWRERGVNAPNSPSNKTVLENVAEDVLVQKPLKIRGEFPLINGNCLVFGRLVTTACATWAKLASGKHVRILKGHPRTPWCIAFHPSHPQLIGSGCLAGQVRVWDISSGGSEVWNVRNETVIASIAFHPRVQLLVIATYNELYFWDWSQPAPMTKVSTNNINEKVRYVAFDSLGYKLITGISLSAIRGGVDATVLQHAPSNPQNNSNRSLHPDDNDGSNRPDTAGATQDVIVNSYQYLVQRYDSLVRNYQRLFMVRNRLAVTPPPNTTDRGTDPMETDPAPEANSYTRTARSYTATTQLDDENQNSNTSNSNTAEDTADAAEEGSSGLLNLDALSFDRAPPGERNMSRLELAIFGARPSAFHPLTNENPGRSFRTVDQNERASRLLPNPFSNTNGTPRPSRVSFASSPLTQQSNNDNAPNASRTSIFTSYRPNSPSVLDLSSRRWSGNRRVFIPRPSDSQPSNSNSSTRSRQEDASSNTTNRNTATNTSASSNSNSIPNISLSNNSLSTGNTPTDTTPSTNNSTRRTSSPPQGSPVDAQTINESLDLIRDILRDSGTRLLNLITNMSASSLPHVGPEVPNRRVNIRAHSDDSGESERPRGARPRVRLFSSNLQPEILSSSSESDSDQSSEVNILRTPNTTFREEDSREESSRTTEMPGPSNRSAPPSDRADSENDDNTPNTGIDTESVSTAASASSSRNRPRTQNNDAGEGPSTSSHASDEPENLAQNSSNYFDSSRPSTSGNNIWTNGATVPPEEAFRKVRGGVNALQKHTTQLTNMWVRGNRTTMRELRTMWENLRRRIIMLHRETGRQDLPNYYTRSLLERCMMLTEMTGEASRNATRNYRSQSNMSSYEPRPSTSRAVPEDNRPSLSGRSPSKKTPQRSLSSLLSKRLQAAYCRWRPEDRRRNPISSRMSQRYLHRPRREYTRLIEISATRHEIRMRAMQVLSVMFNMMMLCLEERGLSSLIINMLRTLKKALALTCLMLMTNRYNPRSNNNDSPQRVDSMNVIRLQNVDHTGPVNVDGPDESPHHSISSETEEDRSTTQSVATENPATDDTTPPTAPASQEPTQRWSNRLAVQIAAANRNTSMTARTRRDLYVESKRQKALHRTNPLAHPLIKKKVLPPVSTYRIPSLRLTPRRLSVRNSASRANPANGEPIAGPSGILSGTGTVRGGPSRLPPEMSNEFEHRINLIRMAHMQAVRLRNAARSRFRRLQTIRLYTPSSVREMFTLQPEGDNPHESRPLQNNSEPNRRSLTSYDYRPHILTRERIFSRGAANRPSEDSGQFHAVISNTGMPLMQVSDLSISNQDGQGNQNQRLPRIHEYLQPIILAQNAMVVDEERGEDGPGGPGGSGGATKNVVVQRCRIHNDASIDISKDGRLLVALLPVPRLRNANHWLGVYSLEWSRLGQCLHTAVLEQNAVSVALSPTARHLAVGLGSRRFTSAAHSRNNVFALLYRLDPLENSSRTGLSPIKELEQTWEHGFTSLNCLRWAPQPGQGLVYANNTGQLIIMS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: