MonarchBase - Protein-coding gene

DPOGS215883
Transcript	DPOGS215883-TA	3087 bp
Protein	DPOGS215883-PA	1028 aa
Genomic position	DPSCF300029 - 186126-316728
RNAseq coverage	60x (Rank: top 68%)

Annotation
*Heliconius*	HMEL020733	1e-97	86.60%
*Bombyx*	BGIBMGA000439-TA	4e-115	95.13%
*Drosophila*	CG33253-PA	3e-98	67.52%
EBI UniRef50	UniRef50_E3X2Y4	6e-103	72.56%	Putative uncharacterized protein n=2 Tax=Anopheles darlingi RepID=E3X2Y4_ANODA
NCBI RefSeq	XP_001661914.1	2e-105	72.08%	prohibitin, putative [Aedes aegypti]
NCBI nr blastp	gi\|157130555	5e-104	72.08%	prohibitin, putative [Aedes aegypti]
NCBI nr blastx	gi\|91085193	2e-104	76.77%	PREDICTED: similar to AGAP003352-PA [Tribolium castaneum]

Group
Gene Ontology	GO:0016020	4.5e-165	membrane
KEGG pathway	dpo:Dpse_GA14145	3e-22
	K03364 (CDH1)	maps->	Ubiquitin mediated proteolysis
			Cell cycle - yeast
			Progesterone-mediated oocyte maturation
			Cell cycle
InterPro domain	[364-625] IPR001972	4.5e-165	Stomatin
	[397-556] IPR001107	3e-60	Band 7 protein
Orthology group	MCL16363		Insect specific

Nucleotide sequence:

>DPOGS215883-TA
ATGCTGTCAAAGGTTCTTACGTTAGTAGCACTACTGGGTGCAGCAAGTGCTCAACATTATTCTCACGGACAAGCCACTTCATCCCAGTCCATCATTCGTCATGATAACCAACACGGATACAACCACGTTCAACCTATCGCCGTCCATTCAGCTCCTATCTCATACCATCAGCCTGCTATAGCTGTTCACGCTGCCCCAGTCGCCAGTCACGTCAGTGTTCAACACGCTACTCCAGTCATTCAACATGTTGCTCCAGTCATTCAACACGTGGCTCCCATAAGACACGTAGCTCCCATTGCTCATGTAGCTCCCGTGGCTTACCATGCAGCACCAGCTTACGCTCAAGAACACCAAGAATATTATTCCATCATTCGTCATGATAACCAACACGGATACAACCACATTCAACCTATCGCCGTCCACTCAGCTCCAATCTCATACCATCAACCTGCTATAGCTGTTCACGCTGCCCCAGTCTCTAGTCACGTCAGTGTTCAACACGCTGCTCCAGTCATTCAACATGTTGCTCCAGTCATTCAACACGTCGCTCCCATAAGACACGTAGCTCCCATTGCTCATGTAGCTCCCGTGGCTTACCATGCAGCACCAGTTCATGCTCAAGGACACCAAGAATATTACTCCATCATTCGTCATGATAACCAACACGGATACAACCACATTCAACCTATCGCCGTCCACTCAGCTCCAATCTCATACCATCAACCTGCTATAGCTGTTCACGCTGCCCCAGTCTCTAGTCACGTCAGTGTTCAACACGCTGCTCCAGTCATTCAACATGTTGCTCCAGTCATTCAACACGTCGCTCCCATAAGACACGTAGCTCCCATTGCTCATGTAGCTCCCGTGGCTTACCATGCAGCACCAGTTCATGCTCAAGGACACCAAGAATATTACGTAAGCCAATTCAACGCTCAAGTAGAAAATTCAGCTCCTTCAACCCATGTCCAGCCTCAACCTCACCTGGCGCCTTTATTATCTAAACATCCTCGTATATTGATAGGAAACGTTTCCAAGTGTGAAGCCATCAAATTGGAACATCAGCGTCCAGTGTGCGGTTGTCCGTTCGTCGATATGGAAACAAACCCAGAAGCTGTGGGATGTGTGGAGAGATTTGCAACATTTCTGTCATTTCTTCTTGTCATTATCACTTTCCCGTTTTCGTTATTCGAATGTTTTAAGGTCGTCCAAGAGTTTGAACGCGCTGTGATTTTTCGTCTCGGTCGAGTTAGAAAAGGCGGTGCAAGAGGACCCGGTTTATTTTTTGTACTACCATGTATTGATACATACAGGAAGGTAGACTTAAGGACCGTGTCATTTGATGTACCGCCTCAAGAGGTATTAACCAGAGATTCAGTGACCGTTGCTGTGGATGCAGTAGTTTATTACAGGATAAAAGAACCTCTTAATGCTGTAGTTCGGGTAGCTGACTACAGTGCATCAACCCGTTTGCTCGCCGCCACTACATTAAGAAATGTGCTGGGTATGCGTGACCTGGCTCAGCTATTGTCTGACCGAGAAGCTATCAGTCATATGATGCAAGCCAATTTGGATGTAGCAACGGATCCTTGGGGAGTAGAAGTAGAGAGAGTGGAGATTAAGGACGTTCGCTTACCAGTACAGTTACAAAGAGCAATGGCAGCTGAAGCTGAAGCTGATCGCGAAGCTCGTGCTAAAATCATAGCCGCAGAGGGAGAGATCAAGGCGTCAATTGCCTTGAAGGAAGCCTCGTTAGTTATGATTGACAATCCTATGGCGCTACAATTGCGTTACCTCCAGTCATTAAACACGATATCAGCTGAGAAGAATTCAACTATAATATTTCCTTTTCCAATGGATTTCCTTAAAACTTTTATGCCGTGTCCTGACGAAGAAAAGGAGCCACTAGCTGAAAAGATTTTTCTCATAATAGCTATATTAATGGTTATATTATTTCCTCCTTCCTTGATTTGTTGTTTTAGGGTTGTAAATCAGTACAAAAGAGCAGTTATTTTACGTTTTGGACGAGTTCGTCGCGATTCACCCGCCGGGCCTGGTATCATTTGGGTGGTTCCGTGCACTGATATAGTTTCACTCATCGACATCAGAACCCAATCTTTCAACTTACTGCCTCAAGAGGTACTAACAAAAGACTCTGTTACTGTCACAGTCGACGCCGTGGTATATTTTCATGTTATAAATCCATTGAACTGCTTGCTCAACGTCCATTCACACAAGCGTGCAACCGAATTGCTCGCTATAGCAATTTTAAGAAATATTTTGGGACAATATACACTGACAGATCTGCTTACAAATCGTGTAGCGATCAGTCAAGCGGTTAGTGAAGAAATTGATAAAGGAACAGCTGAGTGGGGCGTTCAAGTGGAACGCGTGGAAATAAAAAATGTGGTTCTGCCGTACGAACTGCAAAAGGCAATGGCAGCAGAGGCTGAAGGAACTCGAATAGCAAAAGCTAAGATTATAGAAGCAGAAGGTGAAATCAAAGCTGCAGAAAACCTTAGAGACGCGGCCAAAATTATGATGGAGAAACCAAAAACTATACTAGCATTAACTAAAGACTCACTGACTGTTTCTGTTGACGCTGTTGTTTTTTACAAAATAGTTGATCCCGTGCTTGCCGTAATTGGGGTAACCGACTACAAAGTATCCACACACTTTCTAGCTGCCACAACATTACGTAATGCCCTTGGAACGAGAAAACTCGCGGAATTGTTGGCAAGCCGTCCTGATGTCAGTCAGCAAGTATTCAATCTAATGAAGAATATTACGGTAGCCTGGGGAATCAAAATCGTTAGAGTAGAGATAAAAGACATAAGTCTACCGCTGCAATTGCAAAAAGCGATGGCGGCTGAAGCTGAGTCGACGAGATTGGCAAATGCTAAAATAATTGTTGCAAAATCAGAAATCGAAGCAACCAAAAGCCTTCAACTAGCTACAGACATTTTAATGGATAATCCAATGTGCATGCAACTCAGATATTTGCAATCGCTCAACATGATCGCCGGTGAGAAAACACATACAATTGTGTTCCCGTTTTCTGTTGACGTTATTAATAAAATAACAAGTTAA

Protein sequence:

>DPOGS215883-PA
MLSKVLTLVALLGAASAQHYSHGQATSSQSIIRHDNQHGYNHVQPIAVHSAPISYHQPAIAVHAAPVASHVSVQHATPVIQHVAPVIQHVAPIRHVAPIAHVAPVAYHAAPAYAQEHQEYYSIIRHDNQHGYNHIQPIAVHSAPISYHQPAIAVHAAPVSSHVSVQHAAPVIQHVAPVIQHVAPIRHVAPIAHVAPVAYHAAPVHAQGHQEYYSIIRHDNQHGYNHIQPIAVHSAPISYHQPAIAVHAAPVSSHVSVQHAAPVIQHVAPVIQHVAPIRHVAPIAHVAPVAYHAAPVHAQGHQEYYVSQFNAQVENSAPSTHVQPQPHLAPLLSKHPRILIGNVSKCEAIKLEHQRPVCGCPFVDMETNPEAVGCVERFATFLSFLLVIITFPFSLFECFKVVQEFERAVIFRLGRVRKGGARGPGLFFVLPCIDTYRKVDLRTVSFDVPPQEVLTRDSVTVAVDAVVYYRIKEPLNAVVRVADYSASTRLLAATTLRNVLGMRDLAQLLSDREAISHMMQANLDVATDPWGVEVERVEIKDVRLPVQLQRAMAAEAEADREARAKIIAAEGEIKASIALKEASLVMIDNPMALQLRYLQSLNTISAEKNSTIIFPFPMDFLKTFMPCPDEEKEPLAEKIFLIIAILMVILFPPSLICCFRVVNQYKRAVILRFGRVRRDSPAGPGIIWVVPCTDIVSLIDIRTQSFNLLPQEVLTKDSVTVTVDAVVYFHVINPLNCLLNVHSHKRATELLAIAILRNILGQYTLTDLLTNRVAISQAVSEEIDKGTAEWGVQVERVEIKNVVLPYELQKAMAAEAEGTRIAKAKIIEAEGEIKAAENLRDAAKIMMEKPKTILALTKDSLTVSVDAVVFYKIVDPVLAVIGVTDYKVSTHFLAATTLRNALGTRKLAELLASRPDVSQQVFNLMKNITVAWGIKIVRVEIKDISLPLQLQKAMAAEAESTRLANAKIIVAKSEIEATKSLQLATDILMDNPMCMQLRYLQSLNMIAGEKTHTIVFPFSVDVINKITS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: