MonarchBase - Protein-coding gene

DPOGS215408
Transcript	DPOGS215408-TA	1380 bp
Protein	DPOGS215408-PA	459 aa
Genomic position	DPSCF300088 + 464560-467391
RNAseq coverage	166x (Rank: top 51%)

Annotation
*Heliconius*	HMEL017420	9e-98	43.79%
*Bombyx*	BGIBMGA012366-TA	4e-74	37.70%
*Drosophila*	CG1105-PA	6e-42	29.37%
EBI UniRef50	UniRef50_Q9VI53	9e-40	29.37%	CG1105 n=12 Tax=Diptera RepID=Q9VI53_DROME
NCBI RefSeq	XP_001994718.1	7e-41	30.86%	GH17389 [Drosophila grimshawi]
NCBI nr blastp	gi\|195055634	1e-39	30.86%	GH17389 [Drosophila grimshawi]
NCBI nr blastx	gi\|158301492	2e-40	28.07%	AGAP001894-PA [Anopheles gambiae str. PEST]

Group
KEGG pathway
InterPro domain	[17-162] IPR011021	1.1e-26	Arrestin-like, N-terminal
	[16-162] IPR014756	1.9e-21	Immunoglobulin E-set
	[190-317] IPR011022	6.5e-13	Arrestin-like, C-terminal
Orthology group	MCL25955		Lepidoptera specific

Nucleotide sequence:

>DPOGS215408-TA
ATGACCGCTGTCATGGGAACACAACGCGAAGAACTGCAGAGCGCAATTATAACATTAAACGAACCGAACGCTGTGTATTATTCTGGACAACTTATCAAAGGCAACTTGAATTTTGAACTGAATAAACCTCTTCATTATATTGCTATAAACATACAATATGTTGGGGAGTGTAATGTTTTCTGGATAGAGGAACAGATCGAAGTATATAATGGAGTGAAACAAAAGAAACACATAAAGTATGAGGGACGTGAGGAGTACTTTAACGTCATCCACTGTCTGAGCGGGGGGGATGGTGGTACATGTGTTCTGGCCACGGGACCACATTCGATCCCATTCTCCTATCAGCTACCATCCAACATTCCATCATCTTTTAAGGGTGATAAAGGGACCATCAGCTACAGTATTGTCGTTAGAGTGCTAATGACGGGATTCACTAACCAAGAGACCACCAAGGACTTTGATGTCGTATCACCCGCAGACTTGAATCAGGGCGGTGATAATATTAAGAAGCCAGTCATCCTGAATTTTGAAGAAACATCGAGTTGCAACCTTTTCTGTGTGACTAGGCCCTTGTCCGTGGAAGTGAAGCTGCCAGCATCCGGCTTCTGTCCCGGGCAGACGATACCCATCACAGTAGATATCAAGAATAAAACAAACTTGGAACTTTCTAAGATTGTCTTTGAAATATCTACAAAAGAGCGATATCGCAGCCTCCAACCGGTGTCAGCGTTCATACCTCCTGAGGACGTGTTAGTGTCTATTAAAAAAGGTCCCGTCCTAGCTAAAACCTGCAAAGAATATATGTGGGAGTTGAAAATACCAGAATTCATAGCTCCCAATTTAGAGAATTGCAGTATTATTGATGTGGGCTTCTTCTTCAAGGTAAAAATAAAGATGTCAGGTTGTATGGATGACATGTACGACGAGGCCGAGATCTGGTTGGGTCTGGTACCGTTGGGATCGTCCGGCGTGTCCTCCCACCCCCTGGCCGAGCGGCTGCCCATCGCAGCCATACCCCCCGCCACCCCTCCTCCGCCGTACGAATCACCACAGATGCCGCCACCGTACATACCAAATGTCCCGAACGTCCAGATCTGTCCCCCCGGACCCGTCCTCTTCCCTACTGTAGCCAACGTCGTAGATAAAAGCCTCGCTTACGGCTCAAAGAGCAGTCCTTTGGGTGCCTTCGAGATCGGCTTCCGACCCCCGGGAAATTCCTCGATGCCCGTTCCCAATCATCCATATCCGGATTTCGAAGATCAAATACATCAGAGGCCAGACTTACATCCATACCCTGAACCTGCGGCTTCTGAACCCTACTCCGGCCGCCCCTCCGCTCCACCGCCCCCCCTAAAACCTCATAGCCTATTAATATATTAA

Protein sequence:

>DPOGS215408-PA
MTAVMGTQREELQSAIITLNEPNAVYYSGQLIKGNLNFELNKPLHYIAINIQYVGECNVFWIEEQIEVYNGVKQKKHIKYEGREEYFNVIHCLSGGDGGTCVLATGPHSIPFSYQLPSNIPSSFKGDKGTISYSIVVRVLMTGFTNQETTKDFDVVSPADLNQGGDNIKKPVILNFEETSSCNLFCVTRPLSVEVKLPASGFCPGQTIPITVDIKNKTNLELSKIVFEISTKERYRSLQPVSAFIPPEDVLVSIKKGPVLAKTCKEYMWELKIPEFIAPNLENCSIIDVGFFFKVKIKMSGCMDDMYDEAEIWLGLVPLGSSGVSSHPLAERLPIAAIPPATPPPPYESPQMPPPYIPNVPNVQICPPGPVLFPTVANVVDKSLAYGSKSSPLGAFEIGFRPPGNSSMPVPNHPYPDFEDQIHQRPDLHPYPEPAASEPYSGRPSAPPPPLKPHSLLIY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: