MonarchBase - Protein-coding gene

DPOGS206814
Transcript	DPOGS206814-TA	1704 bp
Protein	DPOGS206814-PA	567 aa
Genomic position	DPSCF300001 - 3788497-3799669
RNAseq coverage	237x (Rank: top 43%)

Annotation
*Heliconius*	HMEL017609	2e-52	29.45%
*Bombyx*	BGIBMGA013102-TA	1e-141	48.13%
*Drosophila*	CG4576-PA	2e-31	22.95%
EBI UniRef50	UniRef50_Q16FG4	3e-39	24.16%	Putative uncharacterized protein n=5 Tax=Culicinae RepID=Q16FG4_AEDAE
NCBI RefSeq	XP_001649634.1	3e-41	24.25%	hypothetical protein AaeL_AAEL014801 [Aedes aegypti]
NCBI nr blastp	gi\|157107125	5e-40	24.25%	hypothetical protein AaeL_AAEL014801 [Aedes aegypti]
NCBI nr blastx	gi\|157107125	3e-40	24.08%	hypothetical protein AaeL_AAEL014801 [Aedes aegypti]

Nucleotide sequence:

>DPOGS206814-TA
ATGGTGCCGGTGCTGATGCTAGTACTTGGAGTAGTCGCGGCTACCGACAGAGACTTCACTGATGTAGAGCAACTACGGCTACCACGTCTGTTTCACTTGGATAATTACGAGCGATGCCTGGCGCAGCGCGGTGGACAGTACTGCCTTGGCAGCTTCCGCGTGAGTGCAGACCAGGAAAACCCAAAATATGAATTCATTAAGGAATTCTCCTCCAGTCCACAAAACTTCGACCGCACTCTGCTACATCGCGGGTATTGTGTATCTTCTCGTTGCCCATCGGAAGCTAACATCACGCTTCGGTTTGAGCGCTGCATACAGCAACACGTCCTGCCTCCTGGCTTCACTGCAGCCTTACAAACTTATTCATGCGAAACAAAAAAAGAAGTAGATTTCAAAATGGATATTCCACAGTTTGCGTTTCTGCTTGTGATTGGGATTATTTTATTTTTGAACTTGATGGGCACGCTGTACGATTTGTTAAAAGGAGGAGAAGCAAAGAGCAAGTTACTGATGTCATGGTCATTACGAGTGAATTGGCAACGTCTCACAAGCACTCATGATGATGGAGACCCTCGATTGACAGCTTTAGCGCCCATACAGGGTGTCAGAGTTCTTCTGCTAATACTTGTGATGATGACCCACGCTTCTGAAATACAACATAAGGTCTACCTATATAATCCTGAGTTTTTTGAGAAGGTGCTGACTTACCCCATCACAATGTTAATCAAGAACGGTTCGTCGATAACTCAGATATTCATCGTGTTATCAAACTTTCTTTTCGGGTATAGCCTTTTAATATACTCCAAAAACAAGCAACTAGGGTTATCCCAGCTGCCCGCCTGTATCATGCATCGAATAGCTAGGATAACTCCAATCCATATGTTAGTAGTAGGGTTCGCTGCAACATGGTGGCAAGAGTCGGGTTCTGGACCGCAGTGGGCCGCCACCATCGGCGCAGAAAGCCAAATCTGCCGCAAGAAGTTCTGGACTCATTTTTTCTTCCTTCATAATTTTATATACAAAGACGAACATTGCTTACTCCAAACATGGTTTTTAGCAGTTGATATGCAAGTGTATTTTGTGGCATCAGCACTTATGCTGTATATGATACAGAAAAAGAAGAATCGAATACAGATATTGACCTGCTTATTTATTCTGTCTTGCCTCTTAAATGCAGGACTTGCATATATAAATGACTGGAAGTCGCTTCTATACATCATGTTACCGGAGAACGTGCGCACCACCTTCCACGGAATCCCATCGTTTAGTCAATACTATATCTCTCCCTGGGGAAGCTTGCCATCCTGTTTCATAGGTCTCATCACAGCCTGTGTACACTTCGATATGCAGGAACACGGATACAAGATAGCCAAGCAGAGATGGTTCACGACGCTCTACCACTTATCCATTCCTCTTATCGTGTTGTGTTTGTTGGCTGGAAACGTGATGTTGCGTCACACATCTCGCGGAGCAGTTTCCTCTTTCCTTGCCGCTGAACGACCCACAGTCGCCTTTCTTGCTGCCATATGTATTCTGGGCATTGCCAACAATGTAGATAGCGGCGGACCTGTTATCGACCATATTGTGGACGTACTGCGCTGCGCTACCACTTACTCTTCTGGTGGAAGCGCCCCTGCAGCGAACGTTCAATTCGCTGCTTTCCTAATATCTTACGCTGTGATAATTCACTTGTGGACTGATTAG

Protein sequence:

>DPOGS206814-PA
MVPVLMLVLGVVAATDRDFTDVEQLRLPRLFHLDNYERCLAQRGGQYCLGSFRVSADQENPKYEFIKEFSSSPQNFDRTLLHRGYCVSSRCPSEANITLRFERCIQQHVLPPGFTAALQTYSCETKKEVDFKMDIPQFAFLLVIGIILFLNLMGTLYDLLKGGEAKSKLLMSWSLRVNWQRLTSTHDDGDPRLTALAPIQGVRVLLLILVMMTHASEIQHKVYLYNPEFFEKVLTYPITMLIKNGSSITQIFIVLSNFLFGYSLLIYSKNKQLGLSQLPACIMHRIARITPIHMLVVGFAATWWQESGSGPQWAATIGAESQICRKKFWTHFFFLHNFIYKDEHCLLQTWFLAVDMQVYFVASALMLYMIQKKKNRIQILTCLFILSCLLNAGLAYINDWKSLLYIMLPENVRTTFHGIPSFSQYYISPWGSLPSCFIGLITACVHFDMQEHGYKIAKQRWFTTLYHLSIPLIVLCLLAGNVMLRHTSRGAVSSFLAAERPTVAFLAAICILGIANNVDSGGPVIDHIVDVLRCATTYSSGGSAPAANVQFAAFLISYAVIIHLWTD-

Group
KEGG pathway	dme:Dmel_CG33337	9e-07
	K00680 (E2.3.1.-)	maps->	Benzoate degradation via CoA ligation
			Limonene and pinene degradation
			Ethylbenzene degradation
			Tyrosine metabolism
			1- and 2-Methylnaphthalene degradation
Orthology group	MCL30983		Lepidoptera specific

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: