MonarchBase - Protein-coding gene

DPOGS206692
Transcript	DPOGS206692-TA	1761 bp
Protein	DPOGS206692-PA	586 aa
Genomic position	DPSCF300048 + 1297408-1303149
RNAseq coverage	2334x (Rank: top 5%)

Annotation
*Heliconius*	HMEL008837	0.0	72.20%
*Bombyx*	BGIBMGA008524-TA	0.0	77.99%
*Drosophila*	CG9009-PA	2e-104	39.93%
EBI UniRef50	UniRef50_Q7PGI2	2e-180	53.75%	AGAP002503-PA n=9 Tax=Endopterygota RepID=Q7PGI2_ANOGA
NCBI RefSeq	XP_966640.1	0.0	59.10%	PREDICTED: similar to AMP dependent coa ligase [Tribolium castaneum]
NCBI nr blastp	gi\|91081615	0.0	59.10%	PREDICTED: similar to AMP dependent coa ligase [Tribolium castaneum]
NCBI nr blastx	gi\|91081615	0.0	59.10%	PREDICTED: similar to AMP dependent coa ligase [Tribolium castaneum]

Group
Gene Ontology	GO:0008152	1.8e-101	metabolic process
	GO:0003824	1.8e-101	catalytic activity
KEGG pathway	spu:581911	5e-100
	K01904 (E6.2.1.12)	maps->	Phenylpropanoid biosynthesis
			Phenylalanine metabolism
			Ubiquinone and other terpenoid-quinone biosynthesis
InterPro domain	[99-513] IPR000873	1.8e-101	AMP-dependent synthetase/ligase
Orthology group	MCL18872		Insect specific

Nucleotide sequence:

>DPOGS206692-TA
ATGTCTCATTTGAAAATATTACGCGGGAATTTAGCTCATAGAATTCTAAGTAATTTAACTCCTAAAACAAAATGTAAAAAAATTAGACAATTTCACGTATCTAACCGTAATTCAGCAATTAAAACAGCGACGGTGGTTGAGCATAATGTTTTAAGTTCGCCGTGGGGTGAAATTACTATAGGAAACGAGACTTTAACTCAACACGTATTTCAAGATGTCGAAAAATGGTCGGACGCTCCCTGTGTGACATGCGGCGCATCAGGTCGTTCATACGACTACGGCATGATGAGGATGATGATTGATAGATGTGCGAACGCTCTCGCCGGACATTTGAAACTCGCGCCGGGCGAGAGAGTAGGTCTCATACTACCGAATCTACCTGAATTCGTAGTGCTTATACATGGTGCTATGCAGGCTGGCCTCGTAGTTACATTCGCCAATCCCCTGTATACAGCTGATGAGGTCGGACGCCAATTTTCTGATTGTGGTGTTAAAGCTATTGCTACAATTGAAATGTTCATGCCGGTTGCTGAAAAAGTCAGCAAAATGTTAAAAGACTACAAGGGTACCATCTGGGTGGGTGGTGATGACGATAAAGCAAAAGGTATATACGGTCTGAAGTCCTTACTAATGGCTGATCATAAAGCCGACCTGCCGACATTGAATTGTGATGACGTGTGTTTGGTCCCGTACTCCAGCGGCACAACGGGTCTACCGAAAGGCGTCATGTTAACACACAAGAACTTGGTCTGCAATCTCAAGCAGGTCCAAGTGCCCAAGATGATGAAGTATGAAGGAGAGAAAGGTAAAGGAGACGTAATTCTAACTGTTCCGCCGTTTTTCCATATCTATGGCTTCAACGGGATACTGAACTACAATCTCATCTTAGGGTACCATTTAGTGTCTATCCCAAAATTCACTCCAGAGGATTATATCAACTGTCTGGTAGAATATCAGCCGACTACGTTGTTCGTGGTGCCGTCGTTGCTAGCTTTCTTGGCGACTCATCCCTCTGTGAAGAAGGAACATCTTCAGTCCGTGGAGACCATTATGGTCGGAGCCGCGCCCACTACTGACAGCATGTTAGAGAAGTTCCTCATCAAGTGTGAGAAGAGCAAGGACCAGATCAAGTTGCTTCAAGGTTATGGTATGACGGAGAGTTCTCCCGTGACGCTGATGACTCCATACTCGTACCCGTACAGTAAGGTGGGCTCTGTGGGTCAGCTGGTGCCGTCTACTCAGGCCAGGGTGACGTCACTGACTGACGGCACACCCCTCGGACCACACCACAGCGGGGAGCTGCTTCTGAGGGGACCGCAGGTAATGAAAGGTTACTGGAATAATGAGAAGGCGACGGCAGAAACGGTTGATAGTGAGGGCTGGCTGCATACAGGAGACGTGGCCTATTACGACGAGGACGGGTACTTCTATATAGTTGACAGAACCAAAGAGCTCATTAAAGTTAAAGGCAATCAGGTGTCACCAACAGAAATAGAGAGTATAATTATGGAAATACCTGAAATCGCGGATGTTGCGGTCGTGGGAATCCCCGATGCGTTAGCCGGGGAAGTACCACGAGCCTTCGTCGTTCTGAAACCAGGAAGTAAATTAACAGAAAAAAATATTTACGATGTCGTAGCAGAGAAACTCACCAAATATAAGCATCTCGAAGGAGGTGTTGTATTCGTAGAGGCTATTCCAAGAAATGTAGCTGGTAAAATATTGCGTAATGAACTTAAAGTATTAGGAAGGAAGAAGTGA

Protein sequence:

>DPOGS206692-PA
MSHLKILRGNLAHRILSNLTPKTKCKKIRQFHVSNRNSAIKTATVVEHNVLSSPWGEITIGNETLTQHVFQDVEKWSDAPCVTCGASGRSYDYGMMRMMIDRCANALAGHLKLAPGERVGLILPNLPEFVVLIHGAMQAGLVVTFANPLYTADEVGRQFSDCGVKAIATIEMFMPVAEKVSKMLKDYKGTIWVGGDDDKAKGIYGLKSLLMADHKADLPTLNCDDVCLVPYSSGTTGLPKGVMLTHKNLVCNLKQVQVPKMMKYEGEKGKGDVILTVPPFFHIYGFNGILNYNLILGYHLVSIPKFTPEDYINCLVEYQPTTLFVVPSLLAFLATHPSVKKEHLQSVETIMVGAAPTTDSMLEKFLIKCEKSKDQIKLLQGYGMTESSPVTLMTPYSYPYSKVGSVGQLVPSTQARVTSLTDGTPLGPHHSGELLLRGPQVMKGYWNNEKATAETVDSEGWLHTGDVAYYDEDGYFYIVDRTKELIKVKGNQVSPTEIESIIMEIPEIADVAVVGIPDALAGEVPRAFVVLKPGSKLTEKNIYDVVAEKLTKYKHLEGGVVFVEAIPRNVAGKILRNELKVLGRKK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: