MonarchBase - Protein-coding gene

DPOGS207224
Transcript	DPOGS207224-TA	1503 bp
Protein	DPOGS207224-PA	500 aa
Genomic position	DPSCF300235 - 406472-415131
RNAseq coverage	285x (Rank: top 39%)

Annotation
*Heliconius*	HMEL012653	3e-90	61.87%
*Bombyx*	BGIBMGA008555-TA	6e-144	56.90%
*Drosophila*	CG9009-PA	7e-89	37.09%
EBI UniRef50	UniRef50_Q9VXZ8	1e-86	37.09%	BcDNA.GH02901 n=12 Tax=Drosophila RepID=Q9VXZ8_DROME
NCBI RefSeq	NP_572988.1	2e-87	37.09%	CG9009 [Drosophila melanogaster]
NCBI nr blastp	gi\|195566786	5e-85	36.69%	GD15826 [Drosophila simulans]
NCBI nr blastx	gi\|270005448	6e-83	38.85%	hypothetical protein TcasGA2_TC007506 [Tribolium castaneum]

Group
Gene Ontology	GO:0008152	3.8e-51	metabolic process
	GO:0003824	3.8e-51	catalytic activity
KEGG pathway	tad:TRIADDRAFT_56202	3e-81
	K01904 (E6.2.1.12)	maps->	Phenylpropanoid biosynthesis
			Phenylalanine metabolism
			Ubiquinone and other terpenoid-quinone biosynthesis
InterPro domain	[263-430] IPR000873	3.8e-51	AMP-dependent synthetase/ligase
Orthology group	MCL25503		Lepidoptera specific

Nucleotide sequence:

>DPOGS207224-TA
ATGGCAACGGTCTTACATCGGAGGGCTCTACGAGTGGTTAATAAAGGAAAACTTTTCTTAGCCACATTATCCCGAGATAACAGCACAGAAAAACATATCTTGAGATCAGACTCTGGTGGTATAGAGAAGCCAAGACAAACTGTCACTGAATTTGTGTGGCAAAACTTAGATAAATGGCCTGACAAAACATTAGCTGTTTGTGCTGTAACTGGCCGCGGTTACACCTACGCTCAAACACATAGATTATCTGTTTCCTTTGCAGCATCATTACTTAAGAAACTCAAACTTCAACACAATGATAAGGTTGCCATTGTCTTACCAAATGTTCCCGAATATCCAGCCATCGCTTTTGGTATTTTGGAGGCTGGCTGTATCGCTAGCATGATGAATCCTGCTTACACAGTTGATGAACTCAAACATCAAATAAAACTCGTCGAGTGTAAGGCAATAGTAGCATCCAAATTATCGTATCCAAATTTGTATAAAGCACTGCAAGAACTAAAAATGAACATACCTGTGATATTAATTGACAATGAAGATCTACCCGAAAATACTATAAAGTTTGCTGAACTCGCTGAAAACACAGACACGGATATATTGAAATCGGTAAAACGAAACATCAAAGACACAGCCATCCTGCCATTTTCCAGTGGAACAACTGGTTTCCCCAAAGCCGTTGAACTGACCCATGAAAGTATATGCGCTCTTAATAGCATGATATTGACTCCAGGAATTATAGCTGTCCAAGAAGCTACAGCGATCTTCCTGGGGAAGCACCCGGCTGTTACACCGCGGCACTTGGACTCCGTCATCGACATTATCTGTGGCGCCGCCTCCCTCTCTAGTGGAGACGCTATGGCTATTATTGAAAAGAATAAGAATTTAATCTTCCGTCAAGGCTATGGCCTTACTGAGACAAACGGTGGCGTGGCCATCGGTTATAACGACAATACAAATCACGATGCTGTAGGATTCCCTTTCCCGAGCAGCGAAATAAAGATAGCTGATCTGAGTACCCAACAAGCTTTAGGACCGGGACAGGAAGGAGAAATTTGGTACAGGGGTCTTAACGTAATGAAGGGTTATTACAAGAATGAAGCAGCGACCAAAGAGGTCCTTACAGAAGACGGCTGGTTCAAAACTGGTGACGTCGGAAAATACGATGAAAACAAATATTTGTATATTACTGACAGAATAAAGGAACTCATTAAGGTTAAAGGCTTCCAAGTGGCACCAGCGGAACTGGAAACGGTTCTTCGTAGTCATCCAAAGATCCTCGATTGTGCTGTTCTTGGTATCCCAGACCCTTTTTCCGGGGAAGTCCCCAAAGCATTCGTCGTCGTCCAACCAGGACAGAACATTAAGGGAGAGGAAGTTCTGGAACACGTTAACAGTAAATTGACACAGTTCAAGAAAATTAAGGAAGTCCAATTCGTTGACGCGATACCCAAAAACCCAGCTGGGAAAATAATGAGGAGACAATTGAAAGAGAAATATTGTTAG

Protein sequence:

>DPOGS207224-PA
MATVLHRRALRVVNKGKLFLATLSRDNSTEKHILRSDSGGIEKPRQTVTEFVWQNLDKWPDKTLAVCAVTGRGYTYAQTHRLSVSFAASLLKKLKLQHNDKVAIVLPNVPEYPAIAFGILEAGCIASMMNPAYTVDELKHQIKLVECKAIVASKLSYPNLYKALQELKMNIPVILIDNEDLPENTIKFAELAENTDTDILKSVKRNIKDTAILPFSSGTTGFPKAVELTHESICALNSMILTPGIIAVQEATAIFLGKHPAVTPRHLDSVIDIICGAASLSSGDAMAIIEKNKNLIFRQGYGLTETNGGVAIGYNDNTNHDAVGFPFPSSEIKIADLSTQQALGPGQEGEIWYRGLNVMKGYYKNEAATKEVLTEDGWFKTGDVGKYDENKYLYITDRIKELIKVKGFQVAPAELETVLRSHPKILDCAVLGIPDPFSGEVPKAFVVVQPGQNIKGEEVLEHVNSKLTQFKKIKEVQFVDAIPKNPAGKIMRRQLKEKYC-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: