MonarchBase - Protein-coding gene

DPOGS203788
Transcript	DPOGS203788-TA	1629 bp
Protein	DPOGS203788-PA	542 aa
Genomic position	DPSCF300010 + 1376480-1380838
RNAseq coverage	23x (Rank: top 78%)

Annotation
*Heliconius*	HMEL002394	0.0	58.68%
*Bombyx*	BGIBMGA003693-TA	6e-164	54.42%
*Drosophila*	CG6178-PA	2e-94	39.84%
EBI UniRef50	UniRef50_G8GE17	3e-165	53.51%	Luciferin 4-monooxygenase n=2 Tax=Obtectomera RepID=G8GE17_BOMMO
NCBI RefSeq	XP_974050.1	2e-106	40.57%	PREDICTED: similar to CG6178 CG6178-PA [Tribolium castaneum]
NCBI nr blastp	gi\|358031578	1e-164	53.51%	luciferin 4-monooxygenase [Bombyx mori]
NCBI nr blastx	gi\|358031578	3e-161	53.51%	luciferin 4-monooxygenase [Bombyx mori]

Group
Gene Ontology	GO:0008152	2.1e-85	metabolic process
	GO:0003824	2.1e-85	catalytic activity
KEGG pathway	ath:AT1G20510	7e-84
	K10526 (OPCL1)	maps->	alpha-Linolenic acid metabolism
InterPro domain	[53-459] IPR000873	2.1e-85	AMP-dependent synthetase/ligase
Orthology group	MCL15406		Insect specific

Nucleotide sequence:

>DPOGS203788-TA
ATGTACTCACAGCGAATTAAAAATGGTATTATATACGGAGATGACAATATTCCGCCTACGCCGAATTTGAATTATGGAGCGGTTGCTTTGGAGAAAATTTTATCACACGATCCGAATGGGGTTGCATTGATTGATGGTGCTAAAGGAGAACAAATAACATTCGGTGAGATGGCACGGAAGATAGTCAATATTGCTTCATCTCTAACAAAGCTGGGTGTGAAGGTCGGTGATGTAGTAGCTATATGTAGTGAGAACAGAATCGAATACCTCATAGCTACTATAGCTGTTTTCTGTTGTGGCGGTGTTGTTACTTTTTACAACCCAGCCTACACTAAAGATGATCTTATCCACGGCCTTAACATTTCTAGACCGAAATATGTTTTCCTTTCGGGAGAAATATATGACACACATTTCGCTACTATGAGGCACGCGAGCATCATCTCTAGATTCATATTATTCGATAAAATAAGATCACTGCACAGTCACGTGCTCTTCAAAGATTTAGAGAATAGTAAAATTGATATAAATAACTATCAACCAGTTAAATTTCAAGGTCAACCCAGAACTGCTATGATACTCTATTCATCAGGAACAACGGGTATGGCCAAAGGAGTTAAACTAACACATTTAAATTTGATTGCAAGCTCCTACCAACTACGACCAATAACAAAAAACACAATAAAATTTATGGTTGCACCATGGTCTAGCACAATGGGAATCTTGTGCAGTCTCCGTGAGATCTTATATGGAAGAACACTTGCGTTTTTGGCAAAGTACGAAGAGGATTTATTCCTCCAAACTATACAAAAGTATAAGGTCGGAGTTCTTATTATTGCACCACCCCTCATCGTAATGTTAACTAAATCGGAATTAGCTAATAAATACGATATAAGTTCAGTTGAGTTTATATACTCAGGAGGTGCACCAATCGACAAAGAGTCTATAGAAAAAGTTAAGCAAAGGTATTCAAATATTAAACACGTCCTGCAAGGCTACGGGATGACAGAAGCGACAGGTGCTATAACGGACGACTTAGAAATCGCACCAAAGGAAGGCAGCGTCGGAAGGGCTGCACTGGGAATAATAATTAAGATATCTGATCCTTTTACCAATAAGACACTTGGACCTGGCGAACCAGGCGAAGTCCGTATTAAAGGTTTAACTTTATTTGAAGGTTACGTCAGAAAAGATATGAAAAATGAATTTGACGAGGAAGGTTTTTACAAAACAGGTGATATAGCGTATTACGACGAAGATGGCTACTTCTTTATTGTGGATAGAATAAAAGAACTTATCAAATACAAGGCATGGCAAGTCGCACCCTCAGAACTTGAAGGTCTGATACTGAAGCACCCGGCCGTTAAAGATGTTGGTGTTACTGGCGTTCCCGACGAACTTGCCGGGGAACTACCTACGGCCTTTGTGGTGAAGCAACCAAACTCCACAGTCACGGAACAAGATATTATCAAACACGTAGCAAATAAGGTCGCTCCATGGAAGAGACTGCGAGGAGGTGTAATATTTCTAAATGAGATACCAAAAACTCCGAGCGGCAAAATTCTGAGACGAAAACTACTATCGCTGCTGCCGAAGCGAAGCCCACTAAAGCTACCTGCCAGCAAATTGTGA

Protein sequence:

>DPOGS203788-PA
MYSQRIKNGIIYGDDNIPPTPNLNYGAVALEKILSHDPNGVALIDGAKGEQITFGEMARKIVNIASSLTKLGVKVGDVVAICSENRIEYLIATIAVFCCGGVVTFYNPAYTKDDLIHGLNISRPKYVFLSGEIYDTHFATMRHASIISRFILFDKIRSLHSHVLFKDLENSKIDINNYQPVKFQGQPRTAMILYSSGTTGMAKGVKLTHLNLIASSYQLRPITKNTIKFMVAPWSSTMGILCSLREILYGRTLAFLAKYEEDLFLQTIQKYKVGVLIIAPPLIVMLTKSELANKYDISSVEFIYSGGAPIDKESIEKVKQRYSNIKHVLQGYGMTEATGAITDDLEIAPKEGSVGRAALGIIIKISDPFTNKTLGPGEPGEVRIKGLTLFEGYVRKDMKNEFDEEGFYKTGDIAYYDEDGYFFIVDRIKELIKYKAWQVAPSELEGLILKHPAVKDVGVTGVPDELAGELPTAFVVKQPNSTVTEQDIIKHVANKVAPWKRLRGGVIFLNEIPKTPSGKILRRKLLSLLPKRSPLKLPASKL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: