MonarchBase - Protein-coding gene

DPOGS202321
Transcript	DPOGS202321-TA	1704 bp
Protein	DPOGS202321-PA	567 aa
Genomic position	DPSCF300032 + 493508-498803
RNAseq coverage	268x (Rank: top 40%)

Annotation
*Heliconius*	HMEL005604	2e-150	57.53%
*Bombyx*	BGIBMGA003693-TA	3e-125	43.33%
*Drosophila*	CG6178-PA	4e-126	44.97%
EBI UniRef50	UniRef50_E0VSL5	1e-125	42.78%	Luciferase, putative n=1 Tax=Pediculus humanus corporis RepID=E0VSL5_PEDHC
NCBI RefSeq	XP_001604903.1	3e-128	45.01%	PREDICTED: similar to CG6178-PA [Nasonia vitripennis]
NCBI nr blastp	gi\|156551201	6e-127	45.01%	PREDICTED: luciferin 4-monooxygenase-like [Nasonia vitripennis]
NCBI nr blastx	gi\|156551201	3e-124	44.35%	PREDICTED: luciferin 4-monooxygenase-like [Nasonia vitripennis]

Group
Gene Ontology	GO:0008152	7.8e-91	metabolic process
	GO:0003824	7.8e-91	catalytic activity
KEGG pathway	tad:TRIADDRAFT_56202	9e-110
	K01904 (E6.2.1.12)	maps->	Phenylpropanoid biosynthesis
			Phenylalanine metabolism
			Ubiquinone and other terpenoid-quinone biosynthesis
InterPro domain	[51-444] IPR000873	7.8e-91	AMP-dependent synthetase/ligase
Orthology group	MCL14712		Insect specific

Nucleotide sequence:

>DPOGS202321-TA
ATGGCTGTGTCGATTCATAACAATGTGGTCTCAGGTCCTGAGGAAAGACCTATACCTGCCCATTTATCCTATGGTCAATTTTTGTTTGATAAATTAAAGGCGGGGGGAAATAAAATCGCGCAAATAAGTGCGGAGACTGGAGAATCTGTTACTTATCAAAATATTCTCCAGAATAGTGTTAATCTGGCAGTGGCTCTACAGGAGTTGGGCTTACAGAAGGGTGATGTAGTTTCGCTCAGTTGTGAAAATCGTTTTGAATTCACCGTTGCCTCTTTAGCCGTAATCTTTGCTGGAGGAGTTTTATCAACTCTAAATGTTACTTATTCGCCAGGTGAAATTTCCCATGTATTCCAAATCACAAAGCCCAAGTTTATATTCACGTCGCCGATCACTGCACAGAACATGTATGACTGCAGCAAGGATCTGACATTTGTGAAGAATTTGATTTTGTTCGGTGAATATGACATTGTACCCGCCGTGTTCTACAATGATTTAGTCAAGAAACACTGTGATATAGATGATTTCGCATTGGTCGATGTGAATGGAGCAGAGGATACTGTGGCCGTAATGTGTTCATCGGGAACGACTGGCTTACCAAAGGGTGTTATGTTAACCCATGTAAATTTCCTCACACTATCCGCTCATATGAAATATTATTTGGAGACGTCTCAACAGAAAAGGAAACATAATGTAATAACAGCCCTGTCTTTGATCCCTTGGTTTCATGCTTATGGATTCATTACAACATTAGCCGTGATGTGCCTACACGTAGAGGTTGTGTTTCTTGTTAGATTCGAAGAGGAACAATTTCTTGAAACGATACAAAAATATAAGATAAACATGACGACAATAGTGCCACCGCTCGCTGTTTTCCTTGCCAAACATCCGTTGGTCTCCAAGTATGACCTGAGCTCATTGAACGAAATGTGGTGCGGAGCCGCTCCCCTGTCCAAGGAAATACAGACGCTTGTCACTAAACGAACTGGTATTGATTTCATCAAGCAAGGTTACGGCCTGACAGAAGTCACAATGGCATGTTGTGTGGATTTAGTCGGCAGAAGCAAAGCAGGCTCCTGCGGTACACCTGCGCCTGGCATGAAGATCAAGGTGATAGATACTGAGAGTGGTAAGAAATTAGGTCCCAATGAAGAGGGTGAGCTGTGCATTAAGTCGCCTCTCCGCATGAAGGGATATTTGGGTGATAAAGCATCCGGTGATGCCATGATTGATGAGGAAGGTTATGTTAAGACGGGAGATATTGGGTACTATGACAAGGAAGGATACTTCTACATTGTTGATAGACTCAAAGAACTCATCAAATATAAAGGTTTCCAGAGCAACAAGGAAGGATACTTCTACATTGTTGATAGACTCAAAGAACTCATCAAATATAAAGGTTTCCAGGTTGCTCCAGCTGAGTTGGAATCTTTACTGCTGCAGCACAGTGCAGTGGCGGATTGCGGTGTTGTTGGCAGACCTGATGAATTGGCGGGTGAACTACCGGTAGCGTTTGTAGTCAAACAGCCGGAAGCCAATATACAGGAACAGGAAATTATTGACTACGTAGCCAAGAAGGTGTCGCCAGCCAAACGTCTACGAGGTGGCGTTATATTTGTTGACGAAATACCAAAGAATCAATCAGGTAAAATTCTGAGAAGGGAGCTAAGGAAAATGTTGTCCGCCAACATTAAAAGCAAGCTATAA

Protein sequence:

>DPOGS202321-PA
MAVSIHNNVVSGPEERPIPAHLSYGQFLFDKLKAGGNKIAQISAETGESVTYQNILQNSVNLAVALQELGLQKGDVVSLSCENRFEFTVASLAVIFAGGVLSTLNVTYSPGEISHVFQITKPKFIFTSPITAQNMYDCSKDLTFVKNLILFGEYDIVPAVFYNDLVKKHCDIDDFALVDVNGAEDTVAVMCSSGTTGLPKGVMLTHVNFLTLSAHMKYYLETSQQKRKHNVITALSLIPWFHAYGFITTLAVMCLHVEVVFLVRFEEEQFLETIQKYKINMTTIVPPLAVFLAKHPLVSKYDLSSLNEMWCGAAPLSKEIQTLVTKRTGIDFIKQGYGLTEVTMACCVDLVGRSKAGSCGTPAPGMKIKVIDTESGKKLGPNEEGELCIKSPLRMKGYLGDKASGDAMIDEEGYVKTGDIGYYDKEGYFYIVDRLKELIKYKGFQSNKEGYFYIVDRLKELIKYKGFQVAPAELESLLLQHSAVADCGVVGRPDELAGELPVAFVVKQPEANIQEQEIIDYVAKKVSPAKRLRGGVIFVDEIPKNQSGKILRRELRKMLSANIKSKL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: