MonarchBase - Protein-coding gene

DPOGS215781
Transcript	DPOGS215781-TA	834 bp
Protein	DPOGS215781-PA	277 aa
Genomic position	DPSCF300041 + 1856640-1858096
RNAseq coverage	418x (Rank: top 29%)

Annotation
*Heliconius*	HMEL006535	4e-116	69.68%
*Bombyx*	BGIBMGA003658-TA	1e-105	64.62%
*Drosophila*	CG3609-PB	2e-58	42.55%
EBI UniRef50	UniRef50_D6W763	1e-56	43.17%	Putative uncharacterized protein (Fragment) n=3 Tax=Tribolium castaneum RepID=D6W763_TRICA
NCBI RefSeq	XP_320004.4	2e-59	43.49%	AGAP009225-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|158299992	3e-58	43.49%	AGAP009225-PA [Anopheles gambiae str. PEST]
NCBI nr blastx	gi\|158299992	6e-56	43.35%	AGAP009225-PA [Anopheles gambiae str. PEST]

Group
Gene Ontology	GO:0005488	9.1e-24	binding
	GO:0016491	2.6e-11	oxidoreductase activity
	GO:0008152	4e-08	metabolic process
	GO:0055114	4e-08	oxidation-reduction process
KEGG pathway	xla:444539	2e-51
	K00078 (DHDH)	maps->	Pentose and glucuronate interconversions
			Metabolism of xenobiotics by cytochrome P450
InterPro domain	[4-85] IPR016040	9.1e-24	NAD(P)-binding domain
	[5-60] IPR000683	2.6e-11	Oxidoreductase, N-terminal
	[77-165] IPR004104	4e-08	Oxidoreductase, C-terminal
Orthology group	MCL11088		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS215781-TA
ATGGCAATAAGCAATGATATTGATGTGGCTTACATTGGAGCACTCAATCACGACCACTACGCACTATCGAAATTATTCCTTGAATCTGGCAAACATGTGTTATGTGAAAAGCCGTTTTGTCTAAATGCCAAACAAGTGGAAAGCTTGGTGAAAATTGCTAAAAACCAAAACCTTTTCTTAATGGAGGCCCTATGGTCTCGTTTTGCACCATTTTACGTTAATTTGGAAGAACAACTAGAATCAGGAATTATCGGTCGACCTCAATTTGTAGAAGTAAATTTTGGATTGCCGATTGAGAACGTGGAGAGGCTAAGAAAAAGGGATATGGGAGGCGGCGCGCTGATGGACATTGGTATTTATACAGTACATTTTGCACAACTGGTGTTCAAAGAGGATCCTATCAAGATAACAGCAGTTGGTGAATTAAATGATGATGGGGTGGATTGTGTGGAAACCGTTATCTTGGAATATTCTGAAGGAAGACGGGCTGTTTTAAACAATCACGCCAAAGTAAAACTCTGGAACAAAGCTACTGTTGTAGGCGACTACGGAAAAAGAATAACATTTGAGGATCCTTTCAACATGCCAGACACTATGATCCACGCTGATGGTCGCGTCGAAAAATTTGAGTTCCATCCTTCGAAGATTCCCTATAATTTCATGAACAGCGCCGGTTTGGTCTACGAAGCTTTGGAAACGGTTCGTTGCATTAAGGAAGGCTTAAAGGAGTCACCAATCATGAGTCACAGTAGAAGTCTCCTATTGATTAAAATCTTGGATACTGTGCGAAAACAACTCGGCGTACATTATGATGTTGATGATCAAGATTTTTAA

Protein sequence:

>DPOGS215781-PA
MAISNDIDVAYIGALNHDHYALSKLFLESGKHVLCEKPFCLNAKQVESLVKIAKNQNLFLMEALWSRFAPFYVNLEEQLESGIIGRPQFVEVNFGLPIENVERLRKRDMGGGALMDIGIYTVHFAQLVFKEDPIKITAVGELNDDGVDCVETVILEYSEGRRAVLNNHAKVKLWNKATVVGDYGKRITFEDPFNMPDTMIHADGRVEKFEFHPSKIPYNFMNSAGLVYEALETVRCIKEGLKESPIMSHSRSLLLIKILDTVRKQLGVHYDVDDQDF-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: