MonarchBase - Protein-coding gene

DPOGS209267
Transcript	DPOGS209267-TA	909 bp
Protein	DPOGS209267-PA	302 aa
Genomic position	DPSCF300111 + 602248-604745
RNAseq coverage	197x (Rank: top 47%)

Annotation
*Heliconius*	HMEL008265	2e-108	61.13%
*Bombyx*	BGIBMGA007047-TA	1e-106	57.10%
*Drosophila*	sro-PA	7e-60	41.45%
EBI UniRef50	UniRef50_D4Q9I1	2e-104	57.10%	Short-chain dehydrogenase/reductase n=2 Tax=Obtectomera RepID=D4Q9I1_BOMMO
NCBI RefSeq	NP_001171333.1	5e-105	57.10%	short-chain dehydrogenase/reductase [Bombyx mori]
NCBI nr blastp	gi\|295424091	9e-104	57.10%	short-chain dehydrogenase/reductase [Bombyx mori]
NCBI nr blastx	gi\|295424091	6e-99	57.10%	short-chain dehydrogenase/reductase [Bombyx mori]

Group
Gene Ontology	GO:0005488	3.5e-43	binding
	GO:0008152	1.9e-18	metabolic process
	GO:0016491	1.9e-18	oxidoreductase activity
KEGG pathway	dme:Dmel_CG12068	6e-58
	K00019 (E1.1.1.30, bdh)	maps->	Butanoate metabolism
			Synthesis and degradation of ketone bodies
InterPro domain	[5-263] IPR016040	3.5e-43	NAD(P)-binding domain
	[5-177] IPR002198	1.9e-18	Short-chain dehydrogenase/reductase SDR
	[6-23] IPR002347	3.6e-14	Glucose/ribitol dehydrogenase
Orthology group	MCL15661		Insect specific

Nucleotide sequence:

>DPOGS209267-TA
ATGTCGTGGACTAAGGTGGTAGCGATAACTGGTTGCGATAGTGGCCTGGGTTGGAGTATAGCTGCGCGTTCAGCGCGAGAGGGTTTCATTACTGTGGCTGGCATGTATAACGGCATTAACACAGAAGCAGCTAAGTCTCTGAACCGTCTTCGCGCTCATCCCCACAAGCTGGATATCACCGACGCCAGTAGTGTACTAAGTTTTTACGATTATGTCAAGAAAATTTTGCATAATAACAATAACTATGAATTATACGCAATTGTTAACAACGCGGGAGTTATGACTATTGGAGATTATGAGTGGCAAACACCAAAAATTATAGAAGATACAATTAACATCAACTTACTTGGAACTATGAAATTCACTTCAGCTTTCTTGCCAGATTTACGCAGGAACGCATTAAAGAATAAAAACAACCCTCGTATAATCAACGTAGCAAGTCATTGTGGCCTTCAACCATTACCTGGTTTCGGGCCGTACAGCGCAAGTAAAGCTGGTTTACTCGCCTGGAGTAAAGCGTTACGTCTTGAACACATGAACATGGGGTTAAAAGTTGTTTCATTCATACCAGGTGGTTTCGTTGGTGCCAGTAATCTTATGACGAATCAGTATTCAAACGCAAATGCTATGGTGGAACATCTGACCGAAGAACAAAAATCGCTTTACGAAACAAAAATTCGTAGATTAAATGATTATTTAAAACTTGCTTCGAATAATTCAAGATTTGATTCCTTAAAAGATGAAAATATAATTGAAACATTTATGATGGCCCTCACTGATGAAAATCCTAAGACAATGTACAAAGTTGAATCGTGGCGTTACAAACTTTATTATAATTTGTTTAAGTTTCCTCTGCCGGATAAATCTTACAGGTGGTTGATTAATAAATTTCTGGACTTCCCAAAATAA

Protein sequence:

>DPOGS209267-PA
MSWTKVVAITGCDSGLGWSIAARSAREGFITVAGMYNGINTEAAKSLNRLRAHPHKLDITDASSVLSFYDYVKKILHNNNNYELYAIVNNAGVMTIGDYEWQTPKIIEDTININLLGTMKFTSAFLPDLRRNALKNKNNPRIINVASHCGLQPLPGFGPYSASKAGLLAWSKALRLEHMNMGLKVVSFIPGGFVGASNLMTNQYSNANAMVEHLTEEQKSLYETKIRRLNDYLKLASNNSRFDSLKDENIIETFMMALTDENPKTMYKVESWRYKLYYNLFKFPLPDKSYRWLINKFLDFPK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: