MonarchBase - Protein-coding gene

DPOGS206668
Transcript	DPOGS206668-TA	1020 bp
Protein	DPOGS206668-PA	339 aa
Genomic position	DPSCF300048 + 543025-545493
RNAseq coverage	339x (Rank: top 34%)

Annotation
*Heliconius*	HMEL011150	2e-174	90.35%
*Bombyx*	BGIBMGA008499-TA	2e-104	85.84%
*Drosophila*	CG13377-PA	7e-37	36.25%
EBI UniRef50	UniRef50_Q7QA37	4e-39	35.80%	AGAP004450-PA n=3 Tax=Anopheles RepID=Q7QA37_ANOGA
NCBI RefSeq	XP_313742.4	7e-40	35.80%	AGAP004450-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|158292184	1e-38	35.80%	AGAP004450-PA [Anopheles gambiae str. PEST]
NCBI nr blastx	gi\|125982994	3e-37	37.06%	GA12240 [Drosophila pseudoobscura pseudoobscura]

Group
Gene Ontology	GO:0005488	3.3e-18	binding
	GO:0008152	1.6e-06	metabolic process
	GO:0016491	1.6e-06	oxidoreductase activity
KEGG pathway	dme:Dmel_CG13377	5e-35
	K00019 (E1.1.1.30, bdh)	maps->	Butanoate metabolism
			Synthesis and degradation of ketone bodies
InterPro domain	[43-241] IPR016040	3.3e-18	NAD(P)-binding domain
	[43-172] IPR002198	1.6e-06	Short-chain dehydrogenase/reductase SDR
Orthology group	MCL12899		Insect specific

Nucleotide sequence:

>DPOGS206668-TA
ATGGACCCGTTGACGTGGTTATCCCTTGGCCTGCAACTGGCGGCGTTGTGCAGCATAGTTGGAGCATTGCTGCTCTATCTATTGAGGAAGGTTCGCGTTGCTGAAGTGCTGCCAGTGGACAGCGCTAAGACTGTTCTTGTTACGTCCGTGGATTCCGCTCTTGGATTGCAGATTGCGACATACCTAAGCAGCAAGGGTTGGCGAGTTATAGCCGGCTGTCGACAGGGCGGCCTCGGCGCTCGTCTAGCCGAATCCTGGCTTCAAGCACATGTAGCCGCGACGCCGGAGAATCAAGCTCCCCCGAGGCTAGCGACTTTAGAACTGGATGTGGCTAGAGAAGATTTATTAGAGGAAGCGGCCAGAGCTACGGCCCAACATCTCCCCGCTGGAGAACATGGAGTTTGGGCAGTGATCAATACAGCTGGTAGCAGTGGTCTCGGTGGGGCTTCGGTCTGGGAGAGTGCCCTTCGTTGTAATATCCTTGGAGCCCTAAGGGTCGCCAGGACATTCTCACCGCTTCTGGCCGCTGCAGCTGCAGACCACCCTTATGCTGGGCGACTGTTTTATATTGGTCTTACATCAGACACGGCCTGTGAAAGCCTATCCCGTGGTGAGAGCGAAGGCAGCGCATGTTCTGCCGCCGTAAGATGGGGCACTTGGGGCGCTGCTCGTGCATTGCGCGCTACTTTGCGTGCACGGAGGCTCCACGTCGTCCTCCTGCACGCGCCTGATCTAGCTGCCGAGGAAATATACGCACCACCGATGCAGATCACGCCTATAAGCCAACCGTCAAGCCGCCCGGATACACCGAATTCTGAAGTAAGCTCGTCGTCTACAGCTACCTGTGCGGTGACCATGCCTGGTGAGGCTGCGGAGTACAGCGCTAAAGTCTTACCGACCAGTGCTTTGAAGGTTCTAGAGGAAGCTCTGACGTCACCATCCCCGAGAGACTCCTATTATTTGAAAATCAAACAAGATTCTTGGTTTACAAGGATGCCATCTCTGAGAGTATCCCATTGA

Protein sequence:

>DPOGS206668-PA
MDPLTWLSLGLQLAALCSIVGALLLYLLRKVRVAEVLPVDSAKTVLVTSVDSALGLQIATYLSSKGWRVIAGCRQGGLGARLAESWLQAHVAATPENQAPPRLATLELDVAREDLLEEAARATAQHLPAGEHGVWAVINTAGSSGLGGASVWESALRCNILGALRVARTFSPLLAAAAADHPYAGRLFYIGLTSDTACESLSRGESEGSACSAAVRWGTWGAARALRATLRARRLHVVLLHAPDLAAEEIYAPPMQITPISQPSSRPDTPNSEVSSSSTATCAVTMPGEAAEYSAKVLPTSALKVLEEALTSPSPRDSYYLKIKQDSWFTRMPSLRVSH-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: