MonarchBase - Protein-coding gene

DPOGS203159
Transcript	DPOGS203159-TA	1173 bp
Protein	DPOGS203159-PA	390 aa
Genomic position	DPSCF300035 - 822515-842799
RNAseq coverage	898x (Rank: top 14%)

Annotation
*Heliconius*	HMEL010966	7e-164	81.79%
*Bombyx*	BGIBMGA007047-TA	5e-18	28.81%
*Drosophila*	CG8888-PA	1e-115	53.46%
EBI UniRef50	UniRef50_Q7K3N4	1e-113	53.46%	CG8888 n=10 Tax=Diptera RepID=Q7K3N4_DROME
NCBI RefSeq	XP_967401.1	1e-136	60.76%	PREDICTED: similar to GA21392-PA [Tribolium castaneum]
NCBI nr blastp	gi\|91077452	2e-135	60.76%	PREDICTED: similar to GA21392-PA [Tribolium castaneum]
NCBI nr blastx	gi\|91077452	2e-130	60.76%	PREDICTED: similar to GA21392-PA [Tribolium castaneum]

Group
Gene Ontology	GO:0005488	9.5e-38	binding
	GO:0008152	1.5e-16	metabolic process
	GO:0016491	1.5e-16	oxidoreductase activity
KEGG pathway	cin:100176396	7e-48
	K00019 (E1.1.1.30, bdh)	maps->	Butanoate metabolism
			Synthesis and degradation of ketone bodies
InterPro domain	[102-299] IPR016040	9.5e-38	NAD(P)-binding domain
	[104-273] IPR002198	1.5e-16	Short-chain dehydrogenase/reductase SDR
	[105-122] IPR002347	7.4e-07	Glucose/ribitol dehydrogenase
Orthology group	MCL15660		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS203159-TA
ATGGCCGCCGGAGACGTGACGCGGCGAGCATCCATCACAGCACCCTCGATGCATCGCCGCCCTTCGGCTAGGAGAGGTTCACTGATCAAGAGCTCCCAACCCTCGTCATCTCAGGAGGTGCCATGGGACATAATAGACCGGTGCGCTCTACCGGTAGTGCTTTGCCACGCTTTAGCGGTAGTTCTTTCAGCACTGTTAAACGCTTTACATCTCAGCCAAATATCAGTCTTCACTTTGTTCCTCTGGTTTGCCATCTCAGTAACCGGTTCCCTCTGGTTCTACCATAATCTTCAGGTAACAGCAGCAGGGAAAGCGGTTTTGGTGACAGGTTGTGACAATGTGTTGGGAAATGCTCTGGCTAGAAGATTGGATGACTTGGGCTATCATGTGTTCGCGGGTTTTCAAAACAAGGCAGGCAACATTGATGCCGACATGCTCAAAGAAGACTGTTCCGGAAGGTTGCACACCTTGCAACTTGACATCACATCAGAAACACAGATTCTTTCAGCGTCTCTGTACATAGTTGATCACCTGCCAGAGGGCGCTCAAGGTCTTTGGGCAATCGTGAACTGCGAATCCTGGTGTGCACTGGGCGAACTAGAATGGGTGCCGTTTTCCGTAATACGACGCGCCATGGAAGTTAATCTGTTGGGACCAGCTCGTTTAGTTCAAGTGATGCTGCCGTTGGTGCGCCGTGCTCGTGGACGTGTTGTTCTGGCATCTTCGATCCTAACTCACGTGGCTGCTCCAGTACGAGGTGTTCATGCAGCTTCACTAGCTGCCCTGGACGCGCTTGCTGCCTGTCTGCGGCGAGAACTTAAGCCCAGGGGTGTTGATGTTGTCGTTGTCGCTGCGGGTGAATACACTACAGGTAGTGCTTGGCTCTCCGAGGAGAAACTTCTAGAGCAAGCTAGGGATATGTGGAAAAGACTCAGCGACGAACAAAAGGGCGCCTACGGAGAGGATTACTTCGAACAAGCGTTGAGGAGCCTTGAGAAATACACAAAAAGCCCTGACGCTGACCTAACGGCTGTGACGCGGGCGCTTAGTGATGGCGTCACCCGCACCTTCCCCCTGGCTCGTTACACCCCGGTCTCACCGCGAGAGAAACTGAAGTCCCTACTAGCTGAGCACATGCCCCGATCTCTTTACGAAGGACTCTACGCCGACTAG

Protein sequence:

>DPOGS203159-PA
MAAGDVTRRASITAPSMHRRPSARRGSLIKSSQPSSSQEVPWDIIDRCALPVVLCHALAVVLSALLNALHLSQISVFTLFLWFAISVTGSLWFYHNLQVTAAGKAVLVTGCDNVLGNALARRLDDLGYHVFAGFQNKAGNIDADMLKEDCSGRLHTLQLDITSETQILSASLYIVDHLPEGAQGLWAIVNCESWCALGELEWVPFSVIRRAMEVNLLGPARLVQVMLPLVRRARGRVVLASSILTHVAAPVRGVHAASLAALDALAACLRRELKPRGVDVVVVAAGEYTTGSAWLSEEKLLEQARDMWKRLSDEQKGAYGEDYFEQALRSLEKYTKSPDADLTAVTRALSDGVTRTFPLARYTPVSPREKLKSLLAEHMPRSLYEGLYAD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: