MonarchBase - Protein-coding gene

DPOGS210802
Transcript	DPOGS210802-TA	1365 bp
Protein	DPOGS210802-PA	454 aa
Genomic position	DPSCF300027 - 870284-874677
RNAseq coverage	1889x (Rank: top 7%)

Annotation
*Heliconius*	HMEL005657	2e-145	90.26%
*Bombyx*	BGIBMGA007118-TA	0.0	77.04%
*Drosophila*	CG5590-PA	2e-155	60.31%
EBI UniRef50	UniRef50_A4FUZ6	5e-131	54.63%	Hydroxysteroid dehydrogenase-like protein 2 n=212 Tax=root RepID=HSDL2_BOVIN
NCBI RefSeq	NP_001040436.1	0.0	75.94%	hydroxysteroid dehydrogenase [Bombyx mori]
NCBI nr blastp	gi\|114051868	0.0	75.94%	hydroxysteroid dehydrogenase [Bombyx mori]
NCBI nr blastx	gi\|114051868	0.0	75.94%	hydroxysteroid dehydrogenase [Bombyx mori]

Group
Gene Ontology	GO:0005488	4e-55	binding
	GO:0032934	1.6e-29	sterol binding
	GO:0008152	4.5e-20	metabolic process
	GO:0016491	4.5e-20	oxidoreductase activity
KEGG pathway	mxa:MXAN_7310	6e-99
	K13775 (atuG)	maps->	Geraniol degradation
InterPro domain	[5-243] IPR016040	4e-55	NAD(P)-binding domain
	[344-453] IPR003033	1.6e-29	SCP2 sterol-binding domain
	[14-186] IPR002198	4.5e-20	Short-chain dehydrogenase/reductase SDR
	[14-31] IPR002347	2.4e-09	Glucose/ribitol dehydrogenase
Orthology group	MCL12490		Single-copy universal gene

Nucleotide sequence:

>DPOGS210802-TA
ATGAGTTTAGTTGCGAATACAGGGAAGTTGGCTGGTCGTACCCTATTCATAACGGGAGCATCCCGTGGTATTGGTAAAGCTATCGCACTCAAAGCGGCCAAAGATGGAGCTAACGTTGTTGTTGCCGCTAAAACCGCAGAACCTCATCCCAAATTACCGGGAACTATTTACACGGCCGCAGAAGAGATTGAGGCTCTTGGTGGAAAAGCTTTGCCTTGCATTGTTGATGTGAGAGATGAGAAACAGATTCAGAAAGCCATCGATGAAGCTGTTAAAAAGTTCAATGGCATTGATATACTCATAAACAATGCTTCGGCCATATCACTCACTGGGACTGCGGAGACCGATATGAAGAGATACGACCTCATGCACAATATTAACACCAGGGGCACATTTTTGGCATCAAAACTATGCCTGCCGTTGTTGAAAGAAAGCAACCACGCTCACATCCTAAACCTGTCGCCACCACTTAACATGAATCCTTATTGGTTTTCACTGCACGTTGCTTACACAATGGCTAAATATGGGATGTCTATGTGTGTGCTGGGGATGAGTGAAGAATTTAGACAATTCAATATTGGGGTTAATGCACTTTGGCCAAAAACTGCTATCGCGACAGCCGCCATTGAAATGTTGACTGGCGACACTTCGTCCAGTCGCAAACCGGAAATAGTCTCAGATGCTGCCTACGTCATGTTGAGCAAAGACCCTAAATCATACACGGGCAAGTTTGAGATAGATGAAGATGTAGTTAAATCAGTCGGAATCAAAGACCTCGCGCCCTATGCTTGTGATCCAAAGAACGCAAATAATCTGCTGTTGGATGGTTTCTTGGATGATCCAGCGTCATTACTCCATCATCAGCAGACAGTCTCCTCCGCTTCCATACGACGTTATCATACAACTTCCGCCAATTATAAGGATAAGGTAACACTGTTGGTACTGGGTAATGTTAACAATTTGTTACCTGACTTCTTTTTGGATTTACCCGGGCACCAAACGCAAGAGGTCAAAAAGAGTGAGCCGGCAGGACAGATCCCGGAACTATTTTCAGTTATCAACAAGACGATAACACCTGAATTAGTTAAAAAAACACAGGCCGTGTTCCAGTTTAATGTGAAAGGTAAAGAGGAAGGTATATGGCACCTCGATCTCAAGAACGGTGACGGAGCCTGCGGTCAGGGGGAACCAAAACATGCACCCGATGCCACCCTCACCATGGACAGCACCAACTTCGCTGATATGTTCGCTGGGAAATTGAAGCCGACCACAGCCTTTATGATGGGCAAGCTGAAAATAAAGGGGGACATGCAGAAGGCGATGAAACTCGAGAAAATGATGAAATCACTCAAAGCTAAAGTGTAA

Protein sequence:

>DPOGS210802-PA
MSLVANTGKLAGRTLFITGASRGIGKAIALKAAKDGANVVVAAKTAEPHPKLPGTIYTAAEEIEALGGKALPCIVDVRDEKQIQKAIDEAVKKFNGIDILINNASAISLTGTAETDMKRYDLMHNINTRGTFLASKLCLPLLKESNHAHILNLSPPLNMNPYWFSLHVAYTMAKYGMSMCVLGMSEEFRQFNIGVNALWPKTAIATAAIEMLTGDTSSSRKPEIVSDAAYVMLSKDPKSYTGKFEIDEDVVKSVGIKDLAPYACDPKNANNLLLDGFLDDPASLLHHQQTVSSASIRRYHTTSANYKDKVTLLVLGNVNNLLPDFFLDLPGHQTQEVKKSEPAGQIPELFSVINKTITPELVKKTQAVFQFNVKGKEEGIWHLDLKNGDGACGQGEPKHAPDATLTMDSTNFADMFAGKLKPTTAFMMGKLKIKGDMQKAMKLEKMMKSLKAKV-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: