MonarchBase - Protein-coding gene

DPOGS201874
Transcript	DPOGS201874-TA	1293 bp
Protein	DPOGS201874-PA	430 aa
Genomic position	DPSCF300191 + 182273-197147
RNAseq coverage	276x (Rank: top 39%)

Annotation
*Heliconius*	HMEL012846	4e-50	70.50%
*Bombyx*	BGIBMGA006048-TA	4e-83	69.16%
*Drosophila*	CG13284-PB	4e-66	49.04%
EBI UniRef50	UniRef50_E0V951	2e-69	50.00%	Steroid dehydrogenase, putative n=8 Tax=Neoptera RepID=E0V951_PEDHC
NCBI RefSeq	XP_001603427.1	8e-81	56.65%	PREDICTED: similar to ENSANGP00000013086 [Nasonia vitripennis]
NCBI nr blastp	gi\|91083689	4e-79	55.29%	PREDICTED: similar to steroid dehydrogenase isoform 1 [Tribolium castaneum]
NCBI nr blastx	gi\|270007885	1e-75	55.51%	hypothetical protein TcasGA2_TC014627 [Tribolium castaneum]

Group
Gene Ontology	GO:0005488	8.3e-50	binding
	GO:0008152	7.4e-24	metabolic process
	GO:0016491	7.4e-24	oxidoreductase activity
KEGG pathway	mcc:714962	5e-60
	K10251 (KAR)	maps->	Biosynthesis of unsaturated fatty acids
InterPro domain	[170-355] IPR016040	8.3e-50	NAD(P)-binding domain
	[169-335] IPR002198	7.4e-24	Short-chain dehydrogenase/reductase SDR
	[168-185] IPR002347	8.6e-17	Glucose/ribitol dehydrogenase
Orthology group	MCL10876		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS201874-TA
ATGTTAGGATTTATTTGTTTAGCTGTGATAGGCGCGATAACGGTGGCCGTGTTTTTGATTGATTCCCTGTGGAGCGTTTTGGAACTGATAACGTCATATTTAACACCTTATTTCATACCCACAGAAGTGTTACCCTTGTCAAAGAGGTTCGGACCTTGGGCTGCCGTGACCGGTTCCACGGATGGCATCGGTAAGGAGTACGCTCTCGAGCTGGCTCGGCTGGGGATGAACGTGGTGCTCATCAGTCGCAGCGAAGACAAGCTGAGAACAGTCTCCAGAGAGATCGAGAAGCTGCACGGGGTGAAAACCAAAATCATCGTAGCAGATTTCAGCAAAGGAACTGAGATTTATCAGAACATTGAGAATGGACTCAAGGATGTGCCCTTGGGTATCTTGGAGAAGCTGCACGGGGTGAAAACCAAAATCATCGTAGCGGATTTCAGCAAAGGCACTGAGATTTATCAGAACATTGAGAATGGACTCAAGGATGTGCCCTTGGGTATCTTGGCCGTGACCGGTTCCACGGATGGCATCGGTAAGGAGTACGCTCTCGAGCTGGCTCGGCTGGGGATGAACGTGGTGCTCATCAGTCGCAGCGAAGACAAGCTGAGAACAGTCTCCAGAGAGATCGAGAAGCTGCACGGGGTGAAAACCAAAATCATCGTAGCAGATTTCAGCAAAGGAACTGAGATTTATCAGAACATTGAGAATGGACTCAAGGATGTGCCCTTGGGTATCTTGGTGAATAACGTCGGAGTTCAATACGAGTATCCGATGCCGCTGGTGGAGTTGCCTGTGAGTAAAGCCTGGGAGCTGATCAGTGTGAACGTGGTCGCGGTGACAACCCTGACCCGCATGGTGCTGCCCGGGATGTTGGCCCGGGGGCGGGGGGCCGTCGTCAACGTGTCCTCGGGCTCCGAGCTGCAGCCCCTGCCGCTTATGGCTGTGTACGCTGCCACTAAGTCGTACGTGCGCAGCCTGACGCTGGCGCTCCGTGCGGAGGTGTCTCCGACTGTGACGGTGCAGCACGTGTCTCCGCTGTTCGTGTCCACTAAGATGAACACCTTCTCCCCCACACTCCTGGCCGGCAACCCGCTGGTGCCCGACGCGAGGACCTACGCCAGGCACGCCGTCCGCACGCTGGGGAGAGTCACCGCTACGTCCGGCTATTGGGTCCATGGCGTTCAGAGTTTCTTCATCAAACTAGCCCCGGAATGGGTCCGGATAAAGGTCGGCGCTCAAATGAACAGAGAATTCAGAGAGGAACACATGAGAGCGATCAAGAGACAATGA

Protein sequence:

>DPOGS201874-PA
MLGFICLAVIGAITVAVFLIDSLWSVLELITSYLTPYFIPTEVLPLSKRFGPWAAVTGSTDGIGKEYALELARLGMNVVLISRSEDKLRTVSREIEKLHGVKTKIIVADFSKGTEIYQNIENGLKDVPLGILEKLHGVKTKIIVADFSKGTEIYQNIENGLKDVPLGILAVTGSTDGIGKEYALELARLGMNVVLISRSEDKLRTVSREIEKLHGVKTKIIVADFSKGTEIYQNIENGLKDVPLGILVNNVGVQYEYPMPLVELPVSKAWELISVNVVAVTTLTRMVLPGMLARGRGAVVNVSSGSELQPLPLMAVYAATKSYVRSLTLALRAEVSPTVTVQHVSPLFVSTKMNTFSPTLLAGNPLVPDARTYARHAVRTLGRVTATSGYWVHGVQSFFIKLAPEWVRIKVGAQMNREFREEHMRAIKRQ-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: