MonarchBase - Protein-coding gene

DPOGS210521
Transcript	DPOGS210521-TA	1608 bp
Protein	DPOGS210521-PA	535 aa
Genomic position	DPSCF300186 + 241643-243623
RNAseq coverage	53x (Rank: top 70%)

Annotation
*Heliconius*	HMEL016339	0.0	83.90%
*Bombyx*	BGIBMGA012624-TA	0.0	78.03%
*Drosophila*			%
EBI UniRef50	UniRef50_Q9XVZ2	0.0	59.74%	Protein Y7A5A.1 n=8 Tax=Bilateria RepID=Q9XVZ2_CAEEL
NCBI RefSeq	XP_966520.1	0.0	67.81%	PREDICTED: similar to Y7A5A.1 [Tribolium castaneum]
NCBI nr blastp	gi\|91094133	0.0	67.81%	PREDICTED: similar to Y7A5A.1 [Tribolium castaneum]
NCBI nr blastx	gi\|91094133	0.0	67.81%	PREDICTED: similar to Y7A5A.1 [Tribolium castaneum]

Group
Gene Ontology	GO:0016614	1.1e-24	oxidoreductase activity, acting on CH-OH group of donors
	GO:0050660	1.1e-24	flavin adenine dinucleotide binding
	GO:0003824	1.1e-24	catalytic activity
	GO:0055114	1.1e-24	oxidation-reduction process
	GO:0008762	2.9e-14	UDP-N-acetylmuramate dehydrogenase activity
	GO:0016491	2.9e-14	oxidoreductase activity
KEGG pathway	gga:424661	1e-109
	K09828 (DHCR24)	maps->	Steroid biosynthesis
InterPro domain	[105-222] IPR016166	1.1e-24	FAD-binding, type 2
	[107-189] IPR006094	2.9e-14	FAD linked oxidase, N-terminal
	[108-220] IPR016168	2.4e-13	FAD-linked oxidase, FAD-binding, subdomain 2
Orthology group	MCL22301		Insect specific

Nucleotide sequence:

>DPOGS210521-TA
ATGCTACCGAGCAGTATGAAGAGCTACATCATCAGATGGCTCGAGGATCACAGAGCGCTGGTGGTGTGCGCGTTCTGCCTCCCCGCCAGTTTCCTGTTCACGTTACTGTTGAGACTGAGAGCCTTCGCCCGCAGGCTGACCAGCGACCCTCAGAGACACGACAGCGCCGTCCGGCGTATACAGTCTCAGGTCTTAGAATGGAACAAACTCCCGTCGAAAAACAAACGGCTGCTGTGTACGTCCCGGCCGAACTGGCTGTCCCTCTCGATAACCTTCTTCCAGAAACACCTGCACCATCAAGTCCCCATCCCTCTGTATGATATCCTGGAACTAGACGAGGAGGCCGGGACTGTGAGGGTGGAGCCCATGGTCACCATCGGAGACATTACCCGATATCTCATACCCAAAGGATATTCATTGGCCGTCACTATTGAACTGGACGACGCGACCTTGGGTGGTCTTGCCCTCGGGACCGGGATGTCCACACACTCCCATAAGGCCGGCCTCTATCACGAGACTATAACCAGCTACGAGGTGGTGTTAGGAGACGGCTCGCTCGTCACCGCCACGGCCACCAACGAGTATTCTGACCTCTACAAAGCCCTGCCCTGGTCGCACGGAAGTCTTGGCTTCCTTGTGGCGCTGACGCTGAAGATCGTCAAAGTGAAGCCCTACATCAGAATCAAGTACACGCCCGTACGAGGACAGAACAATTACTGCGACTTGATAAGAAAGTTATCCGGAACCCATGAAGCCGAACCCACAAGGCACCCGGATTATATAGAGGGGACGATATTCAGCAAGGACGAAGCGGTCGTCATGACGGGGGAGTACGCCGACTATGATGGGAGACTCGCAGTCAATCACTGCTCCAGGTGGTATAAGCCGTGGTTTTACAAACATGTCGAGTCTTTCCTCGAAGAAGGCGAAAAAGAAGAATTGATCCCTTTGAGAGACTACCTGCTGCGCCACAACAGACCTATCTTCTGGGTCGTGGAAGATATGATTCCGTTCGGCAACAACGCGCTATTCAGGCTCTTCTTCGGGTGGCTCTTACCGCCGAAACCGGCCTTCCTCAAATTCACGACGACACCAGGCGTTAGAGCTTATACGTTTACGAGACAGGTGTTCCAAGACATCGTCCTACCCATTCAAGAGCTGGAAAAGCAAATCGAGCTCGCCATCCAGCTGTTCGAGAAATTTCCTCTGCTGGTGTACCCTTGCAGAATAATAGACCACGGGCCGCTGTCGGGGCAACTGCGGAGACCGCACGCTAAATATCTAGTACCCGGGACTAACTACGCCATGTACAACGACCTGGGAGTGTACGGCGTTCCCGGGAAAGTGAAGCACAAGAAACCTTACAACGCCGTGGCCGCCATGAGAGAGATGGAGCGGTTCACGCGCGACGTCGGAGGATACTCCTTCCTGTATGCAGACATATTCATGGACAGAGAAGAGTTCGGCCAGATGTTCGATCTGAGCCTGTACGACGCGGTGCGCACCAAATACATGGCCCAGGGAGCCTTCCCGCACCTCTACGATAAAGTCAAGCCCGAAATCGACGTGTTCTCTATCGGCGAACGAAATGTTATACGCGGTCAATAA

Protein sequence:

>DPOGS210521-PA
MLPSSMKSYIIRWLEDHRALVVCAFCLPASFLFTLLLRLRAFARRLTSDPQRHDSAVRRIQSQVLEWNKLPSKNKRLLCTSRPNWLSLSITFFQKHLHHQVPIPLYDILELDEEAGTVRVEPMVTIGDITRYLIPKGYSLAVTIELDDATLGGLALGTGMSTHSHKAGLYHETITSYEVVLGDGSLVTATATNEYSDLYKALPWSHGSLGFLVALTLKIVKVKPYIRIKYTPVRGQNNYCDLIRKLSGTHEAEPTRHPDYIEGTIFSKDEAVVMTGEYADYDGRLAVNHCSRWYKPWFYKHVESFLEEGEKEELIPLRDYLLRHNRPIFWVVEDMIPFGNNALFRLFFGWLLPPKPAFLKFTTTPGVRAYTFTRQVFQDIVLPIQELEKQIELAIQLFEKFPLLVYPCRIIDHGPLSGQLRRPHAKYLVPGTNYAMYNDLGVYGVPGKVKHKKPYNAVAAMREMERFTRDVGGYSFLYADIFMDREEFGQMFDLSLYDAVRTKYMAQGAFPHLYDKVKPEIDVFSIGERNVIRGQ-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: