MonarchBase - Protein-coding gene

DPOGS204629
Transcript	DPOGS204629-TA	1863 bp
Protein	DPOGS204629-PA	620 aa
Genomic position	DPSCF300277 - 164594-169441
RNAseq coverage	336x (Rank: top 34%)

Annotation
*Heliconius*	HMEL010578	6e-143	68.41%
*Bombyx*	BGIBMGA014459-TA	2e-55	49.00%
*Drosophila*			%
EBI UniRef50	UniRef50_F5HKE4	1e-66	31.16%	AGAP002933-PB n=1 Tax=Anopheles gambiae RepID=F5HKE4_ANOGA
NCBI RefSeq	XP_001237409.2	6e-66	34.52%	AGAP002934-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|347968893	5e-66	31.16%	AGAP002933-PB [Anopheles gambiae str. PEST]
NCBI nr blastx	gi\|347968893	2e-64	31.32%	AGAP002933-PB [Anopheles gambiae str. PEST]

Group
Gene Ontology	GO:0016706	3.8e-31	oxidoreductase activity, acting on paired donors, with incorporation or reduction of molecular oxygen, 2-oxoglutarate as one donor, and incorporation of one atom each of oxygen into both donors
	GO:0005506	3.8e-31	iron ion binding
	GO:0055114	3.8e-31	oxidation-reduction process
	GO:0031418	3.8e-31	L-ascorbic acid binding
	GO:0016705	2.7e-10	oxidoreductase activity, acting on paired donors, with incorporation or reduction of molecular oxygen
KEGG pathway
InterPro domain	[382-605] IPR019601	3.8e-31	Oxoglutarate/iron-dependent oxygenase, C-terminal degradation domain
	[164-358] IPR006620	2.7e-10	Prolyl 4-hydroxylase, alpha subunit
Orthology group	MCL16037		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS204629-TA
ATGAGTTCTCCGACTAAAGAAACTGAAGATCCATCATCTAGCAATGCTGAGAGTGAGGAATACACAGGCGGAAATAGCGATGCGAATACAGAGCAGAGACCGCCCGCCAAGCGGCCTATGTCTACAGCAGTTATTGAAATTTCAGACACTGAAAGTGATGATTCCGATGTCTGCGCTGTTAATTCTTACCAGGCCTCAGCTGATGAGGTGAAAAGAATACGAAGAGATTATTCATCTTCGTCATCATCTTCCTCATCATCAAACTACAGCTCTGATTCTGACTCACCATGGGAAGATGACTCTGTAGTAATAGATGATAAAGCAATGGGAAGGCCTGTGATTGCTAAGATGTTAGTTAGAGCTAATAGAATGGATGACCCTAAATTTAATCCTGAACTGAAGTCTCAAGAGATCATAAGTAAAATTAAATCTCACTGGGATGAGAAGACAGACCACAGTAGTGACCAAGTGACCTTAACATGTAAACCGTTCAGACTCTGTCGGATTCATGGCTTGTTAGAGAACTCGGAGATAATAAATAATATAGTGGACGACATGAACACATTGGACTGGTCGAGGAAGAAGATGGATCTGTACGAGTTTCACCAGACCTCTGACTTAGCAAACTTAACTTGGCAGCGTAGTATAAGAGGTATTTACGAATTATTGAAGACTGAAGTAATGACTTGGGTGTCGCAAGTAACGGGCATAGAGTTGACATCAGTGTCGGCGTCATGTTCGCTGTATGGCCCCGGAGACCATCTCTTGGTTCACGATGATCGACTCGGGGACAGGAGGGTGGCCTTCATCCTGTACCTAGCACCCTGGACGCCACGATCACCACCACACATGCAGAACGGAGCTGAAAGTCAAGATAAGTGTTGGAGCGGTCCGGGCTGGAGGCCGCATATGGGTGGAGCGTTGGAGTTGGTCGAGGATGGACAGGTTGTGTTCCGTGCCTTCCCCGCTAATAATACATTAGCATTCTTCGCAGTCGGCCCGACGTCCTTTCATCAGGTGGGCGAAGTCCTATCTATGGAGCTTCCTCGGCTGTCTATTAACGGTTGGTTTCACGGTCCGGCGCCGGAGTCCGAGGAGCCGCACGCGGAGCTCCCAGTGCCACTCACACCGCACAACCAAGTGGTGGTGTTGAAGTCGTGGGTAGAGGCTGGGTACTTGTGTCCCCGAGCTCGAGCCCAGGTCCAGGCGCAGATGGAGCGTGCCAGCGAGGTCTGCCTGCATGACCTGCTGCTGCCATCGCGATGCCAGCAACTGCTGGAAGCGCTGGAGAAGAATGACATAGAATGGGAGCAGTGCGGTCCAGCACATCAGCGACGGTATCAGCGAGTGACGGAGAAATGGCTCTCAGCCAGCGAACTCTCTGAGGCAACAGAGGAAGAAGCCATCCAGGGCGAAGAGCCCGACGACTGCGGGGTACAGGGGGAGACGCATGTCGTACGAGCACTGCTAAGGCTCCTCAGTAGTACAGCATTCATGAGGCTGGTGGCGGACTGTACAGATCTACCGCTGACTTTGTACAGGAAACTAGAAATGCAACGCTGGCGGGCTGGAGATTTCACTCTTCTCCCGCCCCGGGAACATTATCAGCAGCCTCGTCTAGAGGCAGTCCTGTATCTGGGTGTGCCGAAACATCCTATCTGTGGAGGTCAAACGTTATATGTGGCCCCAGAAGAGGGGTCGCTTGCGGAGGCCGAGGCATTGGTGACTCTGCCCCCCAGACACAACGCGTTAGGGCTGGTGTACTGCGACGCTGGCGCAGCCTCCTTCACCAAATATCTCAGCAAGATGACCATGTCGGAGAACGAGTGCTTCTATATAGTGACCTGTACTTATACCGAGTGA

Protein sequence:

>DPOGS204629-PA
MSSPTKETEDPSSSNAESEEYTGGNSDANTEQRPPAKRPMSTAVIEISDTESDDSDVCAVNSYQASADEVKRIRRDYSSSSSSSSSSNYSSDSDSPWEDDSVVIDDKAMGRPVIAKMLVRANRMDDPKFNPELKSQEIISKIKSHWDEKTDHSSDQVTLTCKPFRLCRIHGLLENSEIINNIVDDMNTLDWSRKKMDLYEFHQTSDLANLTWQRSIRGIYELLKTEVMTWVSQVTGIELTSVSASCSLYGPGDHLLVHDDRLGDRRVAFILYLAPWTPRSPPHMQNGAESQDKCWSGPGWRPHMGGALELVEDGQVVFRAFPANNTLAFFAVGPTSFHQVGEVLSMELPRLSINGWFHGPAPESEEPHAELPVPLTPHNQVVVLKSWVEAGYLCPRARAQVQAQMERASEVCLHDLLLPSRCQQLLEALEKNDIEWEQCGPAHQRRYQRVTEKWLSASELSEATEEEAIQGEEPDDCGVQGETHVVRALLRLLSSTAFMRLVADCTDLPLTLYRKLEMQRWRAGDFTLLPPREHYQQPRLEAVLYLGVPKHPICGGQTLYVAPEEGSLAEAEALVTLPPRHNALGLVYCDAGAASFTKYLSKMTMSENECFYIVTCTYTE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: