MonarchBase - Protein-coding gene

DPOGS214589
Transcript	DPOGS214589-TA	1416 bp
Protein	DPOGS214589-PA	471 aa
Genomic position	DPSCF300050 - 351568-362122
RNAseq coverage	908x (Rank: top 14%)

Annotation
*Heliconius*	HMEL012180	3e-114	71.69%
*Bombyx*	BGIBMGA005120-TA	5e-120	63.78%
*Drosophila*	Hph-PC	5e-76	54.78%
EBI UniRef50	UniRef50_E2AT40	3e-115	48.73%	Egl nine-like protein 1 n=2 Tax=Formicidae RepID=E2AT40_CAMFO
NCBI RefSeq	XP_397368.3	7e-118	47.71%	PREDICTED: similar to Egl nine homolog 1 (Hypoxia-inducible factor prolyl hydroxylase 2) (HIF-prolyl hydroxylase 2) (HIF-PH2) (HPH-2) (SM-20) [Apis mellifera]
NCBI nr blastp	gi\|328778894	1e-116	47.71%	PREDICTED: egl nine homolog 1-like [Apis mellifera]
NCBI nr blastx	gi\|328778894	3e-115	47.71%	PREDICTED: egl nine homolog 1-like [Apis mellifera]

Group
Gene Ontology	GO:0016705	2.1e-33	oxidoreductase activity, acting on paired donors, with incorporation or reduction of molecular oxygen
	GO:0005506	2.1e-33	iron ion binding
	GO:0055114	2.1e-33	oxidation-reduction process
	GO:0031418	2.1e-33	L-ascorbic acid binding
	GO:0008270	5.5e-10	zinc ion binding
	GO:0016706	1.3e-08	oxidoreductase activity, acting on paired donors, with incorporation or reduction of molecular oxygen, 2-oxoglutarate as one donor, and incorporation of one atom each of oxygen into both donors
	GO:0016491	1.3e-08	oxidoreductase activity
KEGG pathway	ame:413929	2e-117
	K09592 (EGLN, HPH)	maps->	Pathways in cancer
			Renal cell carcinoma
InterPro domain	[260-452] IPR006620	2.1e-33	Prolyl 4-hydroxylase, alpha subunit
	[10-46] IPR002893	5.5e-10	Zinc finger, MYND-type
	[359-452] IPR005123	1.3e-08	Oxoglutarate/iron-dependent oxygenase
Orthology group	MCL13521		Single-copy universal gene

Nucleotide sequence:

>DPOGS214589-TA
ATGAATCAAGAAGGCGTACTCGCGAGTTGCGCCGTTTGCAATCAGCAAACCCAAAGGAGATGTGGTCGTTGTTTTAGTGTTTATTATTGTAACACAGAACATCAAAGACAAGATTGGAAAAGGCATAAAATCAATTGTGCACCTAAGTTACAGGAACAGGGTTCGCGAATTGAAAAAAATATTAAATCATCTATCCACAAAGAAGAGAAAAAGAAAGAAACCAAAAAAGAACAATTAATAACCTCATCTGTAGTGAATAATAATAAAGAAGTGTTACAAGTGGGTAGTGAAACTAGACGTTTGAAAAAATCTAAAAAGAAAACTGCCAAGAAAGAGGGTAGTGACACTATTAGTGATAACAAAAATATCTCTCAGATTATAGAAAATAATAATGAAAGCACAGCAAGTGTTAAAGTCGATTTAAAGGACAAAAGTGTATTTTCAAGCGTAGTTTACTCTAATAAAGACGTAAATAAGATAAGTGCCATAACTTACGAAGGTTCGTCGGAACAGGAGATATTAAATGAAAAGGCTCAGCAGCTGAGCAGCGTTGATTTCGCGAGTGCAAGCACTTCAAATGTTTTAAAAACAATTAACAGAGCTGATGTGAAAATGCCACCTGTACCTATTGAACAGTCAACTAGAATGAAGGAGTACCCCGAGGCCTCACTAAAAGGTAGCGGGGCTCCATTTAATACCACAATGAACAGTTACTTTATGGATCCCAGTGATCCATCCTATGAGATCTGCCAGAGAGTTATCAGAGACATGACACAATATGGTGTGTGTGTTATAAACAATTTCCTTGGTAAAGAACGGGGACATCTTGTATTGAATGAAGTGCTGGAAATGTACAGATCGGGGATATTTACGGCAGGTCAATTGGTTTCTAGCCCTGGAAGCACAGAAGCACAGACAATTAGATCGGACAGAATAACATGGATCGACGGCAAGGAGCCTCAATGCCATCACATAGGACAATTAATATCACAAGTGGACAGTATAATACTGAAAGCTAACAAAATGTCCAACAACGGGAAGATGGGGAACTACATCATCAATGGCAGGACGAAGGCGATGGTAGCATGTTATCCTGGTTCCGGAAGTCACTACGTCAAACACGTGGACAATCCGAATAAAGATGGCCGCTGCATCACAGCCATTTACTACTTGAATCTCGACTGGGATGTCAAGAGATGTGGGGGTCTGCTCAGGGTATTCCCCGAAGGAACCAACCAGGTGGCTGACATCGCGCCCATCTTCGATAGGATGCTGTTCTTCTGGTCAGATCGAAGAAATCCTCACGAAGTGCAACCTGCTTACTCAACGAGATATGCGATCACATTGTGGTATTTCGACTCTCAAGAACGTGAAGAAGCCCTTAGGAATTTCAGTAAGTTTTTTTTGATAAAATAA

Protein sequence:

>DPOGS214589-PA
MNQEGVLASCAVCNQQTQRRCGRCFSVYYCNTEHQRQDWKRHKINCAPKLQEQGSRIEKNIKSSIHKEEKKKETKKEQLITSSVVNNNKEVLQVGSETRRLKKSKKKTAKKEGSDTISDNKNISQIIENNNESTASVKVDLKDKSVFSSVVYSNKDVNKISAITYEGSSEQEILNEKAQQLSSVDFASASTSNVLKTINRADVKMPPVPIEQSTRMKEYPEASLKGSGAPFNTTMNSYFMDPSDPSYEICQRVIRDMTQYGVCVINNFLGKERGHLVLNEVLEMYRSGIFTAGQLVSSPGSTEAQTIRSDRITWIDGKEPQCHHIGQLISQVDSIILKANKMSNNGKMGNYIINGRTKAMVACYPGSGSHYVKHVDNPNKDGRCITAIYYLNLDWDVKRCGGLLRVFPEGTNQVADIAPIFDRMLFFWSDRRNPHEVQPAYSTRYAITLWYFDSQEREEALRNFSKFFLIK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: