MonarchBase - Protein-coding gene

DPOGS208007
Transcript	DPOGS208007-TA	4098 bp
Protein	DPOGS208007-PA	851 aa
Genomic position	DPSCF300270 + 220915-230465
RNAseq coverage	9x (Rank: top 85%)

Annotation
*Heliconius*	HMEL003022	2e-167	55.41%
*Bombyx*	BGIBMGA008244-TA	9e-179	57.31%
*Drosophila*	CG18522-PA	5e-85	34.79%
EBI UniRef50	UniRef50_B0X3W1	8e-126	32.83%	Xanthine dehydrogenase/oxidase n=3 Tax=Culicinae RepID=B0X3W1_CULQU
NCBI RefSeq	XP_001864333.1	1e-126	32.83%	xanthine dehydrogenase/oxidase [Culex quinquefasciatus]
NCBI nr blastp	gi\|160333249	3e-122	45.42%	aldehyde oxidase 1 [Bombyx mori]
NCBI nr blastx	gi\|160333249	4e-134	45.42%	aldehyde oxidase 1 [Bombyx mori]

Group
Gene Ontology	GO:0055114	2.3e-37	oxidation-reduction process
	GO:0016491	2.3e-37	oxidoreductase activity
	GO:0046872	8.8e-30	metal ion binding
	GO:0016614	1.7e-22	oxidoreductase activity, acting on CH-OH group of donors
	GO:0050660	1.7e-22	flavin adenine dinucleotide binding
	GO:0003824	1.7e-22	catalytic activity
	GO:0009055	6.7e-20	electron carrier activity
	GO:0051536	6.7e-20	iron-sulfur cluster binding
KEGG pathway	phu:Phum_PHUM299090	5e-69
	K00106 (XDH)	maps->	Peroxisome
			Purine metabolism
			Caffeine metabolism
			Drug metabolism - other enzymes
InterPro domain	[623-786] IPR000674	2.3e-37	Aldehyde oxidase/xanthine dehydrogenase, a/b hammerhead
	[82-198] IPR002888	8.8e-30	[2Fe-2S]-binding
	[490-598] IPR005107	2.7e-24	CO dehydrogenase flavoprotein, C-terminal
	[205-346] IPR016166	1.7e-22	FAD-binding, type 2
	[3-83] IPR012675	3.1e-20	Beta-grasp fold, ferredoxin-type
	[1-87] IPR001041	6.7e-20	Ferredoxin
	[352-485] IPR002346	7.8e-18	Molybdopterin dehydrogenase, FAD-binding
	[372-479] IPR016169	1.3e-09	CO dehydrogenase flavoprotein-like, FAD-binding, subdomain 2
	[739-851] IPR008274	6.4e-07	Aldehyde oxidase/xanthine dehydrogenase, molybdopterin binding
Orthology group	MCL10023		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS208007-TA
ATGGATAGAGTTCACTTCAGAGTCAACGGAGTGCATTGCTCGGTTGGTAACGAGGTGAGTTCCTCTATAACCCTGCTGGAGTATCTCCGGAGACACTTGGAGCTGCGCGGTACCAAATACATGTGTTTGGAGGGAGGATGTGGAGCCTGTATCGTGAACGTCACAAAACATCCTGGAGGAGAATCCCAAGGAGTCAACTCTTGTATGGTACCTATAACATCATGCAACGAGTGGGATATAACAACAATAGAGGGCATCGGGAATCGTCTGCACGGCTACCATCCAATTCAGGTGACACTGGCTGAAAACAATGGCACACAGTGTGGCTACTGCAGTCCAGGATGGGTCATGGCTATGTACAGTATTTTAAAAAATAAAAAACCGACGATGTTGGAAGTAGAGCAGTCATTTGGAAGCAACATCTGCCGGTGTACTGGATACAGACCCATCTTAGACGCGTTCAAGAAGTTCGCTTCAGATGCTCACGATGTATTAGATATCGAGGACCTAGAAATATGTAAAAAGTCTGGTCGACCGTGTGCGAAGAATAGTTGTGACGAATCTGATTGGTGTTTATTATCTAAAAACGAACTTAATGGAAAACTACTGCACATTATATTAAATGATAACAGGGACTGGTTCAAAGCGACGTGTATATCTGACATATTTGAAATTTTCCAAAAATGGGGAACTGAGTCTTATATGCTTCTGGCTGGAAATACAGGGAAAGGCGTTTTTCCAATATTAGAGTATCCAAGAGTATTGATAAATGTAAATGATGTCAAGGAATTGAGGCAACAATATATTGACCAAAACTTAGTGATTGGAGGAGCGACGACCCTCACAGAACTGATAAATATATTCGATACAGTGGGTCACACTGAATACTTTGGATATCTGCTGGTATTGAAAGACCACTTAGAGGAAGTGGCACACATTACTATAAGAAATAATGCAACAGTTGCTGGTAATCTTATGCTGAAGAATTTTCACCTCGATTTTAAATCCGACATTTTCATACTTTTTGAGACTGTTGGTGTGTATCCAATATTGGAATATCCAAGAGTTTTGATAAATGTAAATGATGTCAAGGAGCTGAGAGAACACTATATAGACCAAAACTTAGTGATTGGAGGAGCGACGACCCTTACAGAACTGATAAACATATTCGATACAGTAGGCCGGGTCAATTTCTTTGGATATCTCAAGATATTAAACGAACACTTACAAGAGGTTGCCCATATTCCTATTAGAAACAATGCAACAATCGCTGGTAATCTTATGCTAAAAAATTTGCATCCTGATTTCAAATCCGACATTTTCATACTTTTCGAAACAATCGGAGCTCAGTTAACTATACAGACTGGTCGCAACCAACTAAAGATCATCACAATGCAATCTTTCCTTTCAGAAAATATGCATGGAAAAATATTATTAAATGTTTTACTTCCACCGCTGAGTACTGAACATAAGATAGTAACTTTCAAAATAACGCCGCGGTCCCAAAACGCCCATGCTCTTATCCATGCTGGGTTTCTTTATAAAGTAGATCATAATGAAAGAGTTCTAGAAAGCCGAATTGTCTACGGAGGACTCTCACCATCATATACCAGATCTTGGAAAACAGAAAGATATCTGATCGGTAAACAACTTTTACGGAATGAGACGTTGCAAGGAGCCTTAAAAGTTCTTAACACAGAACTGGTAGTTACGGAAAGTCTGCCAGATCCCTCTGTACAGTACAGGCGACAAGTAGCTTTAGCACTTTTCTACAAGGGACTTCTTTCTCTATGCGCACAAAACAGATTAAATCCTCGTTACGTATCTGGATCCAGCAAAATTCATAAAACAAGACCAGTGTCTGAAGGAACTCAGATATTCGATACGAATCCAAGTCTGTGGCCTCTAAACAAACCAATACCCAAACTGGATGGTTTGATTCAATGTGCCGGTGAAGCAAAATATTCTGAAGACGTTCCAAGACTTCCGGGAGAAGTGTTCGCCGCATTTGTTTTAACAACTGTGGCTCTGGGAAAAATTAATCATATTGACGCTAGTCGTGCTTTGGAGGAGCCTGGAGTATTGGCATTTTATACAGCAGCAGATATCCTAGGCAGAAATAGTTTTATACCTGCTGTTAATTTGTTTAACAGAGCTGATGAAGAATTCTTGTGCAACGGAGAAGTTAAATATTTTAATCAGCCCCTTGGAATAATTGTTGCCGAATGTCAAAGCATTGCAGACAAAGCAGTACATCTTGTACAAGTTATTTATTCTGATATAAAGAATCCGGTCCTCGACATCAGGGTTGCCAAACATGATCCCTCAAAACTGAAATTGTTTCAAACGATAAACGCAACTTCTGCTGGTACAGATATCGCTAAAGTAATAAAAGGTGAACAAAGTATCTATACACAATATCCCTTCACTATGGAAACTTTGGTTACTGTGACACATCCTACAGAAGAAGGTTTAAGAATATACGCAGCAACACAATGGATGGATTCAGTTCATGTAGTGATTTCAAGAGCTCTTCTCCTAGATCAAAATAGGTAATAGTATTAATTTTTATTCAAATAACTCTTGAGTTCCGTCAAAACACTTTTTGTATTTAAATAAATTATTTAATCATATTCTGACAACAATTTTTCTAATACTCTTAAATAATTGAAATGAAATATTTCAGAATAGATATTCTTGTCCGTCGTTTGGGTGGTGGGTATGGCTACAAGTTATCAAGAGTTACACAAGTGTCTCTAGGAAGTGCTTTGGTTGCATATAAACTCAATCGACCTTGTCGTTTCATACAAAGCCTTAGTACTAATATGAGAGCTACCGGGAAACGATTTCCATGTTCTACAAGTTTTGAGGTAATATTTAAAAGTATTTGTACAATAAATTTTTAAATAAATTCTACGAATCGAGTAAGGTCCATCAATGTTTCTATTTCTTTGTAGTATCCAATTTTGAGTAGGCAATCCAACACGGCAAACATATTTTTTTTTTTCGGTAAATATAATACGTAAGAATGATGGTGATGATAAATATGTTAGAAAAGTATGATAAATTAAAAACGTAGTAAGTGTTCATAGTAGCAATAGCAAATGTGTGCCTTGTACGATAACTGGAAACAAGATAAAAAGGTACAGAGTAGCTTACCAAATCCAATGTCACCTCTCATATTGCAAGTAATTGAGATGGGATCCCATTGGAACTCAATACTTAGAGGTGAATATGTGTGTTTATTACGATGATGGCACTGTTGCTTTAACTCATGCAGGCATAGAAATGGGACAGGGAATTAATACTAAAGCTATACAAATAGCAGCTTATTTTCTTAAAATCCCCATAGAGAAAATTCAAGTCAAACCTAATGATACTGTTATTGCACCTAATTGTTTTGGATCGGGGGGAAGTATAACGTCTCAAAATATAGGAATAGGTGTACAGAGATGTTGTGAAGAATTACTTAGAAGACTTGAACCAGTTAGAAACCAGTTGAATAACCCATCTTGGGAGGAATTGGTGAAAAAAGCTTATGAAATGAATGTAGATTTACAAGTACATGATTTGGTAAGTGCTAAAGATGAACAGAAATATAATATCTATGGTGTAACCCTAGCCGAAGTTGAAATAGATGTTCTGACTGGTGAATGGGAAATAATGAGAGTTGATCTAATTGAAGACGTAGGTAGAAGTGTTAACCCTGAATTGGATCTCGGTCAAATTGAAGGTGCTTTTATAATGGGCGTTGGCTATTGGACTACTGAAAATATTGTGTATGGTCCTGAAAATGGGGAAATTCTCACGGACCGTACATGGGAATACTGGGTGCCTGGTCCTAGGGACATTCCCCAGGACTTTCGGGTCTATTTCAGAAAAAGATCTTTCAGTACTGAGAAAATTTTAGGAGCTAAAGCATCTGGTGAACCTGCAACATGTATGGGAATATCAGTGCCATTTGCTATGAGAGCAGCTATAGCTTCAACAAGAAAAGAGTCTGGAATGCCTGAATGGTTTCAAATAGATGGTCCTTTCACCGTTGATAAAATTTATCTTGCATGTGCTACAAAGTTTGAAGATTTTAAGTTTTACTAA

Protein sequence:

>DPOGS208007-PA
MDRVHFRVNGVHCSVGNEVSSSITLLEYLRRHLELRGTKYMCLEGGCGACIVNVTKHPGGESQGVNSCMVPITSCNEWDITTIEGIGNRLHGYHPIQVTLAENNGTQCGYCSPGWVMAMYSILKNKKPTMLEVEQSFGSNICRCTGYRPILDAFKKFASDAHDVLDIEDLEICKKSGRPCAKNSCDESDWCLLSKNELNGKLLHIILNDNRDWFKATCISDIFEIFQKWGTESYMLLAGNTGKGVFPILEYPRVLINVNDVKELRQQYIDQNLVIGGATTLTELINIFDTVGHTEYFGYLLVLKDHLEEVAHITIRNNATVAGNLMLKNFHLDFKSDIFILFETVGVYPILEYPRVLINVNDVKELREHYIDQNLVIGGATTLTELINIFDTVGRVNFFGYLKILNEHLQEVAHIPIRNNATIAGNLMLKNLHPDFKSDIFILFETIGAQLTIQTGRNQLKIITMQSFLSENMHGKILLNVLLPPLSTEHKIVTFKITPRSQNAHALIHAGFLYKVDHNERVLESRIVYGGLSPSYTRSWKTERYLIGKQLLRNETLQGALKVLNTELVVTESLPDPSVQYRRQVALALFYKGLLSLCAQNRLNPRYVSGSSKIHKTRPVSEGTQIFDTNPSLWPLNKPIPKLDGLIQCAGEAKYSEDVPRLPGEVFAAFVLTTVALGKINHIDASRALEEPGVLAFYTAADILGRNSFIPAVNLFNRADEEFLCNGEVKYFNQPLGIIVAECQSIADKAVHLVQVIYSDIKNPVLDIRVAKHDPSKLKLFQTINATSAGTDIAKVIKGEQSIYTQYPFTMETLVTVTHPTEEGLRIYAATQWMDSVHVVISRALLLDQNR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: