MonarchBase - Protein-coding gene

DPOGS208843
Transcript	DPOGS208843-TA	1002 bp
Protein	DPOGS208843-PA	333 aa
Genomic position	DPSCF300036 + 877164-880012
RNAseq coverage	271x (Rank: top 40%)

Annotation
*Heliconius*	HMEL015423	2e-155	78.68%
*Bombyx*	BGIBMGA007949-TA	9e-125	79.49%
*Drosophila*	Pbgs-PA	4e-109	55.83%
EBI UniRef50	UniRef50_E0VHL1	2e-110	56.17%	Delta-aminolevulinic acid dehydratase n=3 Tax=Coelomata RepID=E0VHL1_PEDHC
NCBI RefSeq	XP_001847346.1	2e-119	65.11%	delta-aminolevulinic acid dehydratase [Culex quinquefasciatus]
NCBI nr blastp	gi\|170039024	3e-118	65.11%	delta-aminolevulinic acid dehydratase [Culex quinquefasciatus]
NCBI nr blastx	gi\|158287863	3e-113	63.24%	AGAP010935-PA [Anopheles gambiae str. PEST]

Group
Gene Ontology	GO:0046872	4.4e-182	metal ion binding
	GO:0033014	4.4e-182	tetrapyrrole biosynthetic process
	GO:0004655	4.4e-182	porphobilinogen synthase activity
	GO:0008152	2.7e-112	metabolic process
	GO:0003824	2.7e-112	catalytic activity
KEGG pathway	cqu:CpipJ_CPIJ006003	5e-119
	K01698 (E4.2.1.24, hemB)	maps->	Porphyrin and chlorophyll metabolism
InterPro domain	[3-330] IPR001731	4.4e-182	Tetrapyrrole biosynthesis, porphobilinogen synthase
	[15-331] IPR013785	2.7e-112	Aldolase-type TIM barrel
Orthology group	MCL13776		Single-copy universal gene

Nucleotide sequence:

>DPOGS208843-TA
ATGAACCCTTTATTTTTAAGTCCGGAACATGTCCTACAAGGAGGATATTTTAATGCAACTCTACGAAAGTTGCAAGAGCCCAATACTACAATTGAACCTCATAACTTGATGTACCCAATTTTTCTCTTAGAAAATGAGGATGCTATGCAATCTGTATCAAGTATGCCAAATGTTTATCGTTATGGAATAAACAAACTGATTCCAGCACTTGTGGAACTGGTGGAACAGGGTCTGAAATCCATCCTTATATTTGGTATTGTTGAAACACTACCCAAGGATGCAAGAGGCTCAAGTGCAGATTGTTCCGAGAATCCCGTAGTGAAGGCCTTGCCCAGGATTCTCGAAGCCTGCCCGAATCTGACAATAGCTTGCGATGTGTGCCTCTGTCCTTACACCTCACATGGTCATTGTGGCTTATTAACTGAGAATGGGGTTATCGACCATGCTGCCTCCGTGAAGAGAATTGCCGAGGTGGCTTTAGCATATGCAAAAGCTGGTGCTCATATTGTGGCACCTTCTGATATGATGGACAACAGAATTAAGGCCATCAAAGATGCTCTCGTAGAGAATAAACTTCAGAATCAGGTGTCGGTGTTGTCCTACTCGTGCAAATTCGCGTCTTCCATGTACGGTCCGTTCCGTGACACTATGAAGAGTTCCCCAATGGCTGGTGACCGGAAGTGCTACCAGCTGCCCCCCGGCAGTGCTGGACTGGCGGCGCGGGCTGCGGCACGTGACGTCAGCGAGGGCGCCGACTTCCTGATGGTGAAGCCGGGTCTACCTTACCTGGACATAGTGCGTCAGACCAAGGACAAGTATCCGCATCATCCACTCTTCATTTATCAGGTATCCGGCGAGTACGCTATGATCTCGCGTAACGGAGACTCCTCGGAAGTGGAGAGCACTCTCATGGAAACACTCACGTGCATGCGGCGAGCTGTATACGACTGTATCATCACGTACTTCGCGCCGCTCGTTTTAAACATACTGTCTAGAAAATAA

Protein sequence:

>DPOGS208843-PA
MNPLFLSPEHVLQGGYFNATLRKLQEPNTTIEPHNLMYPIFLLENEDAMQSVSSMPNVYRYGINKLIPALVELVEQGLKSILIFGIVETLPKDARGSSADCSENPVVKALPRILEACPNLTIACDVCLCPYTSHGHCGLLTENGVIDHAASVKRIAEVALAYAKAGAHIVAPSDMMDNRIKAIKDALVENKLQNQVSVLSYSCKFASSMYGPFRDTMKSSPMAGDRKCYQLPPGSAGLAARAAARDVSEGADFLMVKPGLPYLDIVRQTKDKYPHHPLFIYQVSGEYAMISRNGDSSEVESTLMETLTCMRRAVYDCIITYFAPLVLNILSRK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: