MonarchBase - Protein-coding gene

DPOGS215999
Transcript	DPOGS215999-TA	1008 bp
Protein	DPOGS215999-PA	335 aa
Genomic position	DPSCF300078 + 326572-337072
RNAseq coverage	22x (Rank: top 79%)

Annotation
*Heliconius*	HMEL021815	9e-83	71.30%
*Bombyx*	BGIBMGA000934-TA	1e-128	84.62%
*Drosophila*	CG32698-PA	4e-138	75.25%
EBI UniRef50	UniRef50_Q9W316	6e-136	75.25%	CG32698 n=12 Tax=Arthropoda RepID=Q9W316_DROME
NCBI RefSeq	XP_972474.2	1e-142	84.12%	PREDICTED: similar to CG32698 CG32698-PA [Tribolium castaneum]
NCBI nr blastp	gi\|189236678	2e-141	84.12%	PREDICTED: similar to CG32698 CG32698-PA [Tribolium castaneum]
NCBI nr blastx	gi\|189236678	7e-142	84.12%	PREDICTED: similar to CG32698 CG32698-PA [Tribolium castaneum]

Group
Gene Ontology	GO:0008270	4.9e-168	zinc ion binding
	GO:0006730	4.9e-168	one-carbon metabolic process
	GO:0005576	4.9e-168	extracellular region
	GO:0004089	4.9e-168	carbonate dehydratase activity
KEGG pathway	ptr:740899	3e-40
	K01672 (E4.2.1.1)	maps->	Nitrogen metabolism
InterPro domain	[22-316] IPR018347	4.9e-168	Carbonic anhydrase, CAH2-like, metazoa
	[22-316] IPR023561	4.9e-168	Carbonic anhydrase, alpha-class
	[31-295] IPR001148	1.6e-78	Carbonic anhydrase, alpha-class, catalytic domain
Orthology group	MCL12344		Single-copy universal gene

Nucleotide sequence:

>DPOGS215999-TA
ATGACGACTATAGAAGATAAAAGAAATATTCACAATGAGCTCAACTTAATTTCGTCTGGTTTGATTGCAGCCGTGAGTGGCGTCAGCTGGGAGGAATGGTGGACCTACGACGGCATTTCAGGTCCGGCGTTTTGGGGTCTGATCAATCCGGAATGGTCGCTATGCAACAAGGGACGGAGGCAATCCCCCGTCAACCTCGAGCCCGAGAAGTTACTCTTCGATCCGAACCTGAGATTTTTACATATAGATAAGCATAGAATAAACGGACTGATCAGCAACACTGGCCACTCGGTAATATTCACCGTGGAAAATGAGACTCGCCATCACATAAACATAACGGGTGGACCCCTCTCTTATAAATATCAATTTCATGAAATCCATATTCATTATGGATTACACGATCAATTTGGATCGGAGCACGCTGTCAATGGCTATTCCTTTCCCGCTGAGATACAAATATTTGGTTTCAATTCACAGCTTTATTCAAACTTCTCAGAGGCTTTACATAAAGCTCAAGGAATTGTTTCCATTTCTTTACTCCTGCAGCTAGGGGATTTATCGAATCCCGAGTTAAGAATATTGACAGAGGAGTTAGAAAATATAAAGTACGGAGGCGCCGAGATGCCTGTCAACCGGCTGTCAGTGAGGGGTCTTCTGCCCGATACGGACTATTACATGACGTACGACGGATCAACCACAGCCCCCGCCTGCTACGAGACTGTTACCTGGATAATAATTAACAAACCCATTTACATAACGAAACAACAGCTGCACGCCCTGAGGCGATTGATGCAGGGCGACGCGAGGCACCCGAAGGCCCCGCTCGGGAATAATTTCAGGCCCCCTCAACCACTACACCACCGGGCAGTTAGAACTAACATTGACTTTGACTTGAGCAAGTACCCAGGCAAGACATGCCCCAGCATGCACCGAGACATGCATTACAAGGGTGACGAAAAGTTGGACGCAGTATTGAATATTGGACGCAGTATTGTTTGGTTTCGGTAG

Protein sequence:

>DPOGS215999-PA
MTTIEDKRNIHNELNLISSGLIAAVSGVSWEEWWTYDGISGPAFWGLINPEWSLCNKGRRQSPVNLEPEKLLFDPNLRFLHIDKHRINGLISNTGHSVIFTVENETRHHINITGGPLSYKYQFHEIHIHYGLHDQFGSEHAVNGYSFPAEIQIFGFNSQLYSNFSEALHKAQGIVSISLLLQLGDLSNPELRILTEELENIKYGGAEMPVNRLSVRGLLPDTDYYMTYDGSTTAPACYETVTWIIINKPIYITKQQLHALRRLMQGDARHPKAPLGNNFRPPQPLHHRAVRTNIDFDLSKYPGKTCPSMHRDMHYKGDEKLDAVLNIGRSIVWFR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: