MonarchBase - Protein-coding gene

DPOGS213760
Transcript	DPOGS213760-TA	867 bp
Protein	DPOGS213760-PA	288 aa
Genomic position	DPSCF300212 - 274276-282590
RNAseq coverage	370x (Rank: top 32%)

Annotation
*Heliconius*	HMEL012807	1e-107	74.52%
*Bombyx*	BGIBMGA009245-TA	5e-146	96.80%
*Drosophila*	CG1402-PB	2e-117	70.76%
EBI UniRef50	UniRef50_Q9W3P7	3e-115	70.76%	CG1402 n=42 Tax=Pancrustacea RepID=Q9W3P7_DROME
NCBI RefSeq	XP_001870284.1	8e-123	72.20%	carbonic anhydrase [Culex quinquefasciatus]
NCBI nr blastp	gi\|347964361	8e-122	72.56%	AGAP000715-PA [Anopheles gambiae str. PEST]
NCBI nr blastx	gi\|347964361	3e-121	72.56%	AGAP000715-PA [Anopheles gambiae str. PEST]

Group
Gene Ontology	GO:0008270	3.5e-144	zinc ion binding
	GO:0006730	3.5e-144	one-carbon metabolic process
	GO:0005576	3.5e-144	extracellular region
	GO:0004089	3.5e-144	carbonate dehydratase activity
KEGG pathway	isc:IscW_ISCW015100	2e-33
	K01672 (E4.2.1.1)	maps->	Nitrogen metabolism
InterPro domain	[2-287] IPR018347	3.5e-144	Carbonic anhydrase, CAH2-like, metazoa
	[2-287] IPR023561	3.5e-144	Carbonic anhydrase, alpha-class
	[2-242] IPR001148	3.2e-68	Carbonic anhydrase, alpha-class, catalytic domain
Orthology group	MCL16838		Insect specific

Nucleotide sequence:

>DPOGS213760-TA
ATGTGTAACAAGGGCCGGCGGCAGAGTCCCGTCAACATAGAACCCGATAAATTACTCTTTGACCCCTGGCTGAGAGACATACAGTTTGATAAACATAAGGTCAGCGGTGTTCTTCAAAACACTGGCCAATCACTGGTCTTCCGAGTCGAAAAGGACAGCAAACACCAGGTCAACATTAGCGGTGGGCCACTGTCTTACAGATACCAGTTCGAGGAGATATATTTCCATTATGGTTTGGAAGACAACCGGGGCTCTGAACACCAGATTGATCATCATACCTTTCCTGGAGAGATACAGTTATACGGCTTCAACAAGGAATTATATCATAACATGTCAGAAGCGCAACACAAGTCCCAGGGGGTGGTAGGAATATCACTAATGGTTCAAATAGGAGAACCTACTAATAAGGAACTGCGTCTTATAACCAGCGCCTTCAACAAAGTTACTTACAGAGGCAGTTCCTTCGCCATAAAACACCTACCGCTTAGTTCGTTGCTACCCAATACGCAGCAATATCTCACGTATGAAGGTTCCACCACTCACCCAGGATGCTGGGAGACCGCTGTTTGGATCATCTTCAACAAACCGATCTATATATCAAAGCAAGAGATGTACGCAATTCGTCGTCTGATGCAAGGGTCTCAACTGACCCCAAAGGCCCCATTGGGAAATAATGCTCGCCCGGTTCAGCCTCTGCACCATCGCACTGTCAGGACAAATATCAACTTCAACAAGCAAGGGATGCCGGTATCGAGTAACTGTCCTGATATGTATAGAAATATGCATTACACAGCTACTCAGTGGCCAAGAGAGCACAGCATGAGATACAGGAGCACTGAGGACCTGGCGATGCTGTCATTAAATTAG

Protein sequence:

>DPOGS213760-PA
MCNKGRRQSPVNIEPDKLLFDPWLRDIQFDKHKVSGVLQNTGQSLVFRVEKDSKHQVNISGGPLSYRYQFEEIYFHYGLEDNRGSEHQIDHHTFPGEIQLYGFNKELYHNMSEAQHKSQGVVGISLMVQIGEPTNKELRLITSAFNKVTYRGSSFAIKHLPLSSLLPNTQQYLTYEGSTTHPGCWETAVWIIFNKPIYISKQEMYAIRRLMQGSQLTPKAPLGNNARPVQPLHHRTVRTNINFNKQGMPVSSNCPDMYRNMHYTATQWPREHSMRYRSTEDLAMLSLN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: