MonarchBase - Protein-coding gene

DPOGS209805
Transcript	DPOGS209805-TA	1716 bp
Protein	DPOGS209805-PA	571 aa
Genomic position	DPSCF300117 - 201287-219600
RNAseq coverage	54x (Rank: top 69%)

Annotation
*Heliconius*	HMEL011869	0.0	70.93%
*Bombyx*	BGIBMGA008042-TA	1e-119	80.08%
*Drosophila*	CG11284-PA	8e-41	38.31%
EBI UniRef50	UniRef50_D6W9D1	1e-46	40.87%	Putative uncharacterized protein n=1 Tax=Tribolium castaneum RepID=D6W9D1_TRICA
NCBI RefSeq	XP_001651049.1	1e-50	42.04%	carbonic anhydrase [Aedes aegypti]
NCBI nr blastp	gi\|157110314	2e-49	42.04%	carbonic anhydrase [Aedes aegypti]
NCBI nr blastx	gi\|157110314	1e-49	42.04%	carbonic anhydrase [Aedes aegypti]

Group
KEGG pathway	aag:AaeL_AAEL005520	3e-50
	K01672 (E4.2.1.1)	maps->	Nitrogen metabolism
InterPro domain	[332-555] IPR023561	6.4e-74	Carbonic anhydrase, alpha-class
	[332-555] IPR018433	6.4e-74	Carbonic anhydrase, putative, insect
	[332-565] IPR001148	1.2e-58	Carbonic anhydrase, alpha-class, catalytic domain
Orthology group	MCL16791		Insect specific

Nucleotide sequence:

>DPOGS209805-TA
ATGTTTGCAAAGCCAAAAACTGTTTTTGTATTCCGGTTGCCGACGCAATATCCAATAGTCACTATACCAATTTTGCGGAAGTCTCGCCAATCTACATATTTTGCAAAACGGAAGAAATTGAAGAAGACGAAGAAACTAAATACTAAAGCTCCAGAATTAAAAGAATGGACGTATAAAGATCAGCACGATTGGCCGAGACGCTATCCTGATTGCGGCGGTCGATCGCAATCTCCAGTCAACTTGCCTTATACACCACTCGTAAAGGCTAAAGAAAGCCGACAGCTTATGTTTCTTAACTATGACGTATTACCAAAGAAACTCATGCTGTGCAATGACGGAAAACGAATTGCTTTATATGGAGAATGGAAGCCCATAAATCAGCCTCTTATTTACGGAGGTGCAGCTCATAGCCGTCGATACTTATTTCATTCCTTAACACTTCATCGGCCTTCGGAACACAGAATAGGTGGTCTCCAATTTCCAATGGAAACTCAAGTGCTTTTCATTTCTGCGGAATACAAATCTTTTGCAGAAGCCATCAAAGCTTCCCTTAAAGATGCTCAGGCCTTCCTCGGTATTGTTAATATATACAAGTACGACAACCACACACAGCAAGGCTTGGAAGAATTACTAAAAGCGGGAACCAAACGCTTCAACACCTCCATGTCACTTCTACCATTAGGCTTCTTCACTCCTCCGTTACAGCAATATGCTTGTTATCAAGGATCATTAACTTTTCCCCCTTGCACTGAATCGGTTTTGTGGTTAATAAGAGCGAAGGCTTTACCTATTACAAGGAAGGCTATGGATGCGGCTAGCAGTATTTTTGAAGAAGATCATGTGGGATCTTGTCTAAGAGAACCGCAGCCTCTTAACGATAGAAGATGCAAGTGGTGGTTATTTAAGATGAGATCCAAATCTATTTCGTTAAAAGTAAGCGCATCAAATACCGTCGCTTCAGATGCTGAACAAATATCAAAGCTCAGAGCATCACAGTCGCCGATTGCAATTTCACTCCAACGATGCCCCACTTGGTCCTCTTTAGATCCTCTAGTATTTAAAGGATATTGGGACAATAATTCCAATGGCATTCTTGTCAATACTGGACAAACAGCTTATTTTACATTCGACACACCGTCTCGGCCGCGACTGAGCGGAGGTCCACTTATCGGTGAATATATTTTTGAACAAATGCACTTCCACTGGTCGGTTGATGATTTCACAGGATGCGAACATGTCCTTGACGGTCACGGTTACGCTGCGGAGTGCCACCTTGTACATTACAATAGCAAATACCAGTCACTCGAGGCAGCTGTGCCTCACGCAGATGGTTTGGCTGTAGTTGGATATTTATTGGAAGCAGTCGATGCACCGAACCCGAACTTTGATATGTTCATTGAGGGCTTGGAACAGATTAAGAAACCGGACCACAGTGTTGCTCTATCAGCAGAGTCTTTGGCTTGGATGAACAGAGAGGATGTGACCAACGGTAGCTACGTCACTTACAAAGGATCTTTGACAACGCCACCTTATGGAGAATGTGTCACGTGGATCATTTACGAGAAAGCAGTACAAATTGGTAGCGAACAGCTGGGGCTTTTAAGACAATTGGAAGGAGCAGACAGTGTACCAATTGAGAGAAATGTGAGGCCTACACAGCGGCATCCACCAGGACATTCTGTTATATATGTTAAACAAGTAAAGTCGAAGCTTTGA

Protein sequence:

>DPOGS209805-PA
MFAKPKTVFVFRLPTQYPIVTIPILRKSRQSTYFAKRKKLKKTKKLNTKAPELKEWTYKDQHDWPRRYPDCGGRSQSPVNLPYTPLVKAKESRQLMFLNYDVLPKKLMLCNDGKRIALYGEWKPINQPLIYGGAAHSRRYLFHSLTLHRPSEHRIGGLQFPMETQVLFISAEYKSFAEAIKASLKDAQAFLGIVNIYKYDNHTQQGLEELLKAGTKRFNTSMSLLPLGFFTPPLQQYACYQGSLTFPPCTESVLWLIRAKALPITRKAMDAASSIFEEDHVGSCLREPQPLNDRRCKWWLFKMRSKSISLKVSASNTVASDAEQISKLRASQSPIAISLQRCPTWSSLDPLVFKGYWDNNSNGILVNTGQTAYFTFDTPSRPRLSGGPLIGEYIFEQMHFHWSVDDFTGCEHVLDGHGYAAECHLVHYNSKYQSLEAAVPHADGLAVVGYLLEAVDAPNPNFDMFIEGLEQIKKPDHSVALSAESLAWMNREDVTNGSYVTYKGSLTTPPYGECVTWIIYEKAVQIGSEQLGLLRQLEGADSVPIERNVRPTQRHPPGHSVIYVKQVKSKL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: