MonarchBase - Protein-coding gene

DPOGS208933
Transcript	DPOGS208933-TA	3156 bp
Protein	DPOGS208933-PA	1051 aa
Genomic position	DPSCF300009 + 63411-72424
RNAseq coverage	367x (Rank: top 32%)

Annotation
*Heliconius*	HMEL004758	0.0	64.32%
*Bombyx*	BGIBMGA002404-TA	0.0	74.89%
*Drosophila*	NnaD-PA	9e-33	27.78%
EBI UniRef50	UniRef50_D7EIR9	6e-130	63.41%	Carboxypeptidase A n=1 Tax=Tribolium castaneum RepID=D7EIR9_TRICA
NCBI RefSeq	XP_967549.1	1e-130	63.41%	PREDICTED: similar to ATP/GTP binding protein-like 5 [Tribolium castaneum]
NCBI nr blastp	gi\|91093643	2e-129	63.41%	PREDICTED: similar to ATP/GTP binding protein-like 5 [Tribolium castaneum]
NCBI nr blastx	gi\|91093643	4e-125	63.41%	PREDICTED: similar to ATP/GTP binding protein-like 5 [Tribolium castaneum]

Group
Gene Ontology	GO:0006508	1.5e-19	proteolysis
	GO:0008270	1.5e-19	zinc ion binding
	GO:0004181	1.5e-19	metallocarboxypeptidase activity
KEGG pathway
InterPro domain	[195-311] IPR000834	1.5e-19	Peptidase M14, carboxypeptidase A
Orthology group	MCL16166		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS208933-TA
ATGGATCGCAATAATATAATAGAGTGCGGCGGATTTTACTTTATACACAATTTTGACTCAGGGAATTTAGGGCATGTAGAACGAGTGCCCACAGAATTTATTGCTCCAACGTTAAATCCGAAAACAAATGTTTCGGAGACTCCCGATTATGAGTTTAATTTATGGACGCGACCTGATTGCGCTGGCACAGAATTCGAGAATGGCAATCGAACTTGGTTTTATTTTGGCATACAAGCCAGTGAGCCTAATGTACAGGTGCGACTTAACTTGATCAACCTTAACAAACAAGGCAAGATGTATAACCAGGGTATGGCTCCAGTGACACGGACCCTTCCAGGGAAGCCACAGTGGGAAAGGATAAGGGATCGTCCAGTGCATTCAACAGATGACAACACATTTACACTGTCTTTCCGATATAGAACATCAGATAATCCGAAAGCTACAACCTTCTTTGCATTCACATACCCATTCTCATTTGCCGAGCTACAAATAGCTCTGAACTCTATTGATCTTAAAATGTTGCCAGTCCCGCCACCTCAATCACCTGATGATATATATTATTGCAGAGAATGTTTAATATATTCATTAGAAGGAAGGCGTGTAGACTTATTGACAATTTCATCCCACCATGGTATAACAATGGAGCGAGAGGACAGATTAAAGAATTTGTTCCCAGAAAATCAGGAGAGGCCTTTCAAATTCCAAAATAAGAAGGTCATATTTATATCTGCTCGGGTGCATCCAGGAGAAACTCCATCGAGCTTTGTGTTCAACGGATTCCTAAACTTACTACTGACAAGAAACGATCCAATTGCAATCCAATTGAGGAAACTCTATGTGTTCAAAATGATTCCGTTTTTAAACCCAGATGGTGTTGCCAGGGGTCATTACAGAACCGATACTAGGGGGGTTAATTTAAACAGGGTCTATTTGAATCCATCACTTCTCTATCATCCCACTGTGTATGCATCAAGGTCTCTTATAAGATATCACCATTTTGGATTTGAGAAAGATGAAGATAATTGTGAGGATATTAAGAGCTTTGCATCCCGCAGCATACAGAACATTAGTGAAAGTGTTGAGCTGGTTGAAACGAAGAAAAAGAAATCCCCCGGTTCCCCAAACATCAAGGGTGACTTCAAGCGTGACAAGGCAAAGACACAACCAGCAAAGCCGTCAGCTCTGTACTCAGAAGACCACAGCAGGGACGAGTTCAGTGGAGACGCCGCCAACTTAGCCGATCAGGTCCTCGACATGAAGCTCCAAGAGATGCCATCACAAACAGACAATATATCCTCGAATCCGTCTAACGCTAACCTGGAGGAGAGCTCGTGTCTCCTCAACGATAACGTGCTGCGGTCGTGTCTGGGGTCTAACGTTCACCTCAGCACGAGCGAGGAACTCACTATAAACGGCCTCAACCCCCTGAAGCCGCTGAGGGATACTTTGAAGAACAGCATCAGTCTACTCATGGAGTCCAGCTCGTCCGTCGCCGGTGAGAGTATTTCGCAGGAACTTCCTGTAGTGAAGATGGGCTATTGTAAAGTGTGCCGAAGGGACAGGGAGTCGATGCTGTCCGACCTGCCATCGTATAGGAATATCGAGGAGTACGGAGAACATCAGAGACAAAAAATAGACACTAAGGAGCAGAAGGTCGACGACCTTGAAGTTATCGAGGGTTCGGTGAACGTGTTCTTCTGTACGAACTGCTTCAAGCGATACATTGTGACGGAGGGCAACGAGGAAATTGCGACCGCTACGTCTTCAGGTGATTGTGTGGAGGGCCCCCCTCTATCTCCAAGGCCTCCGCCTCCGGAACGCCCTCAGACGCGTTCCCCCGCCGGCAGCACTGGGGACTCGTTGCCGCCAGCGACGGTCCGAAAGGTCGACAAACCGAAGTCAGCTCCTAAGTCGTCTAAGAAGAGGTCCCCGGCCGTGACCGCAACCACGGCCCCCTCCCCCGCCGCAGCACCCACCGTCTTGAGACCGCACAAGGACGTCGAGTCCGGCCTGTACCTTTATATAGATCTACACGGACACGCCTCTAAGAAAGGCATCTTCATGTACGGCAACCACTTTGAGGACCTGGAGAGTTCGGTGGAGTGCATGTTGCTGCCTCGCATCATGTCGCTCAACAACCTGCACTTCCACTTCTCGTCCTGCAACTTCACCGAGAGGAACATGTATCTGAAGGACCGTCGCGACGGCATGTCCCGCGAGGGCTCGGGTCGCGTGGCCGTGCTGAAGGCCACCGGTCTGGTCCGCTCCTACACCCTGGAGTGCAACTACAACACGGGCCGCCTGGTGAACGTGCTGCCGCCGCCCTGCCGCGAGCCCGCCGCCACCGCCCAGCCCGCGCCCCCGCCACCCAAGTACACGCCGCACATCTTTGAGGAGGTAAACCCGTTCCAGGTCGGGCGATCTCTCGGAGCGTCCATACTTGATCTGACGGGGCAGCATCCTAACTCGCGAATCCCGTGCTCCGAACATCGTAATCTGGCTGCCGTGCGCGACTGGCTCAGGACGCACTCGAGGACCGCGCGCCCTCAGTTGACTATGTCGAGACTGCGGCCGAAGACTTCCTCCCCGACGAGGATGCCGTTGTTCGCGCGCTCCAAGGCCAAGGTGACGGACGAGAGGAAAGAGAACGCGTACATAGCGGCAAAGAGCGACACGGAAAGGCGCCGCAGCCCGCCCATACTGGCACCGCGCTCAGGGCTCGACCTCACAAACCTCAACACCAAGTTCGGCAAGAAAAACGAACCAGCAAAATCGTCATCACGAACACGCTACCTGGCAGACAGCGAGCCGAAACCTAAGACGCTATCCACCAAGAGGCGCAACGTCCTCGCTATCAGGAAACCAAATACAAGCAAGACGCAGATGAGCGGCATTGTGAAGGCGAAGGCGAACCGAAGAGCCGCGGACGATTCAGACGACCGAGCGACATCCGCCAAGCTCGGCAAGCGAGGGTATGTCCGTCCAGGGAGAGCGAGGCGCCAACCGACATCCACTTCTTCATCAGAGGCCGCCGGAGGCTCCAGCTCTTGGGAGGCGGGCGGTTCCCACGAGACAGCCTTGGCCGCTAAGAGGCGGCAGTTCCCGAACCCCGCGCCCTCACACCTCAAGAAGATACGCCTCAAGAACGGCTTGTAG

Protein sequence:

>DPOGS208933-PA
MDRNNIIECGGFYFIHNFDSGNLGHVERVPTEFIAPTLNPKTNVSETPDYEFNLWTRPDCAGTEFENGNRTWFYFGIQASEPNVQVRLNLINLNKQGKMYNQGMAPVTRTLPGKPQWERIRDRPVHSTDDNTFTLSFRYRTSDNPKATTFFAFTYPFSFAELQIALNSIDLKMLPVPPPQSPDDIYYCRECLIYSLEGRRVDLLTISSHHGITMEREDRLKNLFPENQERPFKFQNKKVIFISARVHPGETPSSFVFNGFLNLLLTRNDPIAIQLRKLYVFKMIPFLNPDGVARGHYRTDTRGVNLNRVYLNPSLLYHPTVYASRSLIRYHHFGFEKDEDNCEDIKSFASRSIQNISESVELVETKKKKSPGSPNIKGDFKRDKAKTQPAKPSALYSEDHSRDEFSGDAANLADQVLDMKLQEMPSQTDNISSNPSNANLEESSCLLNDNVLRSCLGSNVHLSTSEELTINGLNPLKPLRDTLKNSISLLMESSSSVAGESISQELPVVKMGYCKVCRRDRESMLSDLPSYRNIEEYGEHQRQKIDTKEQKVDDLEVIEGSVNVFFCTNCFKRYIVTEGNEEIATATSSGDCVEGPPLSPRPPPPERPQTRSPAGSTGDSLPPATVRKVDKPKSAPKSSKKRSPAVTATTAPSPAAAPTVLRPHKDVESGLYLYIDLHGHASKKGIFMYGNHFEDLESSVECMLLPRIMSLNNLHFHFSSCNFTERNMYLKDRRDGMSREGSGRVAVLKATGLVRSYTLECNYNTGRLVNVLPPPCREPAATAQPAPPPPKYTPHIFEEVNPFQVGRSLGASILDLTGQHPNSRIPCSEHRNLAAVRDWLRTHSRTARPQLTMSRLRPKTSSPTRMPLFARSKAKVTDERKENAYIAAKSDTERRRSPPILAPRSGLDLTNLNTKFGKKNEPAKSSSRTRYLADSEPKPKTLSTKRRNVLAIRKPNTSKTQMSGIVKAKANRRAADDSDDRATSAKLGKRGYVRPGRARRQPTSTSSSEAAGGSSSWEAGGSHETALAAKRRQFPNPAPSHLKKIRLKNGL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: