MonarchBase - Protein-coding gene

DPOGS215632
Transcript	DPOGS215632-TA	3600 bp
Protein	DPOGS215632-PA	1199 aa
Genomic position	DPSCF300041 - 1879852-1920949
RNAseq coverage	92x (Rank: top 62%)

Annotation
*Heliconius*	HMEL008542	0.0	69.08%
*Bombyx*	BGIBMGA003532-TA	0.0	82.72%
*Drosophila*	NnaD-PA	2e-90	41.05%
EBI UniRef50	UniRef50_E0VQZ7	0.0	44.41%	Putative uncharacterized protein n=2 Tax=Neoptera RepID=E0VQZ7_PEDHC
NCBI RefSeq	XP_624180.2	0.0	43.17%	PREDICTED: similar to ATP/GTP binding protein 1 [Apis mellifera]
NCBI nr blastp	gi\|350413047	0.0	42.75%	PREDICTED: cytosolic carboxypeptidase 1-like isoform 2 [Bombus impatiens]
NCBI nr blastx	gi\|350413047	0.0	43.07%	PREDICTED: cytosolic carboxypeptidase 1-like isoform 2 [Bombus impatiens]

Group
Gene Ontology	GO:0006508	3.3e-20	proteolysis
	GO:0008270	3.3e-20	zinc ion binding
	GO:0004181	3.3e-20	metallocarboxypeptidase activity
KEGG pathway
InterPro domain	[906-1144] IPR000834	3.3e-20	Peptidase M14, carboxypeptidase A
Orthology group	MCL16243		Patchy

Nucleotide sequence:

>DPOGS215632-TA
ATGGCGGACGACGCGGGCGACTGCCTGTTCGAGCGGCTCCGACTGCACCAGCAACGCGCCCCGGACGCGACTGAGGTCGCGCGTGCTATCACAGCTAGAATCAACTCGCGTCTCACATCACACGACAAACACATCCGACAGAGCACTCTTGACAAACTATGGAACAAGCAAACTGGTGCGATACAAATGCTTCTATCTATATTAGAGAATTCAAGAGATACAGCGACATCAACCTATATAACATCAATATTTAGAGAAGCTCTCTGCCTTAAACAAGGAAAAGGAAAAAAATGTTCAGTAGCGAATGAAGCCTTGGGGTCGAAAAAGAAGGAAAGCAAAAAAGGCAAAGAAAATAAAACACCACTGAATAAAAAGGCAAACAACGTAGCGCGACAGCAGTGCTCACAACAATTCATCGCCCTAAACGGCACGCAAGCGGTGATACGTACACTACTTGCCACACATAGCAAACGCGACAGCAATGTTAGCACGGAACTAATGCTACAAGACCTCGTCTGGATACTTGCAGCACTTGCTCCAAGAGCAAACAACATACAACGGCAGCAATGTGCGCAGGATTTTGTGGAAATGAAAGGAACACAGACCATTATTAGACGAGTGATATCAACGGTCCATGATAAGAGGGAGCATCATGCTGGGGTGGAATTAGTATTAAATGATCTGGTGTGGATTCTCGCTCCGTTGGGGTCAAAAGATCCAAAATTTGCAATGAAGGTGAGAATGTTAGGATGCGTTAGGACGATGCATCTAATTTTGAAAGGACATTTCACTGACAATAAGTTGATATTTCCACTATTAGTCATCATGAAACAGCTAGCCAAAAATTCCGTAACAACTTCCATTTTAATACGCGACGGAGTCATCGCGACTTACGATCGAGTGTTAATAAGTCTAGGCTTCATTCCTACAGCGAGACTGAGACTCTGTTTGGACGCTATAGACTACTTTAGCAAGAACAAGGTGTGCTGCATGCAGATTGTGAAGACAGGACTGTGTGGAGTGCTAATAAGAGTGTTCGACCGCTGGGACCGCTACGAGGGGCGCATGAGGCTCAAGATATGCGCACACATCCTCCAGACATTACAGCACCTCTGCAACATCAAGGCTGGACGTCGTGCTCTTTGCACCAAGAAGCACGTGCAGACCCTCCACAGGTTCTGTTCCCAGTGTCCTGATGAAATCGAGTTCGACGGACTGTTGGCTAGAGTCTGTTCCGTCATAACATTGTGTCTCAAGCATCAGGCATTACCAGTGCCATCATCTAGTCCAGCTACCTTCAACCTGAACCCTATACTTAAAGGAACAAATACCACATGGCCATGTCACGAAGATGATGATGACGGCGGAAACTCAGACTCGAAGACAATCAATTCGGATTTGGAAGACGATGCTCCTGACAGTGATAACGAGGTCATTGATGACTTCCCAGATATTGATTTCGAAGAAAATGACTTAAAGAATAATGAAGATTTGGAGAAATCACATACAAAAAGTGGGGAGAGCATACAGAGTGCACTGTGGATCAATCCCAATGAGAGAGATATCGAAGACTTAAAGAGATACTATATTTTCTTCAAGGAGTTCGGTTCCTATAACAAGCAAATAAGGTTGGTAAAAAGCCGGTCCAATTCCCGGGGGTCCATACTAGATGACATTTTTATATCTCAAAATAGCGCTAACCGAAGCCAGCCGTCGCCGACAAATCTTTCTTTAACTGCAGTACTTGGGAATACCGACTACGACAGCGCTTTAGGATCATCTCAAACGCTTTCATTCCTGCAAGGATATCATAAGATACACGAAAGCACTTCGACAACATCTTGTTCTTCCTTAAAAATCCATAAAGATATATCAAAATACAGTCCGCTCGAGTCAGTTTATTCAATAATATCATCGAGAGTTAAAAGCATCATTCCATTTGTAAAAGTTGCCTACCCAGATATGACAGGCGGGCAGGGTGCAACACAACCAGAGCCATTAAATAAAATGGAGAGAACAGCTTGCAGAAATAAATTACTCGCTTGCGTCGAGAGAGCAATTAATCCGGAAGCGTATATGAATGAAGTTGTGTATGATCTGGATGCTTTGAACAGTTCGAGCTCAAACGCAGACACGACTTCGCAGAAAAGTTTAAGCAACGAGAGTTTATTTTTAATTAACACCGACGAACAAGAAATAACAAAAGTCAATAGTTTCTCATCGAGACTAAATTTTGAATCGAGATTTGAGTCGGGAAATTTAAGAAAAGCCATACAGGTAGGTCCAAGAGAATATGAATTAATTTTAATGCCAGACGTAAATTCTCCAAAACGGCATCAGTGGTTTTACTTCGAAGTGCGTAATATGCAACAGGGACGGCCCTATATATTTAATATTGTGAATTGTGAGAAATCAGATAGCCAATTCAACTTCGGCATGAAGCCTGTTATGTATTCTGTGAAGGAAGCCGTCCTTGGAAGACCCGGGTGGGTGAGAGCCGGTTCGGACATTTGCTATTACAGGAACAGCTACCACTATTCCAATCAAAGAAACAACAAGTGCTACCTAACAGTTACGTTCAACATCGACTTTCCCCACACAAACGACGTCTGCTACCTCGCTTACCACTTCCCATTCACTTACTCCATGATGATGACTAGAATTTTCCAATGGAGTTCTCAATTGCCTCCTGGCGCTTATCTACGAGCTGAGCCCTTATGTTATACACTTAACAACAACGAAGTTCCTCTGTTGACTATATCAGCTGATGATACTCCGTCCAATCCCATAGTTGACAGGGAGATAGTATTCCTTACGGCTCGAGTCCACCCTGGTGAAAGCAACGCGTCCTGGGTAATGGATGGAACGCTGCGTTTCCTGCTCACAGACACTTCATCCGCAGCGGCCCTCCGTAACAAGTACGTGTTCAAAATCGTGCCGATGCTCAACGTCGAAGGTGTCGTTAATGGCTGCCATCGATGCGGCTTAACTAATGAAGATTTAAATCGACGCTGGTGCAAGCCGAGCCCCGTTTTGCATCCTTCTATTTACCATACCAAGGGCTTAATAGAATATTTGGTGCGTGTTTGGAAGAAACCTCCGGTAGTTTATTGCGACTACCACGGTCATTCGCGCAAGAAGAACGTGTTCTTTTACGGTTGCGCCGGCGCAGAGAGCTGGTGCAGCAACGACCGGCTTGTCCCGGACGAGCCTGTTAAATATCTCATGCTTCCAGCTTTAATGCACCGGCTATCACCGGCGTTCGCTCTTGGTTCGTGTTCCTTTCGTGTTGAACGTGAGCGTGAGAGCACAGCGCGAGTCACTGTGTGGCGCCACCTAGGAGTCACACGGTCCTACACTATGGAAGCATCATTTTGTGGATTTGATAGGGGACCGTTTAAAGGATTTCATCTCAACACCCAGCATCTGCAGAGCGTGGGCAGTGACTTTTGCGAAGCTCTCAACGGTCTCGGAGATACAGCCAACAATGTTGACATACAACTCACTAAAGATCTCAATGGCGAAATAGCAATAGACAGTGAAGCTGGCTCGGGGTCGGACAGCGTGTTGAAAACAGATTCGGATGAAGATTTCGATTAG

Protein sequence:

>DPOGS215632-PA
MADDAGDCLFERLRLHQQRAPDATEVARAITARINSRLTSHDKHIRQSTLDKLWNKQTGAIQMLLSILENSRDTATSTYITSIFREALCLKQGKGKKCSVANEALGSKKKESKKGKENKTPLNKKANNVARQQCSQQFIALNGTQAVIRTLLATHSKRDSNVSTELMLQDLVWILAALAPRANNIQRQQCAQDFVEMKGTQTIIRRVISTVHDKREHHAGVELVLNDLVWILAPLGSKDPKFAMKVRMLGCVRTMHLILKGHFTDNKLIFPLLVIMKQLAKNSVTTSILIRDGVIATYDRVLISLGFIPTARLRLCLDAIDYFSKNKVCCMQIVKTGLCGVLIRVFDRWDRYEGRMRLKICAHILQTLQHLCNIKAGRRALCTKKHVQTLHRFCSQCPDEIEFDGLLARVCSVITLCLKHQALPVPSSSPATFNLNPILKGTNTTWPCHEDDDDGGNSDSKTINSDLEDDAPDSDNEVIDDFPDIDFEENDLKNNEDLEKSHTKSGESIQSALWINPNERDIEDLKRYYIFFKEFGSYNKQIRLVKSRSNSRGSILDDIFISQNSANRSQPSPTNLSLTAVLGNTDYDSALGSSQTLSFLQGYHKIHESTSTTSCSSLKIHKDISKYSPLESVYSIISSRVKSIIPFVKVAYPDMTGGQGATQPEPLNKMERTACRNKLLACVERAINPEAYMNEVVYDLDALNSSSSNADTTSQKSLSNESLFLINTDEQEITKVNSFSSRLNFESRFESGNLRKAIQVGPREYELILMPDVNSPKRHQWFYFEVRNMQQGRPYIFNIVNCEKSDSQFNFGMKPVMYSVKEAVLGRPGWVRAGSDICYYRNSYHYSNQRNNKCYLTVTFNIDFPHTNDVCYLAYHFPFTYSMMMTRIFQWSSQLPPGAYLRAEPLCYTLNNNEVPLLTISADDTPSNPIVDREIVFLTARVHPGESNASWVMDGTLRFLLTDTSSAAALRNKYVFKIVPMLNVEGVVNGCHRCGLTNEDLNRRWCKPSPVLHPSIYHTKGLIEYLVRVWKKPPVVYCDYHGHSRKKNVFFYGCAGAESWCSNDRLVPDEPVKYLMLPALMHRLSPAFALGSCSFRVERERESTARVTVWRHLGVTRSYTMEASFCGFDRGPFKGFHLNTQHLQSVGSDFCEALNGLGDTANNVDIQLTKDLNGEIAIDSEAGSGSDSVLKTDSDEDFD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: