MonarchBase - Protein-coding gene

DPOGS200623
Transcript	DPOGS200623-TA	1569 bp
Protein	DPOGS200623-PA	522 aa
Genomic position	DPSCF300076 + 211579-217204
RNAseq coverage	160x (Rank: top 52%)

Annotation
*Heliconius*	HMEL003145	5e-159	86.67%
*Bombyx*	BGIBMGA008910-TA	0.0	66.15%
*Drosophila*	CG3108-PA	2e-115	48.43%
EBI UniRef50	UniRef50_Q60F93	0.0	66.15%	Molting fluid carboxypeptidase A n=5 Tax=Neoptera RepID=Q60F93_BOMMO
NCBI RefSeq	NP_001036933.1	0.0	66.15%	molting fluid carboxypeptidase A [Bombyx mori]
NCBI nr blastp	gi\|112983046	0.0	66.15%	molting fluid carboxypeptidase A precursor [Bombyx mori]
NCBI nr blastx	gi\|112983046	0.0	66.15%	molting fluid carboxypeptidase A precursor [Bombyx mori]

Group
Gene Ontology	GO:0006508	6.1e-138	proteolysis
	GO:0008270	6.1e-138	zinc ion binding
	GO:0004181	6.1e-138	metallocarboxypeptidase activity
	GO:0004180	3.6e-13	carboxypeptidase activity
KEGG pathway
InterPro domain	[227-507] IPR000834	6.1e-138	Peptidase M14, carboxypeptidase A
	[87-175] IPR009020	9.6e-15	Proteinase inhibitor, propeptide
	[87-172] IPR003146	3.6e-13	Proteinase inhibitor, carboxypeptidase propeptide
Orthology group	MCL11156		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS200623-TA
ATGGCAAAGCTCTGGTGGACGGTCGTGTGCCTCCTCGCATCCTTGGAGCTCTGCACTCCGCTTATAAACGAATTGCAACCGGGTAAAGAATGGCCCAAACGTCAATCAGTAAGACAACCTCAGGACGAGCTAGACAACCCTGATGTCACAACGGTTATAGCTGATACAACGGTAGGAGGTTCAGTAGATATACCCGAAGATGTACAAGAAGATGTTGAAGAGAACATTCAAACAAAAGCTATAGATGTAGAAGACTCCAAAGTAGATTACTCCGGAGCACAACTGTGGAAAGTGGCGACTGATAAGAACGGAGTAAGAGTACTTTTAGGTCGATTGCGTCGTAGAAATCTCATTTCGACGTGGTCGGGGAACCAAACGTACATCGATGTCCTTGTGAAACCCGACGCCGTACAGAACGTTACACGGATATTCAAGAGAGAGAACATTACTTTTGACGTCATTATCGAGGACCTACAAAGGAGAATCAATGAAGAAAACCCTCCGCTCGATGAGAACGAAATTGAGCTACAGGACAGACGAGCAAGATCTTACAATTTTTGGCGTTACAGGGCCACCCGTTTAGGTGTGATAAAAGCCTTCATGGGCTACAGCTCTCTTAAACTTCCAATGGAGTTTTGGCCATATGCCAACTGGGGTCACCGTATGACATGGAAACAATATCACAGATTGGAAGACATTCACGGCTTTATGGATTATTTAGCCAAAACGTATCCCAAGATCGTGAGTGTGAACTCAATAGGAAAATCCTATGAAGGAAGAGACCTTAAAGTTCTCCGTATATCAGATGGCAAGCCTTCAAATAAGGCGGTTTTTATCGACGGTGGTATACACGCTAGGGAATGGATCAGCCCGGCTACGGTTACATACTTCATCAACCAAATAGCTGAAAACTTCGACGAAGAATCCGATGACATAAGGGATATTGATTGGTATTTCTTGCCTGTTGTCAATCCTGATGGATACGAATACACGCATATCAAAGATCGTTTGTGGAGAAAAAATAGAAAGCCGGCAGTTTACGGTGTGAGACAGTGTGTCGGGACTGATTTGAACAGAAATTTCGGTTATCGTTGGGGTGGTAAAGGTTCCTCGAGTAATCCCTGCAGTGAAATATATAGAGGAAATAGAGCTTTTTCTGAACCAGAATCCAGAGCAGTATCGGAATTCATCAAAACAAGTGCAGCTAATTTCTCAGCATACCTGACATACCACAGTTATGGTCAATATTTATTATACCCTTGGGGATATGACAACGCAGTCCCACCAGATCATAAAGAATTAGATCTTGTTGGCAAAAATATAGCAGCGGCTATTCAAGCGACTGGAGGCTCTAAATATTCTGTTGGGTCGTCTAGTGGCCTCCTTTATCCCGCTTCAGGCGGTTCAGATGACTGGGCCAAAGGCCAGGGCATTAAATATGCATACACAATTGAACTTAGCGATACTGGCCGCCATGGATTTGTTTTGCCGACAACCTTCATTGAGCCAGTAGCAAGGGAATCATTGTCAGGCTTAAGAGTGCTTGCAGCCCAATTAAGAAAGAACTAA

Protein sequence:

>DPOGS200623-PA
MAKLWWTVVCLLASLELCTPLINELQPGKEWPKRQSVRQPQDELDNPDVTTVIADTTVGGSVDIPEDVQEDVEENIQTKAIDVEDSKVDYSGAQLWKVATDKNGVRVLLGRLRRRNLISTWSGNQTYIDVLVKPDAVQNVTRIFKRENITFDVIIEDLQRRINEENPPLDENEIELQDRRARSYNFWRYRATRLGVIKAFMGYSSLKLPMEFWPYANWGHRMTWKQYHRLEDIHGFMDYLAKTYPKIVSVNSIGKSYEGRDLKVLRISDGKPSNKAVFIDGGIHAREWISPATVTYFINQIAENFDEESDDIRDIDWYFLPVVNPDGYEYTHIKDRLWRKNRKPAVYGVRQCVGTDLNRNFGYRWGGKGSSSNPCSEIYRGNRAFSEPESRAVSEFIKTSAANFSAYLTYHSYGQYLLYPWGYDNAVPPDHKELDLVGKNIAAAIQATGGSKYSVGSSSGLLYPASGGSDDWAKGQGIKYAYTIELSDTGRHGFVLPTTFIEPVARESLSGLRVLAAQLRKN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: