MonarchBase - Protein-coding gene

DPOGS200615
Transcript	DPOGS200615-TA	1095 bp
Protein	DPOGS200615-PA	364 aa
Genomic position	DPSCF300076 - 36024-38647
RNAseq coverage	184x (Rank: top 49%)

Annotation
*Heliconius*	HMEL014740	6e-136	65.83%
*Bombyx*	BGIBMGA008976-TA	2e-170	75.34%
*Drosophila*	CG3108-PA	7e-73	44.23%
EBI UniRef50	UniRef50_B0WQK4	3e-80	43.44%	Zinc carboxypeptidase n=5 Tax=Endopterygota RepID=B0WQK4_CULQU
NCBI RefSeq	XP_310460.4	9e-82	43.93%	AGAP000621-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|219553192	1e-83	45.94%	molting carboxypeptidase A [Helicoverpa armigera]
NCBI nr blastx	gi\|219553192	3e-82	45.94%	molting carboxypeptidase A [Helicoverpa armigera]

Group
Gene Ontology	GO:0006508	2.6e-107	proteolysis
	GO:0008270	2.6e-107	zinc ion binding
	GO:0004181	2.6e-107	metallocarboxypeptidase activity
	GO:0004180	4.7e-06	carboxypeptidase activity
KEGG pathway
InterPro domain	[59-338] IPR000834	2.6e-107	Peptidase M14, carboxypeptidase A
	[2-46] IPR003146	4.7e-06	Proteinase inhibitor, carboxypeptidase propeptide
	[1-44] IPR009020	7.9e-06	Proteinase inhibitor, propeptide
Orthology group	MCL25558		Lepidoptera specific

Nucleotide sequence:

>DPOGS200615-TA
ATGGACATTATGGTCGAGAGTCCCCATGCCGCTCAGGTCGCTGGGCTGCTGAACGAAAGAGATATCCCATACAGCATAGCTATCAGTGACGTTAGAACTCTGATTGAAAGGGAACAGGGGAATACTTTAAAAAAGAACCTAAATTCCTCCAAAGGTGCAATGGATTGGAAGAACTATCACCGTCTTGATGTTATTTACTCGTTTATGGATGACTTGGCAGCACAGTACCCATATTTATGTACTGTTAACGTTATTGGCAAGTCGGCGGAGGGAAGAGACTTACGGATGTTAAAAATATCAAATGGCAATAACGAAAATATGGGAGTTTGGTTAGATGGATCCATACATCCCCGCGAGTGGGTGAGCACAGCTGTCGTGACGTACTTCGCTGACCGGCTCGTAAGAAGCTTTCACGAACAACCAGACAGCGTGACTAATAAAGACTGGTATATTCTGCCGGTTTTAAATCCCGATGGTTACGAGTACACACACACACACGACAGAATGTGGCGTAAAAACAGAAATCGTTACGGCGAGTGTGTTGGTGTGGATCTAAACAGAAACTTCAGTTATGGTTGGGGCGAAAAGGGCGAAGAAGGATCATCAGAGGACCCTGGCAATATATTTTATAGAGGTCCAAAACCGTTTTCTGAACCTGAAACTGCTGCTTTGAAGCGCGTCATATTGGATGAATCAGCAAAATTCGAGGTGTTTCTATCGTTCCACAGCTATGGTGAAGTGATAATATTCCCATGGGGTTATACTGCGGATCCATGTCCCGATTACGTAGAGCTTTTGGAAGGGGGAACAGCTATGGCGAAGGCAATCTTCGATACAAGCGGTCATACTTACAAAGTTGGCAGCACAAAGGACCTTATGTACTTCGCTGCCGGGACCAGCACTGACTGGAGCTACGCCGTCGCTAATATAAAATATTCGTACATGATAGAACTGAGAGGTAAGCAGCATAGATTTCTGCTGCCTAAAGAACACATCATAGAAACAGCGACTGAAGTCATGAACGGTGTGTTGAGACTCATGGATTTCGTTGACCGACGATGCAGAAGTACGCAGGCCTGTGTTTGTCCAAAATAA

Protein sequence:

>DPOGS200615-PA
MDIMVESPHAAQVAGLLNERDIPYSIAISDVRTLIEREQGNTLKKNLNSSKGAMDWKNYHRLDVIYSFMDDLAAQYPYLCTVNVIGKSAEGRDLRMLKISNGNNENMGVWLDGSIHPREWVSTAVVTYFADRLVRSFHEQPDSVTNKDWYILPVLNPDGYEYTHTHDRMWRKNRNRYGECVGVDLNRNFSYGWGEKGEEGSSEDPGNIFYRGPKPFSEPETAALKRVILDESAKFEVFLSFHSYGEVIIFPWGYTADPCPDYVELLEGGTAMAKAIFDTSGHTYKVGSTKDLMYFAAGTSTDWSYAVANIKYSYMIELRGKQHRFLLPKEHIIETATEVMNGVLRLMDFVDRRCRSTQACVCPK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: