MonarchBase - Protein-coding gene

DPOGS212195
Transcript	DPOGS212195-TA	3360 bp
Protein	DPOGS212195-PA	1119 aa
Genomic position	DPSCF300323 - 274465-281996
RNAseq coverage	0x (Rank: top 98%)

Annotation
*Heliconius*	HMEL006830	92.49%
*Bombyx*	BGIBMGA000989-TA	88.87%
*Drosophila*	NnaD-PA	68.27%
EBI UniRef50	UniRef50_E0VPE0	57.25%	Putative uncharacterized protein n=1 Tax=Pediculus humanus corporis RepID=E0VPE0_PEDHC
NCBI RefSeq	XP_002427984.1	57.25%	conserved hypothetical protein [Pediculus humanus corporis]
NCBI nr blastp	gi\|242014619	57.25%	conserved hypothetical protein [Pediculus humanus corporis]
NCBI nr blastx	gi\|270005967	52.82%	hypothetical protein TcasGA2_TC008100 [Tribolium castaneum]

Group
Gene Ontology	GO:0006508	3.1e-34	proteolysis
	GO:0008270	3.1e-34	zinc ion binding
	GO:0004181	3.1e-34	metallocarboxypeptidase activity
KEGG pathway
InterPro domain	[356-583] IPR000834	3.1e-34	Peptidase M14, carboxypeptidase A
Orthology group	MCL11295		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS212195-TA
ATGTTATGGTGGAAACAACTGGAGTGCGTGCAAGAAAACGTTCTAATGCTAGAACGAGAAGAACAGCAGAAAGAACACGTCAACAGCACGACAATTACTTTAAGACTTCGTACTAGGGATCCGGTGTTAGAAGATAATTTATATTTAGCTAACATAGATCAAGTTAAATCATTACAAGCGTCTTTGTTTCCGATTTGTAATAAAGGAACCTTTATTACAAACTTTCTACAAAACAATATAAAGACAAATCAGTTGGAAATCAACACAGATGTTAAAACTTTTAAAACTACCGCCAAATTAAAGGAGCCGCGGGAATTATTTGCTCTCCCAAAAGAATTGGATTGTCCGCAACAAGCTCCTAGGTGGCCAACCGAATGTCAAGTTGTAGAAGAAAGAATTCAACATATAACATGGAGTCCAGCGTCACCAGAACCATATTACGTGTCCAGTGGCAAAGAACTCAAGCCACAGCCGGTCGGTGAGGAGGCAGGCACGGTTATATATCAATACTATCCCATGAGTGCCGTTAACTACTTCAGTCGTTCTACTGTAGGAGGGTCCCGTCTGTTCCTGTCCGCTTGCACGACAGCCGGTGGTGACGACGAATTACGTTTCGAGTCACGTTTCGAGAGCGGTAACTTAGCGAAGGCTGTTAAAATCACGTCCGCATACTACGAACTACACCTCCGTACTGACCTTTACACGAATAGACATATGCAATGGTTTTATTTCAGAGTAACCAACACGAGAAAGCAAACTATGTACAGGTTTTCCATTGTAAACCTATCTAAACCTGAAAGTTTGTATAATGAAGGCATGCGACCTTTATTATATTCTACGAAGGACGCGCAATTACATTCGATCGGCTGGAGACGCTGTGGTGACAACATTGCTTATTACAAAAATGACTCCATATGCGAGGAAGAAGAACAATTTCCGAGCTATACATTAACATTTAATATAGAATTTCCGCACACAGACGACGCTGTATACATCTCACATTGTTATCCTTACACATATTCCGATTTACAAGAGTATTTATCAAGATTACAAGCTCATCCGGTGAAATCTACTTACTCTAAACTGAGACTTCTGTGTAGAACGCTAGCTGGAAATAATGTATATTACCTCACAGTAACCTCTCCCCAAAATACAAATGAATTTGAACAAAAGAAAAAGAAAGCTGTAATTATAACAGCAAGAGTGCATCCAGGTGAGACGCCTTCGTCGTGGATGATGAAAGGGTTTATGGACTTCCTTACCGGGGACACCAACCAGGCGAGAGAACTACGAGAGAAATTTATATTCAAACTTGTTCCAATGTTGAATCCTGATGGTGTAATTGTTGGAAATAATCGCTGCTCACTAACTGGGAAAGACCTGAACAGACAGTACCGCACAGTAATAAGGGAAACATACCCTTCGGTGTGGCATACCAAAGTTATGATTCGGAGGTTACAGGAGGAATGCGGGGTAGCTATGTTTGTGGATTTGCACGCTCACTCCAGGAAGCATAATATATTCATATACGGATGCGAGAGTCGAAAGAACTCAGACAAACGATTACAGGAACAGGTCTTTCCACTTATGTTGCATAAAAATGCAGCCGATAAATTTTCCTTCGAGAATTGTAAGTTTCGAATTCAACGCAGTAAAGAAGGAACAGCTCGTGTAGTAATTTGGATGTTAGGAGTAGCCAATAGCTACACTATGGAAGCTTCATTTGGAGGGTCAGAACTAGGCAGTAGAATGTCCACCCACTTTTCAGCCCAAGACTACGAAAGTTTGGGTAGAACATTCTGTGAAACGTTGCTTGATTTCTGCGATGAAAACCCGAGCAAGGAAAGATTAAGAACCAAGATAGTCACACGTTTACTAAAAGAGGGATCCAACGCCGATGAACCTACCAACATTGATCTTTCTGATTATTCCAGTGATGAAGGTGACACATCAAGCAGTAGTTCCGAAGCGGGTGTAATAGGAGGATCCAGCAAGACTACACAACTCGCACCACCACCGTCGCCTATTCTTCCTGACATTAATAGAAATGCTATTGAAAAATCCAGAAAACAGCCAGTGCTAGAGAAAATACCAAAAATTGAAAAGAAGAAGACGAAAAGGGAAACTTTACGGGTCTCCAGAGCTACTATTGATATGACGTCGGACGCTATGACAGACGCATCATCAGATTGTGATTCGTTTGAAGAAAATCTCAGTCCACTAAGAAGAGTTAGAAAATTGTTACAGCCGCCGGGGAAAGCAAAAACTAGAAGAAAAAAGAAAATGCCACCCGAGCTAAAAATATTTCGTGCACCAACAAGTGACTCGCCCTTAAATTCAGACAAAGAGAAGAAGTCCACGAAATGTATAAGACCGAGGAGTTTGTCAATGATAACGGAACCGTTAGAACAAACAAAGTTAAAACCGGCGTCTTGGCATCAATTTCGCCATTTACCGACACATAAGTCTATAATTGAACAAAAAAGTAGGAATCTTCAGCCTGCTGAATTACAAGTGAAATTAAATGTCTTAAAGAAAAGTATATGGACTGGAATACCTGATGATGAGAAGGGACCTCTCTCATGGGGCATTTCTAGTTTTGCTACAAATTCATATTTCACGGACAGTGAAGCCCTCCTTAGATCATGTTCCAAGAAACTTGAAGAATTAGAAGGTGAAAGAAAAAAGAGAAAAGATGATAAAAAGAAGAAAAAAACTAAGAAAGTGTCTATAAAAGTTCCCAGCCCTGAAAATATATTGGAACCAATTATAAAAATGCCCAAAAGTAACAAGAAAAGGGGGAAATTGAAACATACAAAATCAGAAAATTCCAATCAAATTTATAGCGCAAGCTTTACTGAAATACCAAGGAATACTCAGAAAACTCAAAGTAAACAGGCAAAGACATTCCGAAAAGGTATGTTTGTTGCAACAGCCATCCAAACAAAACAACCAAATAGTAAATCGGCAAGGACAGATAATTCAGAATCTGATGAGTCTATACAAACAACCAAGAGGGTTAAGAAAAAGAATAGGGTAGTTAAAAATAAATTGCAAAAAGACTGGGTTAAATTATTTGAAGATGAACAGAAAGAAGATGACACTGGCGTTGTTGCTGGGAAGGCTATCACTCTCAGTTCACCGGCTGTGGAGAATTGTAGCGAATTGCTTACTCTTACTCCTGTAGAAGTATATCCAGGAGTTTGTGGTTCTCCAGTAATGGGGTTAAAACTACCGCATCGTGTTTTTGCCAAAATACATGAGCTTATAGCTATTAAATATGAATTGAACAGGACGGGCCAAAGCAATGTCGCAACTATGTCTGTAGTTTTGGCAGTTGTAAACAACATGTTTATTTAG

Protein sequence:

>DPOGS212195-PA
MLWWKQLECVQENVLMLEREEQQKEHVNSTTITLRLRTRDPVLEDNLYLANIDQVKSLQASLFPICNKGTFITNFLQNNIKTNQLEINTDVKTFKTTAKLKEPRELFALPKELDCPQQAPRWPTECQVVEERIQHITWSPASPEPYYVSSGKELKPQPVGEEAGTVIYQYYPMSAVNYFSRSTVGGSRLFLSACTTAGGDDELRFESRFESGNLAKAVKITSAYYELHLRTDLYTNRHMQWFYFRVTNTRKQTMYRFSIVNLSKPESLYNEGMRPLLYSTKDAQLHSIGWRRCGDNIAYYKNDSICEEEEQFPSYTLTFNIEFPHTDDAVYISHCYPYTYSDLQEYLSRLQAHPVKSTYSKLRLLCRTLAGNNVYYLTVTSPQNTNEFEQKKKKAVIITARVHPGETPSSWMMKGFMDFLTGDTNQARELREKFIFKLVPMLNPDGVIVGNNRCSLTGKDLNRQYRTVIRETYPSVWHTKVMIRRLQEECGVAMFVDLHAHSRKHNIFIYGCESRKNSDKRLQEQVFPLMLHKNAADKFSFENCKFRIQRSKEGTARVVIWMLGVANSYTMEASFGGSELGSRMSTHFSAQDYESLGRTFCETLLDFCDENPSKERLRTKIVTRLLKEGSNADEPTNIDLSDYSSDEGDTSSSSSEAGVIGGSSKTTQLAPPPSPILPDINRNAIEKSRKQPVLEKIPKIEKKKTKRETLRVSRATIDMTSDAMTDASSDCDSFEENLSPLRRVRKLLQPPGKAKTRRKKKMPPELKIFRAPTSDSPLNSDKEKKSTKCIRPRSLSMITEPLEQTKLKPASWHQFRHLPTHKSIIEQKSRNLQPAELQVKLNVLKKSIWTGIPDDEKGPLSWGISSFATNSYFTDSEALLRSCSKKLEELEGERKKRKDDKKKKKTKKVSIKVPSPENILEPIIKMPKSNKKRGKLKHTKSENSNQIYSASFTEIPRNTQKTQSKQAKTFRKGMFVATAIQTKQPNSKSARTDNSESDESIQTTKRVKKKNRVVKNKLQKDWVKLFEDEQKEDDTGVVAGKAITLSSPAVENCSELLTLTPVEVYPGVCGSPVMGLKLPHRVFAKIHELIAIKYELNRTGQSNVATMSVVLAVVNNMFI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: