MonarchBase - Protein-coding gene

DPOGS201745
Transcript	DPOGS201745-TA	2442 bp
Protein	DPOGS201745-PA	813 aa
Genomic position	DPSCF300279 - 131843-147109
RNAseq coverage	23x (Rank: top 78%)

Annotation
*Heliconius*	HMEL006703	0.0	74.10%
*Bombyx*	BGIBMGA002645-TA	0.0	61.83%
*Drosophila*	stl-PC	8e-51	30.30%
EBI UniRef50	UniRef50_E2A767	2e-156	40.65%	A disintegrin and metalloproteinase with thrombospondin motifs 14 n=5 Tax=Formicidae RepID=E2A767_CAMFO
NCBI RefSeq	XP_001121221.1	4e-155	41.10%	PREDICTED: similar to CG3622-PB, isoform B [Apis mellifera]
NCBI nr blastp	gi\|350421209	4e-165	42.47%	PREDICTED: A disintegrin and metalloproteinase with thrombospondin motifs 2-like [Bombus impatiens]
NCBI nr blastx	gi\|383863909	3e-165	41.82%	PREDICTED: A disintegrin and metalloproteinase with thrombospondin motifs 2-like [Megachile rotundata]

Group
Gene Ontology	GO:0006508	1.5e-14	proteolysis
	GO:0004222	1.5e-14	metalloendopeptidase activity
	GO:0008270	3.3e-05	zinc ion binding
KEGG pathway
InterPro domain	[205-458] IPR024079	4.3e-43	Metallopeptidase, catalytic domain
	[208-417] IPR001590	1.5e-14	Peptidase M12B, ADAM/reprolysin
Orthology group	MCL18995		Insect specific

Nucleotide sequence:

>DPOGS201745-TA
ATGGCGCGAACGGTTGGAATAGTGTTTGTAGCACTGTTTTTCATGCTACGAGTCACCACGGCTGCGCGTTTTCCAGACATATCGGCTTTCAACGGGTGGTGGTCAAAAGGGGTCCACCGAGAGGATGATTCAAAAGGGAACAAAGACGTAGAAGTGGTATACCTTCCAGCGCTAATACCTCGTGAAGCACAGGTTGCTGAAGATTCTGCACAAAATGACGTTCCACTACCTTACAGCTTCGAAGCCTTCGGGAAGAACTTCGACCTCCAACTCTTACCGAATAGGCGACTCGTGTCTCCTCAGTTCCGAGTATGGTCCGAGGACGGCCCCGAGGCCCCCTTGTCGGTTCCCGATTCTTCTTGCCACTTCCTTCATTTATTTTATTTAAAATGTCCGAAACAACACGGTCTTATCTTGACTGATAATTCCACATATGAAGTGCGACCTTTAAAGACTGGAGAAGGAAGGTCAGAACACGGGAAACATCATAGAGATCGCAGGGCTCATATCATCCGTCGTGCGACTCCTCCTCTTATGACTGTCAACGATGACCGTCCACTGAGACACAGAGCTCGTCGCCCCCGTCTCAATATTAACAAACCACCGCCTTCTTCCTACACTGTCGAAATAGCACTGTTCCTGGACGAAGCCGCTTACAAAATATTTCATCCTCATCTAAATTACAATGAGGCTGATCTACGAGATATGTTGTTGGCGTACATTAATGGGGTGCAGGCCTTATATCACCATTCGTCTCTGGGGACCCGTGTTCAGCTGTCTCTGGTGAGACTAACTTTGCTTCGGACACAACCAGCGGCTCTATCGTTGCAGGCGGAGCGCGGTCGTTTGTTGGACTCATTCTGCGCATACCAGCGATCGCTGAACGTAGATGATGACGACGACCCTGAACATTGGGATATGGCTTTATTACTTTCTGGGTTAGACTTTTATTCAGAGGAAGGAGGTCGTCGGAACGGCGTGACGATGGGTCTAGCTCCTGTGGGAGGAGTTTGTCTCCCGGCACACGCGTGTGTCGTCGCTGAGTTCGGAGCCGCGGACACACTCGGGAGACCGTATCCCTCTGCTGGGTTCACATCCGTCTACATTCTAGCACATGAGATCGGACACAATCTGGGCATGCATCATGATGGGACTGGTAATGCGTGTTCTCGCGACGGCTACATCATGTCTCCATCGCGCGGCACCAACGGCGAAGCGACCTGGTCACACTGCAGCGCACAAGTCGTCGCTGACTTGAAATGGGCAACATGTTTATTCGATGGCGGTGACGATCCAGACATACCACCACAACTAGAGCATGAGAGATTTGGTGACGCCCCGGGACTTGTTTGGGTCGCGAAGAAACAGTGCGAAGTGCTCCTCCGCGATAAGGACGCGACGCCAGCGTCTCCAGAACCTGGTGTGAGTGTGTGTATGCAGCTGGCGTGTAGGACTCCTCACCGAGCAGGGTTTTATTACGCCGGACCCGCGCTCCCAGGAACACCCTGTGCACCGGGGAAGGTGCTCCTCCGCGATAAGGACGCGACGCCAGCGTCTCCAGAACCTGGTGTGAGTGTGTGTATGCAGCTGGCGTGTAGGACTCCTCACCGAGCAGGGTTTTATTACGCCGGACCCGCGCTCCCAGGAACACCCTGTGCACCGGGGAAGTGGTGTCATGGCGGGGAGTGCGTGGCTGCTGATCCTACAGTGGCAGCCCTGCCTCCCGTAGTGAGTGACAGCGGCAGTTCCTGGAGTGAGTGGTCTTCAGGATCGTGTCGTTCAGGCTGCACACTGGAGGGCTTAGGAGCGGTGGAGAAACGACGCACTTGTCCTCAGAACGCAATTTGCGCAGGACCTTCTTATGATGTGGCACTTTGTGATGATTCGAAGGTGTGCGGTAAGAAACGGCGCACAAGTGCGAGTGAGTTGGCCGGTCGTCGATGTGCTCAGTACGCAGCGCGCATCCCAGCTCTTGATGCAAGAGGAGGTGGTCTACAGGCGCCTCATGATCCTACTCGCATGTGGATGGGATGCGCGATCTTCTGTCGTCGTGCGAGCGGCGGCGGGTTCTACGCGCCTCGGGTTGAGCTGAACGATGCTGGACTGGATCCTTACTTCCCCGACGGCACGTGGTGCCATCACGACGGACAGAACCACTACTACTGCCTTCAACACCACTGTTTGCCAGAGAATTTCAAGATGTCAGCTCAGTACCACATCTGGGAGTTACCGAGCGAGGATGTCGGTGGATCTTTCAACGCCAGGGCACGCGCGGCGCCTGATGACGGAGCCTCTGCAGCCCTTCGTGCTTACATGACCCTGGACGACGCTGGAGCACCTCTCTTCAGAGCCGCCATACCACCACACATCCCAGAGGAGCCTGAGAGCGACTGGGAAGTAATTGATTATGTCGAAATACCAGCCAGAAACAACACAGATTGA

Protein sequence:

>DPOGS201745-PA
MARTVGIVFVALFFMLRVTTAARFPDISAFNGWWSKGVHREDDSKGNKDVEVVYLPALIPREAQVAEDSAQNDVPLPYSFEAFGKNFDLQLLPNRRLVSPQFRVWSEDGPEAPLSVPDSSCHFLHLFYLKCPKQHGLILTDNSTYEVRPLKTGEGRSEHGKHHRDRRAHIIRRATPPLMTVNDDRPLRHRARRPRLNINKPPPSSYTVEIALFLDEAAYKIFHPHLNYNEADLRDMLLAYINGVQALYHHSSLGTRVQLSLVRLTLLRTQPAALSLQAERGRLLDSFCAYQRSLNVDDDDDPEHWDMALLLSGLDFYSEEGGRRNGVTMGLAPVGGVCLPAHACVVAEFGAADTLGRPYPSAGFTSVYILAHEIGHNLGMHHDGTGNACSRDGYIMSPSRGTNGEATWSHCSAQVVADLKWATCLFDGGDDPDIPPQLEHERFGDAPGLVWVAKKQCEVLLRDKDATPASPEPGVSVCMQLACRTPHRAGFYYAGPALPGTPCAPGKVLLRDKDATPASPEPGVSVCMQLACRTPHRAGFYYAGPALPGTPCAPGKWCHGGECVAADPTVAALPPVVSDSGSSWSEWSSGSCRSGCTLEGLGAVEKRRTCPQNAICAGPSYDVALCDDSKVCGKKRRTSASELAGRRCAQYAARIPALDARGGGLQAPHDPTRMWMGCAIFCRRASGGGFYAPRVELNDAGLDPYFPDGTWCHHDGQNHYYCLQHHCLPENFKMSAQYHIWELPSEDVGGSFNARARAAPDDGASAALRAYMTLDDAGAPLFRAAIPPHIPEEPESDWEVIDYVEIPARNNTD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: