MonarchBase - Protein-coding gene

DPOGS204534
Transcript	DPOGS204534-TA	1806 bp
Protein	DPOGS204534-PA	601 aa
Genomic position	DPSCF300297 - 237064-243733
RNAseq coverage	15x (Rank: top 81%)

Annotation
*Heliconius*	HMEL016577	3e-47	82.79%
*Bombyx*	BGIBMGA002499-TA	5e-34	30.64%
*Drosophila*	Kul-PA	1e-37	31.08%
EBI UniRef50	UniRef50_Q9VAI2	2e-35	31.08%	Kuzbanian-like n=12 Tax=Drosophila RepID=Q9VAI2_DROME
NCBI RefSeq	XP_002098551.1	3e-36	31.08%	GE23876 [Drosophila yakuba]
NCBI nr blastp	gi\|44894223	5e-35	28.41%	ADAM metalloprotease CG1964 [Drosophila melanogaster]
NCBI nr blastx	gi\|195112445	4e-38	28.35%	GI10418 [Drosophila mojavensis]

Group
Gene Ontology	GO:0006508	9.2e-07	proteolysis
	GO:0004222	9.2e-07	metalloendopeptidase activity
KEGG pathway	dya:Dyak_GE23876	8e-36
	K06704 (ADAM10)	maps->	Alzheimer's disease
			Epithelial cell signaling in Helicobacter pylori infection
InterPro domain	[184-412] IPR024079	3.9e-30	Metallopeptidase, catalytic domain
	[347-410] IPR001590	9.2e-07	Peptidase M12B, ADAM/reprolysin
Orthology group	MCL19877		Lepidoptera specific

Nucleotide sequence:

>DPOGS204534-TA
ATGTTTTGGCTTTTTATTTTCTTTACATCCGTAAGAGGCTGGGACTTCCAGGACCAATTGGAGAGAGCCGACAGCATATGCAGGTCCTACGGTTACCAGGTTGTAGAAGGGATATTCGGCAAGGAAACTTATCTGTTATGTCTCAAGACTCTTGCTATTGGTACCTCACCACTTATGAGTCAACAGACAACATTGCTGTTGGATCCTGATATGGATGATAAACTAGTTCCCAAGTTTTCTCCGGTATTAGCGGATATAGTAATGTCGAGGGGGTTCCCCGTGGATGATCCGGCAGCCGGTTCAGCTGAGGGTTACGTAGGAGAGGACAATCATTTTTACGGAGTCTTGCATCTAGGTAACCGAACATTGCACGCCGATCCGTATGGTAAAGACGGTCCCGATAAATCGTTCGGGGTTCTCATTAACGACAACATGGCGGCACCTAAAAGACCACGCCGCGACCATGCACAGGTCGGAGCCGGTTTCGACAAGCTCTCATACTTCCCATACCGCATAGAAGACAGAGCCCCGGAAACCGGCATCGCTAGAGCTCGTATCTGCGATCTGCTTCTGCTAGCTGATAAGGAATTCTACGAAAAGGACTCTAATTCGAGTATAAATCACGTGGTGCAAAGGATGATGCATGCCGTGGCCCAAGCTGATATTATATTTAGGAACTCTGATTTCAACGAGGACGGCGTACCAGATAACATTGGTTTTGCAGTAAAGTATATAGTAATTCTAACGTCTGATGAGACGAACAACCGTGTCTTCGGTGATCTGGTTAAAGACCGGTCTATAGACGGGCGGAATTATCTCATGCGGTTCGCGAGGCTCAGGAGACTGTCTGAAGTCTGCCTCGGGGTCGCCTTCTCTGGACATGCCTTCCTCAACAGGACCTTGGGATTGAGTTTCACGTCGTTGGGCGGAGGGCTAGGTGGCGCTGCGGGCGGTCTGTGTGACCGACGCGCCTACGGACGCTCCTTCAACACGCTCGCCCTCGCGCACGCCACCGGCGAGCGCGACCGAGTACCCGAGAGGCTCGCGGCGCTCACACTGGCGCACGAGATGGGTCATAGTTTCGGAGCCCACCACGACGACAATTTCCCAAACCCTGACTGCCGCGGTTATCTGATGGGGTCACAGTCAACCCCCACCAAACACTCGGAGTTCTCTGTCTGTAGTAAGAGACTCATTACGGCTACCCTCAGCAGCATGAGCTATTGTCTCACGGAAGTGGACCAGCCGTATTGTGGGAATGGTATAGTAGAGATCGGTGAGGCTTGTGACTGCGGTCTACCCTCCGAATGTAGTCAGAGGGACCCGTGCTGCACCCCGCGGGCCGGAGGAGCACTCGTGTATGAAGAGGGGACCTTATATAAAGAGGGCTGCTCCGTATCACCTGGAGTCAGTTGTCACCCCTCCCAGGGTCTCTGCTGTAACGCTAACTGCGAGTTCGCCAATCTTACGAGCAGTGGAATCGAGTGTCATCACCAGCACCACGAGTGTACGTGTGCGGATTTATCGTCCTGTGACTGTGGTGTGGGCGGGCGATGTCTCCTGGACGGCACCTGTCACGCCGCAGACTGCGCCGGGCTCGGTTTAAAGGAGTGCAAGTGCCCCAAATCCGGACCGGGCGGTACATTAAAAAAATATAGAAAGTGCGGAGTGTGTTGCCAGTTCACAAAATCCGGTGTAACGAAATGTCAAGGCGTTGAGTTTGCGGCGAGGGAATTGATCGCCGAATCAGCGCTGCCACCCTCGCTTTTGCCGAACAACACTTACAAAGGATGTGGGTGTCGATAA

Protein sequence:

>DPOGS204534-PA
MFWLFIFFTSVRGWDFQDQLERADSICRSYGYQVVEGIFGKETYLLCLKTLAIGTSPLMSQQTTLLLDPDMDDKLVPKFSPVLADIVMSRGFPVDDPAAGSAEGYVGEDNHFYGVLHLGNRTLHADPYGKDGPDKSFGVLINDNMAAPKRPRRDHAQVGAGFDKLSYFPYRIEDRAPETGIARARICDLLLLADKEFYEKDSNSSINHVVQRMMHAVAQADIIFRNSDFNEDGVPDNIGFAVKYIVILTSDETNNRVFGDLVKDRSIDGRNYLMRFARLRRLSEVCLGVAFSGHAFLNRTLGLSFTSLGGGLGGAAGGLCDRRAYGRSFNTLALAHATGERDRVPERLAALTLAHEMGHSFGAHHDDNFPNPDCRGYLMGSQSTPTKHSEFSVCSKRLITATLSSMSYCLTEVDQPYCGNGIVEIGEACDCGLPSECSQRDPCCTPRAGGALVYEEGTLYKEGCSVSPGVSCHPSQGLCCNANCEFANLTSSGIECHHQHHECTCADLSSCDCGVGGRCLLDGTCHAADCAGLGLKECKCPKSGPGGTLKKYRKCGVCCQFTKSGVTKCQGVEFAARELIAESALPPSLLPNNTYKGCGCR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: