MonarchBase - Protein-coding gene

DPOGS209332
Transcript	DPOGS209332-TA	5340 bp
Protein	DPOGS209332-PA	1779 aa
Genomic position	DPSCF300194 - 43721-57444
RNAseq coverage	98x (Rank: top 61%)

Annotation
*Heliconius*	HMEL009379	89.25%
*Bombyx*	BGIBMGA002952-TA	86.81%
*Drosophila*	CadN-PL	72.01%
EBI UniRef50	UniRef50_O15943	72.01%	Neural-cadherin n=57 Tax=Hexapoda RepID=CADN_DROME
NCBI RefSeq	XP_002066304.1	81.63%	GK18219 [Drosophila willistoni]
NCBI nr blastp	gi\|195436718	81.63%	GK18219 [Drosophila willistoni]
NCBI nr blastx	gi\|195436718	81.63%	GK18219 [Drosophila willistoni]

Group
Gene Ontology	GO:0016020	6.4e-49	membrane
	GO:0007156	6.4e-49	homophilic cell adhesion
	GO:0005509	6.4e-49	calcium ion binding
	GO:0005515	8.7e-07	protein binding
KEGG pathway	dmo:Dmoj_GI22290	0.0
	K10414 (DYNC2H, DNCH2)	maps->	Phagosome
			Vasopressin-regulated water reabsorption
InterPro domain	[943-1182] IPR013320	1.1e-52	Concanavalin A-like lectin/glucanase, subgroup
	[1615-1773] IPR000233	6.4e-49	Cadherin, cytoplasmic domain
	[947-1184] IPR008985	5.6e-46	Concanavalin A-like lectin/glucanase
	[449-558] IPR002126	8e-34	Cadherin
	[989-1158] IPR001791	3.9e-33	Laminin G domain
	[439-563] IPR015919	5.2e-32	Cadherin-like
	[997-1157] IPR012680	2.9e-26	Laminin G, subdomain 2
	[1455-1491] IPR001881	4.3e-11	EGF-like calcium-binding
	[1458-1491] IPR006210	8.7e-07	Epidermal growth factor-like
Orthology group	MCL10152		Insect specific

Nucleotide sequence:

>DPOGS209332-TA
ATGACGGGCGCTATCTATGTAGCGGGTGCACTCGACTATGAAACTAGGAAACGGTACGAGTTGAAGTTGGCTGCTTCGGACAATCTAAAAGAGAACTATACGACAGTGGTTATCCACGTAAAGGATGTGAATGACAACCCACCAGTGTTCGAGAGACCGACCTATCGTACCCAAATCACAGAAGAAGATGACCGCAATCTTCCCAAGCGTGTGCTTCAGTACGAGCTCACCTTGGTGGCGTCGGACGGCAGAAACGAGAACTCAACTCGTGTGGTGGTCCACGTACTAGATATCAACGATTTGCCACCTCGGTTCTCGCGCAGCGCATATATCACCCAGGCCTTAGAGGAAACAGGACCCTACCCCCACTTCCTTATACAGGTCACTGCGACAGACGGCGACAAGGATAGGCAACAAAATATTGTTTATTTCCTTACCGGCCAGGGTATTGACCCAGATAATCCTTCAAATAGCAAATTCGACATCAATCGAACGACAGGAGAAATCTTTGTCCTTAAGCCCTTAGATCGAGATCAACCTAATGGACGGCCTCAGTGGAGATTTACAGTATTTGCTCAAGATGAAGGTGGAGAAGGACTTGTAGGTTATGCCGATGTACAAGTTAATCTTAAGGACATTAATGACAATGCACCTATTTTCCCACAAGGTGTTTACTTTGGTAATGTAACAGAAAATGGTACAGCGGGAATGGTTGTTATGACAATGACTGCAATTGATTATGATGATCCAGCTGAGAGTAACAATGCAAAACTTTGGTATTCCATCGAGAAAAATGTTATCGAGGAAGAGACAGGATCTCCAATTTTTGAAATCGAACCAGAAACCGGGGTCATTAAAACTGCGGTGTGTTGTTTGGATCGTGAAAGAACTCCAGATTATTCTATACAAATAGTAGCTTCGGATGGAGGGGGGTTAAAAGGAACAGGTACAGCATCAATCAGAGTTAAAGATATAAATGATATGCCGCCTCAATTCACAAAAGATGAATGGTTCACAGAAGTAGATGAAACAGATGGAACGAATTTACCTGAAATGCCGATACTCACAGTAACAGTTCACGATGAAGATGAAACTAATAAATTCCAATACAAGGTTATAGAAAACAGTGGATATGGTGCTGATAAATTTACAATGGTTAGAAATAATGATGGGACTGGATCCCTTAAAATTGTACAGCCATTAGATTATGAGGATCAGTTGCAAAGTAACGGTTTTAGGTTCAGAATACAAGTAAATGATAAAGGTGAAGACAATGATAACGATAAGTATCACGTAGCTTATTCATGGGTAGTTGTGAAACTTCGAGATATAAATGACAACAAACCACAATTTGAACGAGCAAATATTGAAGTATCTGTGTATGAAAATGCAGAAGTCGGAAAAAGCCTCGAAACATTCAAAGCCACGGATCCAGACCAAGGAGGTAAAAGTAAAGTCTCGTACGCTATTGATAGATCCTCTGATAGGAAACGTCAATTTTCAATTAACCAGGAAGGTACTGTTAGCATCCAAAGATCTTTAGATAGGGAAGATACACCCAGACATCAAGTTAAAATTTTGGCTATTGATGACGGTGTTCCTCCAAGGACAGCAACAGCCACTTTAACAGTAATCGTACAGGATATAAACGATAACGCACCTACATTCCTAAAAGACTATAGACCCGTTTTAACTGAACATATAACACCTAAAAAAGTGGCTGAAATTCTAGCAACAGACGACGATGATAGATCTAAGAGCAATGGTCCACCATTCCAATTTCGACTAGATCCGGGTGCTGATGATATTATAAGAGCCTCTTTCAAGGTCGAACAAGACCAAAAAGGTGCAAACGGTGATGGTATGGCAATTGTTTCATCCTTAAGATCATTTGATAGAGAACAACAAAAGGAATATCTCATTCCCATTATTATAAAAGATCACGGTAATCCAGCTATGACTGGAACGAGCACTTTAACAGTCGTAATTGGTGATGTGAATGACAATAAAATGCAACCAGGTTCTAAGGAAATCTTAGTTTATAATTATCAAGGGCAAGCACCAGATACAGAAATTGGAAGAGTATACGTATATGATTTGGATGATTGGGATTTACCAGACAAGAAATTTTTCTGGGAGAGTTCAGAACATCCTAACTTTACATTAAATGAAGAAACTGGAATGATTCAAATGAAACACAAAACAAGAGAAGGTAGATATCACTTAAAATTCAAAGTATACGATCGAAAACATACGCAAACTGATGTACCTGCAAATGTTACCGTTTATGTCAAAGAAATTTCGTCTGAAGCAATCATGAATTCGGGTTCTATAAGAATATCAGGTATATCTGACGAAGATTTTATAAGAGTATGGAATTATAAAACTTTAAGTGTTTCTAGAAGTAAGTTAGATATATTCAAGGATAAATTAGCGGATTTGCTTAACACAGAACGTGAAAACATCGATGTATTCAGTGTACAACTGAGGAAAAAACATCCACCTGTAACTGATATTCGTTTTTCTGCCCATGGAGCTCATTACTACAAACCAATACGATTAAATGGAATAGTACTTATGCATAGAGAAGAAATAGAAAGAGCCGTAGGAATCAATATAACCATGGTAGGAATAGATGAATGTCTTTACGAAAACCAAATGTGCGAAGGTTCTTGTACTAATGTTCTTGATATTAGCAACTTACCTTATATGGTTAATTCAAATAAAACAGCACTTGTTGGCGTTCGTGTTGATGTTATTGCGGAATGTACTTGTGGTGCTAGAAATTTCACTCAAGCTGAAACTTGTCGTAACTCGCCATGCTATAACGGTGGTAGATGTATAGAAGGTAAATATGGATTGACTTGTTCATGTCCGCCCGGATATACAGGACCTAGGTGTCAACAGACATCACGGAGTTTTAGAGGTACAGGTTGGGCCTGGTATCCTTCGTTAGAAATGTGTGATAGCTCTCATTTAAGTTTTGAGTTTATTACCAGGAAGTCCGAAGGAGTTTTACTTTATAATGGACCAATTGTTCCGCCCGAACCAGAAGAAATAGTTGTATCCGACTTCATTTCAGTTGAATTAGAAAGAGGAAATCCAAGATTATTAATTGATTTTGGATCAGGTACACTAGAGTTGAGGGTAAAAACTAAAAAATCTTTAGATGATGGTGAGTGGCATAGACTAGACATATTTTGGGATACCGAAAATGTCAGAATGATCGTTGATTTCTGTAAATCGGCGGATATTCAGGAAATGGAAGACGGAACTCCACCCGAATTTGATGACTCAACTTGTCAAGCATCTGGAACGATACCACCATTTAACGAATATTTAAATGTCAATGCACCTTTACAAATTGGTGGATTATACATTGAACATTTTGATCCTACACACTACCATTGGCAGTACATGCCAATTGGAAAAGGATTTGATGGGTGTGTTAGAAATCTAATACACAATAGTAAATTATATGATTTAGCACATCCTGGTCTCTCTAGAAATTCTGTAGCTGGGTGTCCGCAAACAGAAGAAATTTGTAATCAGGCTGACACAACAACAAGATGTTGGGAACATGGCACTTGTGTTGGAAGTTTCTCGGAAGCTAGATGCCAGTGCCAGCCTGGTTGGACGGGACCATCGTGTAATCTACCAACAACACCAACAAGTTTTAGACCACAGAGCTACGTAAAATTCGCATTGAGCTTTGAGCCTGACAGGTTTAGCACACAGGTACAACTAAGGTTTAGAACTAGGGAACCTCATGGAGAACTTTTTCGAGTAAGCGATCAACACAACAGAGAATATGGCATTTTGGAGGTTAAGGATTCACGGTTACATTTCCGTTATAACTTAAATTCCTTACGGACGGAGGAACGTGATGTTTGGTTGAATTCCGTGCCAGTGGATGATGGACAGTGGCATATAGCTAGAGTGAGCCGATATGGTAGCGCTGCGACCCTCGAAATCGATGGAGGAGAAGGCAGAAGATATAACGAAACATTTACATTTGAAGGCCATCAATGGCTACTGGTAGATAAACAGGAGGGTGTATATGCTGGAGGCAAGGCCGAATACACCGGCGTTCGAACGTTTGAAGTATATGCAGATTTTCAGAAAGGTTGTCTAGATGACATAAGATTAGAAGGTAAACATTTACCGTTGCCGCCGGCGATGAACGGAACTCAATGGGGTCAAGCAACAATGGCCAGAAACTTAGACCGGAACTGCCCCTCTAACAGTCCCTGTATAAACGTTCACTGCACCGAACCCTTCGTCTGCGTCGACCTCTGGAATGAATATGAATGCACTTGCGGTGAGGGTTTGGTATTGTCTGGTGACGGAAAAGGTTGCGTAGACAAGAACGAATGTCTCTACTTCCCTTGCCGAAACGGGGGTTCGTGTGTCAATCGCGAACCAGGGTACCGCTGCCACTGTCCAGAAGGGTTCTGGGGCGAGAATTGCGAACTTGTACAGGAAGGACGAACGCTGAAACTCAGCATGGGCGCCCTGGCGGCCATCCTCGTCTGCCTCCTTATTATCATGAAGGTAAAGCGCACAATGTATAGGTGTCCGGGTGGATCGACTCGGTCTGGCGGTACGTGTGTGAACGTGAACGAGTGCCTGAACAATCCGTGCTTGCACGGCGGCAAGTGTGTGGATCGCGATCCAGCACGCCGCTACGACTGCATATGCACGTTCGGATACGCTGGACATGACTGTGAACTAGAACTTCTTGCCTCCGGAATCATCATGCCCTCCAGGGATTTCATTATTGCTATCATTGTCTGTTTGTTTTTGCTTTTAGTCCTAGTTCTGGTATTTGTGGTGTACAATCGCCGTCGAGAAGCCCATATAAAGTACCCGGGACCGGACGACGACGTTCGTGAAAATATTATTAATTACGATGACGAGGGCGGCGGTGAAGATGACATGACTGCATTTGACATCACTCCTCTACAGATACCCATCGGTGGACCGTTACCGGATCACGTACCTACAAAATTACCATATCCACTGATGGGTGTAGGTTTGGGAGTGGGTCCAATGGGGGTATCGGTCGCCCCCGCGGTGGTACCACTTCCAGGGGAGACGAACGTTGGCATGTTCATCGAAGACCACAAACGACGTGCTGACAGTGACCCTAACGCACCACCCTTTGACGATCTCAGGAATTACGCGTATGAAGGTGGTGGCAGTACTGCGGGCTCCCTCTCGTCCCTTGCTTCTGGTACCGACGATGAGGTACACGACTACGACTATTTGGGTGCCTGGGGTCCTCGTTTCGACAAACTGGCTGATCTCTACGGGCCCGAACTCGACGAGCAACTGTAA

Protein sequence:

>DPOGS209332-PA
MTGAIYVAGALDYETRKRYELKLAASDNLKENYTTVVIHVKDVNDNPPVFERPTYRTQITEEDDRNLPKRVLQYELTLVASDGRNENSTRVVVHVLDINDLPPRFSRSAYITQALEETGPYPHFLIQVTATDGDKDRQQNIVYFLTGQGIDPDNPSNSKFDINRTTGEIFVLKPLDRDQPNGRPQWRFTVFAQDEGGEGLVGYADVQVNLKDINDNAPIFPQGVYFGNVTENGTAGMVVMTMTAIDYDDPAESNNAKLWYSIEKNVIEEETGSPIFEIEPETGVIKTAVCCLDRERTPDYSIQIVASDGGGLKGTGTASIRVKDINDMPPQFTKDEWFTEVDETDGTNLPEMPILTVTVHDEDETNKFQYKVIENSGYGADKFTMVRNNDGTGSLKIVQPLDYEDQLQSNGFRFRIQVNDKGEDNDNDKYHVAYSWVVVKLRDINDNKPQFERANIEVSVYENAEVGKSLETFKATDPDQGGKSKVSYAIDRSSDRKRQFSINQEGTVSIQRSLDREDTPRHQVKILAIDDGVPPRTATATLTVIVQDINDNAPTFLKDYRPVLTEHITPKKVAEILATDDDDRSKSNGPPFQFRLDPGADDIIRASFKVEQDQKGANGDGMAIVSSLRSFDREQQKEYLIPIIIKDHGNPAMTGTSTLTVVIGDVNDNKMQPGSKEILVYNYQGQAPDTEIGRVYVYDLDDWDLPDKKFFWESSEHPNFTLNEETGMIQMKHKTREGRYHLKFKVYDRKHTQTDVPANVTVYVKEISSEAIMNSGSIRISGISDEDFIRVWNYKTLSVSRSKLDIFKDKLADLLNTERENIDVFSVQLRKKHPPVTDIRFSAHGAHYYKPIRLNGIVLMHREEIERAVGINITMVGIDECLYENQMCEGSCTNVLDISNLPYMVNSNKTALVGVRVDVIAECTCGARNFTQAETCRNSPCYNGGRCIEGKYGLTCSCPPGYTGPRCQQTSRSFRGTGWAWYPSLEMCDSSHLSFEFITRKSEGVLLYNGPIVPPEPEEIVVSDFISVELERGNPRLLIDFGSGTLELRVKTKKSLDDGEWHRLDIFWDTENVRMIVDFCKSADIQEMEDGTPPEFDDSTCQASGTIPPFNEYLNVNAPLQIGGLYIEHFDPTHYHWQYMPIGKGFDGCVRNLIHNSKLYDLAHPGLSRNSVAGCPQTEEICNQADTTTRCWEHGTCVGSFSEARCQCQPGWTGPSCNLPTTPTSFRPQSYVKFALSFEPDRFSTQVQLRFRTREPHGELFRVSDQHNREYGILEVKDSRLHFRYNLNSLRTEERDVWLNSVPVDDGQWHIARVSRYGSAATLEIDGGEGRRYNETFTFEGHQWLLVDKQEGVYAGGKAEYTGVRTFEVYADFQKGCLDDIRLEGKHLPLPPAMNGTQWGQATMARNLDRNCPSNSPCINVHCTEPFVCVDLWNEYECTCGEGLVLSGDGKGCVDKNECLYFPCRNGGSCVNREPGYRCHCPEGFWGENCELVQEGRTLKLSMGALAAILVCLLIIMKVKRTMYRCPGGSTRSGGTCVNVNECLNNPCLHGGKCVDRDPARRYDCICTFGYAGHDCELELLASGIIMPSRDFIIAIIVCLFLLLVLVLVFVVYNRRREAHIKYPGPDDDVRENIINYDDEGGGEDDMTAFDITPLQIPIGGPLPDHVPTKLPYPLMGVGLGVGPMGVSVAPAVVPLPGETNVGMFIEDHKRRADSDPNAPPFDDLRNYAYEGGGSTAGSLSSLASGTDDEVHDYDYLGAWGPRFDKLADLYGPELDEQL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: