MonarchBase - Protein-coding gene

DPOGS204438
Transcript	DPOGS204438-TA	5274 bp
Protein	DPOGS204438-PA	1757 aa
Genomic position	DPSCF300002 - 127653-145016
RNAseq coverage	614x (Rank: top 21%)

Annotation
*Heliconius*	HMEL017401	67.35%
*Bombyx*	BGIBMGA013573-TA	62.14%
*Drosophila*	Cad87A-PA	38.04%
EBI UniRef50	UniRef50_D6WC50	45.55%	Cadherin 23 n=2 Tax=Neoptera RepID=D6WC50_TRICA
NCBI RefSeq	XP_392736.3	47.24%	PREDICTED: similar to Cad87A CG6977-PA [Apis mellifera]
NCBI nr blastp	gi\|340729964	47.18%	PREDICTED: cadherin-87A-like [Bombus terrestris]
NCBI nr blastx	gi\|328782343	47.23%	PREDICTED: cadherin-87A-like [Apis mellifera]

Group
Gene Ontology	GO:0016020	2.2e-36	membrane
	GO:0005509	2.2e-36	calcium ion binding
	GO:0007156	3.6e-35	homophilic cell adhesion
KEGG pathway
InterPro domain	[631-734] IPR015919	2.2e-36	Cadherin-like
	[635-739] IPR002126	3.6e-35	Cadherin
Orthology group	MCL16017		Insect specific

Nucleotide sequence:

>DPOGS204438-TA
ATGGCTGCCGGTGTTCTGGACAGCTCTGATCTGCTTACGATAAAATATGGTTTAGTTGGCACGGACAAGTTTGCTGTGAATTCAGATACGGGGAATGTGACTCTTATACAGCCTTTGGACAGAGAGAAAGAAGACACAATAAAATTCCTCGTGTCCCTTGAGAACAGCGACCCTGGGTCAGGTCAGACCCTGGTCCAGACTCAGTCCGTCACCGTCATCATAGTTGACGAAAATGATAACCCACCACTCTTCAAGAATAGTCCCTACGAAGTTAATGTGGCGGAGGACGAAGTTGTTGGGACGACGGTATTGAGTAACATAACGGTCGAGGATACTGACTCCGTGGGCGAGGCGCTGGAAGTGGGCTGCGTGGCCAACGAACAGTGGCCAGAAGCCTGCGATCTGTTCGAGGTGGTGAGTCTCCATTCGACTGCGAACGAGTTCACAGGAGCTCTGGTACTGAAAAGGTCTCTGGACTACAACGAGAAGCAGTTCTACCAGTTCCAGTTACACGCCACGGACGGGACCCTCAACTCGTCATCTCCGGTGGAGGTGAAGGTGGTGGACGTCCAGAACACCCCGCCGGTGTTCAGCGGGGCTCTGAGCGCGGCCTTACCTGAAGACGCGCCCGTCGGCAGCCTCGCCCTCGTCATCAGGGCCAAAGATGGAGACCGAGCACAGCCTAGAGACGTGCAGCTCGAACTGCTTACAAACCCAATGGACTTCTTCGTACTGGACAGTAAGACCGGTGAACTGAGAACAGCTAAGCCTCTGGACAGAGAAGCCCTGGCCGATCCGAACTCACCGCTCAATATTACGGTTAAAGCCACTGAGCTGGTGGACGGCATCCCCGTGGAATCCCCGTTGAGTGTGACCCGGGCGGCGGTGGCTATCACCATCCGCGATGTCAACGACGAGCCGCCACGGTTCAACCGCCGCGAGTACTCCGTGGAACTGCTGGAGAGCCTCGCCCGGGGCACGCCGCTGCCACACCTGGACATGGTCGTCACTGACACAGACCTGGGCATGAATTCGGTGTTTTCATTGAGACTAGCCGATAACCTGGGTGCGTTCGTGGTGGAACCCTCGGTGGCCACCGGCAGCGCCACCGTCACCTTAAGACTCAACTCCACCCTGGACTACGAGGATCCCAACCAGAGAAAGTTCATTCTGGAGGTGATCGCGGAAGAAGTCCACACGTCTCCAGCGCTCTCGTCCAAGGCCAGTGTGACAGTGTCGGTGAAGGACGTCAATGATAACTCCCCGGAGTTCGCGGACGACTCCTACTCCGCCGGGGTCAGGGAGGACGCCGCTCCCGGGACCAGACTGGCCGCTATCAAAGCCACGGACAGAGATACGGGGAGATTCGGTACCGAGGGTATCGTGTACCAGCTGTCGGGTAACGGGGCGGAACTGTTCTCAGTGGAGCCGAGGAGTGGAGTCATCAGTGTGGCAGAGTGCGCCAGCCCGGGGGTTGGACCCTGTCTGGACTACGAGACACGGAAGGAATACTTCTTACAGTACAAGGCTACAGATGACGACGGTGCAGGTCAGAGCAGCGTGGTGTCTGTCCAGGTGTCGGTGAGGGACTCCAACGACAACCCTCCCGTGTTCCTGACGCCGGTGTACCGAGCCTCCATAGACGAGGACGCCACTAAATTCGAACCGGAACTACAGGTCCAGGCGCGCGACCTCGACCCGACGTCCGACGTGCGCTACTCCATCGTCTCTCCTCACAACCCTCCCTTCTGGGTGGAGCCTTCTTCCGGTCGCATCTCCGTGCTGCCCGGCAAGCTGCTAGACGCCGCGGACAACAAATACATACTCACTGTGATGGCCTCTGACGGCCGCTTCAACGCGACGTGTCGCGTGGAGGTGACCGTCCGTGACGTCAACGACCACCCGCCCGTGTTCGCCACCACCACCTACGACGCCAGCGTGTCCGAGGACGCCGCCATCGGGGCGGAAGTGGCGGCGGTCCAAGCGACAGATCTGGACAGTGGGATGAACGCTCAGATCAGATACAACATACAGAAGGGAGCTCTGGACGCCTTCAGGATACACCAGGACACGGGGGTCGTAAGCGTGGCCGGCGGACTCGACTACGACCGCAAGAACACCTACCACGTCCTCATCACCGCCACCGACATGGGTGTCCCCAGTCTGACTGGCACCACGGAGTTGACGGTTCACGTGCTGAACGTGAACGACAAGAAGCCGGTGTTCAAACCCGCGGTCCAAAGAGCCGGGGTGTCCGCAGACGCTGAGACCGGCACCCTCGTGTACCAGCTCGTGGCGGAGGACCCTGACGCCGACGAAGGCAGCTTGAGGTTCGGGCGGGGAGATAGACCCGTCAGGGCGGTGGACGTCAACGGACAAGAGGTGAAGGATGACGGCACGATAGCCTTGTGGTTCCTGGTGTCCCCGTCTGGCGAGGTGTTCGTGTCTCAAACCCCGGACCGCTCCCGGGCTGCGGTGGTCACGTTGCCCGTCTCCGTCACCGACCAGTCCGCGCCCGTGCCGCAGACCACTGAGGGCGAGCTCATAATAACCATAGTGGACGTGAACCGTCAGCCGCCCGTGTTCTCTCAGCCGGCGTACGTGGAGCGCCTGGTGGAGGAGCAGAGCCCGGGGACGGTGCTGGCCTCCTACAGCGCCACGGACAAGGAGACGCCCATCGCCTCCATCGTCATACACCCGCCCAGCCCGTACTTCGATATCGACAATGTCACCGGTGAAGTGAGGGTAGCCAGCCGTATTGACTACGAAGCCACTCCGTCCTTGAACTTCACGCTGGTGGCGTACGACTCTGGCGTCCCTCAGCTGTCGTCGTCGGCGGCTGTGTTCGTCGAGGTGGTCAACATTAACGACGAGAGGCCCGAGTTCAGCGCCGACCTGTATAACGCTACGGTGGAGGAACACTCCACACCTGGGACCAGTGTGCTGAACGTGTCTGCTGTAGACCTCGATGCAGGCGACTTCGGCAAGATAACCTACAGTCTGTCCGGGGAATCAGCCAGCCTGTTCACCATCAGTCAGGAGGGAGAGATCACAGTGGCGGAGGGAGCGGATATCGACAGGGAAACCACCTCAGAGCTGTGGTTCCGTGTGGTCGCCACAGATAACGCGCCGCCACAGACTAAAAAATCTTCCAGTGTACCGGTCCACGTCATCATCACGGATATCAACGACAACCCGCCGGTGTTCAGTCAGCGTGTGTATAAGGGCAGCGTGTCGGAGAACGTGCCTCTGAGTCCCCCGCCCGCCCTGCTGCAGTTGAGGGCGGAGGATCTCGACCAGGGCGAGTACGGAACCGTCACATACAGTATCGAGGACCAGAGTCAACCAGGAGTGTTCCGTGTGGATCCCCAGACGGGCATCCTGTCTCCAGTGCGGCCGGTGGTAGGCGGCGCCCTCTACCAGCTGGTGGTGGCGGCCAGTGACGGTAGCCACCGCGACACCGCTCGAGTCGACATCACAGTACTGAGCGTCAACAAACACAGCCCCGTGTTCGTGCAGCCGCCGCCAGATGTCAGGCGAATCGAAATACCCGCTCACGCGGCTCAAGCTGGCTACCTCATAACGACCATCCAAGCCACGGACGAGGACCCGGGGGAGAACGGCCGAGTGACGTACCATCTCAAAGTGGACAACCAGAACGTTGGACACACCGAGGAGTTCAGTCTGGATCCTGTGACAGGACAACTCACCACCAGGGTACCTTTGGACATCGACAGCCAGGCGGAGTACCAGCTTATCGTGTCTGCGTCTGACGGCGGTACTCCCAGCCAGTTCGAGGCCCTCCGCGTGCTGCAGGTGGTGGTGGTGGACGATCAGGACCACGCGCCGGCCTTCCTTCACAGGCACTACCACTTCAGCGTCACGGAAAATTTACCCTCCGGCGTCATAGTGGGCACGGTGAAGGCCATAGACAAAGATAGAGGAGACAATGGGAAGGTGTACTATCATATACTGGAGGGGAACCAGGACGGCGCCTTCACACTCGACAGGACCCAGGGCATCATAAGGGCCAGCATGAGCTTTGACAGGGAAAAACAGGACGAATACTCCATGACAGTATACGCCAGCAACAATCCCATACTAGAGCATGCGGCGGCCATCTTGAATTCCATAGACAACAGCACGGAGAGCCAAGACGTCAGCGTCACCACCATCAAGATCAGAGTACTCGACGAAAATGATAACGAGCCTAAATTTGAACAGAAGGTGTACTACGCGGGTGTATCTCCAGGTGCTCGTGTTGGCGAGGTGATAACGTCACTGGTGGCTCGTGACCCTGACCTGGGCGTGAACGGTTCCCTGCTCCTGGCGGTGGCAGCCTCTCACCTGTATAAGTTCGGCTCCACCACCTCTAGTGGCAGCGTTGTGCCTTCACCTTTCAATATTACACAGGACGGTGTATTGACGACGGCCACCCTGATGTCCGACTACCGCCAGGACAGGTTCGTGCTGGACGTCATCGCCCAGGAGTTGGCGCCCCCTCACCGACAGGACACCGCGCAGGTCTATATCTGGATCATCGATCGTTCGTCGGTCCTCCGGCTGGTGGTGTCTCGTCCGTGTTCCTCAGCGGGCGCGCCTCACGCTCGCTTGTCGTCGGCGGCGCGGGCCCTGCTGGTCCCGGGGCGGAGGGCCGCGGTACACACCGCCGGGGACGGCAGATGGTGTGAGCTCCAACTGCACGCCGTGGACCCCGTCACCTTCCAGGTGTTGGATGTCCGGCGTGTTCTGGAGGACATCGACGCCCAGTACGACGCGCTCCGCCAGCTCTACCAGGAGTATGGAGTAGAGACGCTCACAGCCGCCGCATCAGGAGATAAAGCTCCTGAGAGCTTCGATCCAGCTCTTGCAGCACTTATAGCGCTTCTGATAGTGCTGTTCACTGGCATCGTCACATTCATCGTGGTCTGCGCCTGTCTTAAACACTGGGTGGTGCCGCCGCCGTCACTACAGTCCAGTAAGGGAGATAGTCTGGCGCGGAGGAGGATCCTGGAGGAACTCAGCACCACCGAGAACCCGCTGTGGCTGGAAACCAAGCTCAGGCCGTACGAGGAACAGGAGCTGACCATGAACGTGGACAACACGTACGCCACCATCGAGGGAGGCCGCTCCAGGTGTGAAGACTACGCCACGCTGACACCAGACCTGCATCAGCTGGAACACGCCACCACAGCGCTGGAAGCAGCTCTAGGATTCCAGGGCAGTACGTTCAAGCCTGAGAGAGAGACTCCCGAGCCGCCTCCTCGACCCTGA

Protein sequence:

>DPOGS204438-PA
MAAGVLDSSDLLTIKYGLVGTDKFAVNSDTGNVTLIQPLDREKEDTIKFLVSLENSDPGSGQTLVQTQSVTVIIVDENDNPPLFKNSPYEVNVAEDEVVGTTVLSNITVEDTDSVGEALEVGCVANEQWPEACDLFEVVSLHSTANEFTGALVLKRSLDYNEKQFYQFQLHATDGTLNSSSPVEVKVVDVQNTPPVFSGALSAALPEDAPVGSLALVIRAKDGDRAQPRDVQLELLTNPMDFFVLDSKTGELRTAKPLDREALADPNSPLNITVKATELVDGIPVESPLSVTRAAVAITIRDVNDEPPRFNRREYSVELLESLARGTPLPHLDMVVTDTDLGMNSVFSLRLADNLGAFVVEPSVATGSATVTLRLNSTLDYEDPNQRKFILEVIAEEVHTSPALSSKASVTVSVKDVNDNSPEFADDSYSAGVREDAAPGTRLAAIKATDRDTGRFGTEGIVYQLSGNGAELFSVEPRSGVISVAECASPGVGPCLDYETRKEYFLQYKATDDDGAGQSSVVSVQVSVRDSNDNPPVFLTPVYRASIDEDATKFEPELQVQARDLDPTSDVRYSIVSPHNPPFWVEPSSGRISVLPGKLLDAADNKYILTVMASDGRFNATCRVEVTVRDVNDHPPVFATTTYDASVSEDAAIGAEVAAVQATDLDSGMNAQIRYNIQKGALDAFRIHQDTGVVSVAGGLDYDRKNTYHVLITATDMGVPSLTGTTELTVHVLNVNDKKPVFKPAVQRAGVSADAETGTLVYQLVAEDPDADEGSLRFGRGDRPVRAVDVNGQEVKDDGTIALWFLVSPSGEVFVSQTPDRSRAAVVTLPVSVTDQSAPVPQTTEGELIITIVDVNRQPPVFSQPAYVERLVEEQSPGTVLASYSATDKETPIASIVIHPPSPYFDIDNVTGEVRVASRIDYEATPSLNFTLVAYDSGVPQLSSSAAVFVEVVNINDERPEFSADLYNATVEEHSTPGTSVLNVSAVDLDAGDFGKITYSLSGESASLFTISQEGEITVAEGADIDRETTSELWFRVVATDNAPPQTKKSSSVPVHVIITDINDNPPVFSQRVYKGSVSENVPLSPPPALLQLRAEDLDQGEYGTVTYSIEDQSQPGVFRVDPQTGILSPVRPVVGGALYQLVVAASDGSHRDTARVDITVLSVNKHSPVFVQPPPDVRRIEIPAHAAQAGYLITTIQATDEDPGENGRVTYHLKVDNQNVGHTEEFSLDPVTGQLTTRVPLDIDSQAEYQLIVSASDGGTPSQFEALRVLQVVVVDDQDHAPAFLHRHYHFSVTENLPSGVIVGTVKAIDKDRGDNGKVYYHILEGNQDGAFTLDRTQGIIRASMSFDREKQDEYSMTVYASNNPILEHAAAILNSIDNSTESQDVSVTTIKIRVLDENDNEPKFEQKVYYAGVSPGARVGEVITSLVARDPDLGVNGSLLLAVAASHLYKFGSTTSSGSVVPSPFNITQDGVLTTATLMSDYRQDRFVLDVIAQELAPPHRQDTAQVYIWIIDRSSVLRLVVSRPCSSAGAPHARLSSAARALLVPGRRAAVHTAGDGRWCELQLHAVDPVTFQVLDVRRVLEDIDAQYDALRQLYQEYGVETLTAAASGDKAPESFDPALAALIALLIVLFTGIVTFIVVCACLKHWVVPPPSLQSSKGDSLARRRILEELSTTENPLWLETKLRPYEEQELTMNVDNTYATIEGGRSRCEDYATLTPDLHQLEHATTALEAALGFQGSTFKPERETPEPPPRP-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: