MonarchBase - Protein-coding gene

DPOGS201962
Transcript	DPOGS201962-TA	5328 bp
Protein	DPOGS201962-PA	1775 aa
Genomic position	DPSCF300060 - 642962-654917
RNAseq coverage	77x (Rank: top 65%)

Annotation
*Heliconius*	HMEL005087	62.71%
*Bombyx*	BGIBMGA010542-TA	88.25%
*Drosophila*	Cad86C-PF	42.55%
EBI UniRef50	UniRef50_Q9VGW1	42.71%	Cadherin-86C n=20 Tax=Drosophila RepID=CAD86_DROME
NCBI RefSeq	NP_788635.3	42.66%	Cad86C [Drosophila melanogaster]
NCBI nr blastp	gi\|353526343	42.71%	cadherin [Drosophila melanogaster]
NCBI nr blastx	gi\|353526343	42.53%	cadherin [Drosophila melanogaster]

Group
Gene Ontology	GO:0016020	7.6e-26	membrane
	GO:0005509	7.6e-26	calcium ion binding
	GO:0007156	4.2e-23	homophilic cell adhesion
KEGG pathway
InterPro domain	[474-581] IPR015919	7.6e-26	Cadherin-like
	[478-587] IPR002126	4.2e-23	Cadherin
Orthology group	MCL15154		Insect specific

Nucleotide sequence:

>DPOGS201962-TA
ATGACCTTAACGGCGGTGCTGGTGTTATTGACGCTGGCTGCGGCAGCTCACAGCGGCGATCCCGTGTTCGACCCCAGCACACTCATGAGGCTCGTGCTGGTGCCGGCAGACGCGGCCACCGGCTCCGTCATCTACCGCGTTCGAGCTTCCGATCCGGACTTCGATTACCCCCTGCACTTTGAACTTATCGGGCAAATGGGCAGACTCGACATAGGCATTGAGACATTACCTTGTACTCGGTACAATTCAGTCTGTCAAGCCAATGTGATATTGCTAAGGAGGCTGGAGCCAGGCCGCTACGTGGACTTTAGGCTGTCGGCTCGGAATACCAGAGGGCGAAGTGCTCGAATTGCCTGCTCGATCACAGGCACTAATGCTACTACCCCTCGAGATACTATATTTCCTCATCAACCCAGTATCATTTTGGTGCCAGAGGATGCGAAGAGAGGAACCGACCTTGAAATTGTAATTGCAAGGAAGAATCCAGTATCCCCAAAACCTCTGGAGTTGGAGCTTTGGGGTTCACCGCTCTTCGCAATCCGTCAACGCCGAGTTTCTAGCGAGAATACCGAGGGCACAATATTTTTAGTTGGTCCATTGGATTTTGAGGCTCAATCCATGTATCACCTAACATTGCTCGCTGTTGATCCCTACGTCGAAATAGGCAAGGACACGCGAAATATAGCTGGTTTAGAGGTTGTGGTGGTTGTGCAAGATGTTCAGGATATGCCTCCTGTTTTTACTTCAGCTCCACCCATCACCCATTTACCTCGACAAGTAATTCCTGGTGATATGATTGTAAGAGTAAGAGCTGAAGATGGAGACAAGGGTGCTCCTCGGCAAATAAGATATGGACTAGTTTCTGAAGGGAATCCGTTTACACCGTTCTTTAACATCAATGAAACAACAGGTGAGGTAACTTTGGAACGGCCGATTGAAGAAATTGCAGCAATATCACACGCTGGAGCACCAATACTTCTTACTGTTGTTGCTGAAGAAGTACGACTTTCCCGGGAGGAACCGGAGGCTATGTCATCGACGGTTCAACTGGCGTTCATTTTACCTGAAAGGGATAATTCTCCTCCGTATTTTGAAAATGAATCTTACATTACACATTTGGATGAAAATGCTCCGCAAGGTACAGCTTTGGTATTCAACGATCCGTATATACCGCAAGTGAATGACAACGATGCGGGAAAAAACGGAGTGTTTTCTCTTTCGTTAGTTGGAAATAATGGGACTTTTGAAATATCACCAACAGTGGCGGAGAGACACGCGCAATTCATTATCAAAGTGCGGGACAATACTATGCTGGATTATGAAGCCAGAAAATCAGTCGTGTTTCAGATTTTGGCACAAGAACTTGGTCCAGCAACAAACTTGTCAGCAACTACGGATGTGACCGTTTACTTGAATGATGTTAATGATAATCCTCCTATTTTTTTGGCCTTATCTTATGATGTGGAATTGCCAGAAAACGTTACAGCTGGAACTAGAGTTGTCCAAGTTGCAGCTGATGATGTAGATACAGGGGCATATGGAAAAATTCAATTTACTGCCATACTAGGATATTTAAATACTTCTTTAAATTTAGATCCTATAACAGGAGTTATAACTGTAGCAACAAATAATCACGGTTTTGACCGTGAAGCAATGCCAGACCTGCATTTTTTAGTAGAAGCTAGAGATAATGACGGTATAGGATTAAGAGTAACAGTGCCATTAATTATTAAGTTATTAGATGTAAATGATAACCCACCAGAGTTTGAAAGGGCCTTATATGAATTTGTATTGTCTCCGAGTTTAAATAATTTTACTTCATCGGCATTTGTGAAGGCTGTTGATAAAGATGCCGAACCACCAAATAATGTAGTCAAATACGAAATAATTGAAGGAAACCGTGAGGGTAAATTTGCTATTAATGAAGATACAGGGGAAATTTATTTATTAGAACCATTGAAAAGAATCACAAAGAAAAATGCAAATAGGCGTAAAAGGCAATTTGATAATCAAGAAGAGAGTGAAGTTTATATGTTAACTATTCGAGCCTATGATATGGGAGTTCCAAGGTTGTTTTCAACAACAACAGTGAAGATTTATCCTCCAGAAAGTAAAACTAGAACTATGTCTTTCATTGTTCCCGGTGCTAATCCAGATAGAAAAAAATTAGAAGAAGTTTTGAGCACATTATCTGGAGGAAAAGTAACTATTGTAGATATAAAACCTTACAAAACTAATGATGATAAAGGTTCAATAGATCAGAGTGGCCAGGCGTCTAGTCAAGAAAAAAGTGTGGTTACTGCAGTAGTTCGTATGGCTGGTAATGCTGCTATTAATGTTGCAAAACTTCAAGAACAATTATCAAAGAATATCACATTATATTCCACCACTGTCGTGCAGAAGGATCAGACATCAATAATTGATAACGATTCTGGCGTGTATAAAGCGGAGAGTCGATTATTATTCTGGCTTTTAATCTTATTAGCAATATTAATAGCTCTCGTTTTATTACTTCTTATATGTTGCTGTATTTGCGAAGGTTGTCCATTGTATATGCCACCAAGGAAAAGAGTGATACGTGTCAACTCCACAGAGGACGACGTGCATTTAGTGGTCCGCGACAAGGGAGTTGGGAGGGAAAACAAGTCGACCCAAAACTTAGAAAGTAAATCAATACAAGCACCTGAATGGAGGAGAAGAGAAGCTTGGAGTGCCGAACAAACAGATATTAGAACAAAACCAACACAATGGAAATTCAATAAAAGAAATTATAAATCAAAGGAACTGAGTAAACCCGCTTCTACGCCTGGTGACATTAGACAAGAATTTGTGCAAGCTGCCACTGATAATGATTATAAATACGATGATTCTAGACAGTCTTTTCGACGAAGGGATGGCCCCAACATAATTTATACAAAAGAAATCCAACTTGAAGATAACTTTGCTAGTAAGCATAAAGAGTACATAGAAGATCTTGAAAATGGTTATGATAGAATAGCAACTCTTCACCATCAACGAAAAGATCAGGACAATGATTCTATAAGAAGACATGAAATCGATCGAGGGTCTGAGGTTGAAGGCGATCATAAGACTGATGATAAAAATTTCCATGGTGAACATCGATTAAAAATTGAGTACGCTGATAAGCGCGACCCGTCTTCCATGGGCAGAGATCAATTTTTCATTAAAGAGGGAAACACTGAAATATTAAGGCTCGTTACACGGGGAAAAACTGAGGACGAACGATACGTTAACCTTCCTATTCAACAACAACAACGACCAGTTACATTAATTCCTCACACTCAATATGTAGTTGTGGATAATGGTAAGGAATTGTTAATGGAACGATTTATTAGAGAACAAGAAGAGGAAGCTAACAACATAAGGGAAAGAATGAGTAAAGTTGTAACTGATTTAGACAACGTCCAATCGCCTCAAGATGGTAAAAAGTCTCAACTAATTATAGACAAACATAGTTTTCCGCCTGAATACACTAATATGACACCAGAAGTCCCAGGGGCAGTTCCTCATAAATCGGATTATTTACAATCTGCACTTATAGAAATGCACAATAAGTCATCTATTCACCAAGAACTATTGGAATCATCATTAAGAAAGCAAAATGAACTTTTACATCAAATATTAATTGAACGTGAAAGAATATTACACAATCAGGAAACAGCATCTCAAGTGGAAAATAAGTTAGAGACCCAAAGTTTACCAGGACATGCTGTGATGGCTACTCAAACTGAGTGTCATATTGGAACTCAAACAGATTCTCATTTACTAAATGAAGTGAAACGGAAATCTCGTAGTGATAATGAATCATACAGTGAAGACGAATCACAAAAAAATTCAGATAAAACCCATAAAGTAACATGGGTTAAAAAGAAAAAACCAAGAAAAAAAATTAAATACAAAGACCCGAGGCGTAGTATACGTGTTTATGAATTGAAAAGAAAAATTAAAACGCCTATAATTGAGGAAAGCGACATATCACCATCTGCAGAGAATGAAAAGCAGATTAAAATAAGCAAAACAAATGAAAGAGAGGAAAGAATCAAACATTACGGTGACATCACCAAAAGTACGGTTACTACTTCTAAGAATGAATATGTCAGTTCCACACAATATAAAAATTCAGAACCCGACAGAAAACTTAAATCTCGTAGAGAAGTATTGATGGAAATATCAGATTCTTTGGATGAAAAATCAACACTTGATAAAAAACAACAACAAGAACCATCTTCTTCTTCATCTTCGAGAACTGAGAATTTCAAAAGAACTATTTCCTATGACCATGAAAGTAATAAGGGCTCTCACAGTGGCACAGATTCACCAGGTGAAGATAAACGGAACTCAATATTCTCGCGACAAGCATCTTCAGAAGAGGCTAAAGAAAATATTTGTAAACAGTTGGAATGTCATAGTAAAAGTAATAAAATTGAAAACCATCAAGAGCTTAGTGATAAAGACCTTTCAACTAACGACTCCATAAAAATTAAGGAAAAAGAGAATAAGGAATCTATGAAAACTAATGAAAAGCCTGTTAAAAGTTTACCACGATATATGCAATGGTATGGCAAAAAATCAAAACCTTCAACATCTGAAAAAATCGTACCAGACAAACCAAAAAGACCATCTAAAATAAAAATAGAACAAGAAAGAGACACAAAAGATAGAACAAGCCGATACGGTAAAATTATTAGCAAAGATAGTCAAGTTGGCGAAGTAAAAAAAAACTTCAAAGAAAAAGAGAGTGATTTTATCCATCCTCGCTTATTAAAAGAAGGAAAGGTAACACCTGTTCCAGAAGGACCGTTACCTGATGTACATCCCTTGTTACAACACTCAGAGCACAGATACGAGCACCAGTACCAAAATCAAAATCCTCTATGTTACGTTCAACAAACACATATACCAAAATACTTAGGTAGCCAAACTGAAAAACCAGTGTTGCCACAAAGAACTTCTTTAGAGCAACAGCCAATTTATGTCAATCAAGACGGTGTAACAGAAAACAGCACAAAACCGGATATTGCAGAAAGTGCCTTAACTCATAGCATTGCTATATCAAGTGCGTATGGAAAAGAACAAAAAACTGCGTCGGAAGTTCACGTCTCCAAAATTAAAATATCGGGTGAAACGATTTCTGAGAATCAAAGAAAATTGGACGACAATGATTCAGGCATAGCTATGAGCACACTTGTACACCAAACAGGTATTAAGAGATTACCTATAACGGAGAAGAAAAGTGTGTTTACTATTGCATACGACGACGTACAAACGAAACAACTACGGCCTGACAGCAGCTCCACCTCTTATTAA

Protein sequence:

>DPOGS201962-PA
MTLTAVLVLLTLAAAAHSGDPVFDPSTLMRLVLVPADAATGSVIYRVRASDPDFDYPLHFELIGQMGRLDIGIETLPCTRYNSVCQANVILLRRLEPGRYVDFRLSARNTRGRSARIACSITGTNATTPRDTIFPHQPSIILVPEDAKRGTDLEIVIARKNPVSPKPLELELWGSPLFAIRQRRVSSENTEGTIFLVGPLDFEAQSMYHLTLLAVDPYVEIGKDTRNIAGLEVVVVVQDVQDMPPVFTSAPPITHLPRQVIPGDMIVRVRAEDGDKGAPRQIRYGLVSEGNPFTPFFNINETTGEVTLERPIEEIAAISHAGAPILLTVVAEEVRLSREEPEAMSSTVQLAFILPERDNSPPYFENESYITHLDENAPQGTALVFNDPYIPQVNDNDAGKNGVFSLSLVGNNGTFEISPTVAERHAQFIIKVRDNTMLDYEARKSVVFQILAQELGPATNLSATTDVTVYLNDVNDNPPIFLALSYDVELPENVTAGTRVVQVAADDVDTGAYGKIQFTAILGYLNTSLNLDPITGVITVATNNHGFDREAMPDLHFLVEARDNDGIGLRVTVPLIIKLLDVNDNPPEFERALYEFVLSPSLNNFTSSAFVKAVDKDAEPPNNVVKYEIIEGNREGKFAINEDTGEIYLLEPLKRITKKNANRRKRQFDNQEESEVYMLTIRAYDMGVPRLFSTTTVKIYPPESKTRTMSFIVPGANPDRKKLEEVLSTLSGGKVTIVDIKPYKTNDDKGSIDQSGQASSQEKSVVTAVVRMAGNAAINVAKLQEQLSKNITLYSTTVVQKDQTSIIDNDSGVYKAESRLLFWLLILLAILIALVLLLLICCCICEGCPLYMPPRKRVIRVNSTEDDVHLVVRDKGVGRENKSTQNLESKSIQAPEWRRREAWSAEQTDIRTKPTQWKFNKRNYKSKELSKPASTPGDIRQEFVQAATDNDYKYDDSRQSFRRRDGPNIIYTKEIQLEDNFASKHKEYIEDLENGYDRIATLHHQRKDQDNDSIRRHEIDRGSEVEGDHKTDDKNFHGEHRLKIEYADKRDPSSMGRDQFFIKEGNTEILRLVTRGKTEDERYVNLPIQQQQRPVTLIPHTQYVVVDNGKELLMERFIREQEEEANNIRERMSKVVTDLDNVQSPQDGKKSQLIIDKHSFPPEYTNMTPEVPGAVPHKSDYLQSALIEMHNKSSIHQELLESSLRKQNELLHQILIERERILHNQETASQVENKLETQSLPGHAVMATQTECHIGTQTDSHLLNEVKRKSRSDNESYSEDESQKNSDKTHKVTWVKKKKPRKKIKYKDPRRSIRVYELKRKIKTPIIEESDISPSAENEKQIKISKTNEREERIKHYGDITKSTVTTSKNEYVSSTQYKNSEPDRKLKSRREVLMEISDSLDEKSTLDKKQQQEPSSSSSSRTENFKRTISYDHESNKGSHSGTDSPGEDKRNSIFSRQASSEEAKENICKQLECHSKSNKIENHQELSDKDLSTNDSIKIKEKENKESMKTNEKPVKSLPRYMQWYGKKSKPSTSEKIVPDKPKRPSKIKIEQERDTKDRTSRYGKIISKDSQVGEVKKNFKEKESDFIHPRLLKEGKVTPVPEGPLPDVHPLLQHSEHRYEHQYQNQNPLCYVQQTHIPKYLGSQTEKPVLPQRTSLEQQPIYVNQDGVTENSTKPDIAESALTHSIAISSAYGKEQKTASEVHVSKIKISGETISENQRKLDDNDSGIAMSTLVHQTGIKRLPITEKKSVFTIAYDDVQTKQLRPDSSSTSY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: