MonarchBase - Protein-coding gene

DPOGS207309
Transcript	DPOGS207309-TA	5382 bp
Protein	DPOGS207309-PA	1793 aa
Genomic position	DPSCF300008 + 1446721-1459609
RNAseq coverage	78x (Rank: top 65%)

Annotation
*Heliconius*	HMEL007112	90.37%
*Bombyx*	BGIBMGA012092-TA	85.53%
*Drosophila*	axo-PC	62.37%
EBI UniRef50	UniRef50_E2B6S3	64.44%	Contactin-associated protein-like 2 n=8 Tax=Endopterygota RepID=E2B6S3_HARSA
NCBI RefSeq	XP_394721.3	62.12%	PREDICTED: similar to axotactin CG18296-PA [Apis mellifera]
NCBI nr blastp	gi\|383852936	63.58%	PREDICTED: uncharacterized protein LOC100875110 [Megachile rotundata]
NCBI nr blastx	gi\|383852936	59.68%	PREDICTED: uncharacterized protein LOC100875110 [Megachile rotundata]

Group
Gene Ontology	GO:0005515	3.5e-07	protein binding
KEGG pathway	hsa:26047	1e-69
	K07380 (CNTNAP2)	maps->	Cell adhesion molecules (CAMs)
InterPro domain	[310-496] IPR013320	3e-40	Concanavalin A-like lectin/glucanase, subgroup
	[324-486] IPR008985	1.7e-33	Concanavalin A-like lectin/glucanase
	[120-256] IPR012680	1.2e-16	Laminin G, subdomain 2
	[350-484] IPR001791	4.7e-15	Laminin G domain
	[1104-1130] IPR006209	3.5e-07	EGF
Orthology group	MCL14695		Insect specific

Nucleotide sequence:

>DPOGS207309-TA
ATGGGATTGCGGGTAAGACGAGGCTTATACGTCACCATCATACTCATATCCTATGGAATAGCTGATGTTGACTTGAGTTTGCCAGTAGATTTAGCAGTAGAAGAGAAGGCACCACAGCAAACTACCCTCCCTGCCACTTCCACCTCACCTCTCCCAACCACCATTAACGTGTCAACATCTACATACGCCACGATCATTCCTCCCATCCCACCCAGCGATCGAGACAGATTCCTGACTTTCGCCGAATCAGGCCACCACCAGACTTTTATGTTTGCCAAGGACAATACCTACATACAGCTTGACGGAGATATTATCCAACGATTTCAATTAAGATTGTGTAGAGAAATATCGTTTAAATTTAGAACAAGACTTCCCCACGGACTTTTAGTTTATCACAATGTTAAAAATCCAGTGTTCAAAATGCAGCCTTATGCATTATACGTTATAGTTGAGAAAGGTGAACTTAAAGTTGTACATGTTTTTGGTAAGCACTTAACCTCAGTGACAGTTGGCAGAGCATTGAACAGAGATCAGTGGCATAGCGTGGTTGTTACCATAGATGTGCATGGAGCAAGACTTATAGCCAAAGTAGACAATTTAAAAGAAGAGGTTTATCTAAAGGGACTAAGTTTCGATACTAATTATGGAATAACAGATAATTTAACTTCAGTTATACTTATTGGAGGTTTAAGTTCTGAAGAAAAATTACATGGAGTGAAATATATCATTGAATCATTCGTTGGTTGCATCAGCGATATGGTTCTTAGTTCCGGTAAAGCTGCCTCCGACCTTCTACCGATAGTACCGTTGATCGCAACAAAACACGAAAACGTTAAAGAAGGTTGCATAAACAAATGTAAAACCATGGAAAACCTTTGCTTCGAAGGTTCTAGATGTATCAACGAATACAATGGGTACAGATGCGATTGTTTTGGCACTCTATACGAGGAACAGCTATGTGATGTGTATACGGCGACAATATTAACACTGCGAGGGTCGAGCTACGTATCCTACCGCGTCTATGATTGGAAGGATCGCGTTCATTCTACAAACACAAGGGTCAGCTTGCATTTTAAGACACGTTTTGACGACTCCGCTCTTTTTTATGCAAGCGGTCAAATAGATGACAAACACCATTACATAGCACTGTCGATCCATCAGGAAAAAGTCGGTATACAAATAGATTTAGGCGATGGTCCAGTAGAGGATTATTTAGGAGTGAGAGTAAATAATAATATGTGGCACAATATAACTGTTATATTGCAAGAAAAAACAGTTCACGTATACCTCGACAATATAAGCGCAATATACGAAGTACCGGGCGACGCGAGATTTGTTTGCATCGACCCAGAAATATACATTTGTGGTGGTCCAGATTTGCACAAAATGAAAGGTCTGAAATCTTTCAACAATTTCGCTGGAAATCTCAAGTACGTTTACTACAATGATGTATCGATTTTGTATGAGTTGAAGCAGAATAATCCAAAGGTCCATTATATTGGAGTATTGGATCCCGAATTCGAAGATATAGATATAGAGCTAATCCCGATAACATATCCTTTTGCCACATCGCACATATGGTGGCCTTTGAATCAGAGTAATAGTATAAATCTGGTTTTCGATTTTAAAACTAGCAAGAATATGGCTGTACTAGCTTACAGTCAGATAACTTCGGGACAAGGTTATTTCGAGGTGAGAATGGTCAAAGAAGAAATTCGGTTCGAACTAGTACCGGATGTTGGTAAAAATGTAACAGTTCTAAAATCTGTTAAATTTAACGTAAGCAACGACTGGCATAATGTGGAATTGGATTATAGAAAAGGAAGAATCAAACTTACTGTGGACTATCATAACAAACACGCTCAGATGTTCGGTTTAGATTTTCAATTACAAGATAAGATTGTAATAGGTAGTGGACTGAAATCAGCTAATCTAGGTCTTATTGGGTGCATGAGAAATATCAAAATAAACGGCCTACAAATTGAACCACGATACGTTATAAATACGGAACGCGTGGTGGGTGAAGTGGCTATAGATGACTGCCGCTACGTGGACCCCTGCACCAGACCGAACACTTGTGAGCACGACGGTATATGCTCTATACGGGAGGACAGAGTCATATGCAATTGTGATAACACCGGCTACATTGGTGAGAACTGCCATTTTGCTACCTTCAGGAAGACTTGTGAAGAGTTAGCTCTCCTGGGCTATACACGTAATGACGTGTACTTGATAGATATCGATGGTAATGGAAAATTTCCACCAGCTCACGTGAAGTGCGAATTCCAGATCGAAGCGGATTCATCTACTACTGTGGTGGAACACAATTTACCAAGCCAAGTGGATGTAAGGTCTGCTCTAGGGCAAGACTTCAGCTTTCATATAAAATACAGAGAATTCACAGCAGAAATGCTGCAAGAATTAATTTCACACTCGCTGTTCTGCCGTCAATATATTAAATACGACTGCAACATGGCCCCTCTGGAACTACACAGTGCTACATGGTTTATATCATCCTCGAATGATACCGTCGATTACATTGGAAACGTTAAAAAGGGTTACTGTCCTTGTGGGGTTAACGCAACTTGTGTTAATCCAACAAAATCTTGCAATTGTGACGCAAACGAAAACAAATGGCACTCTGATGAAGGAACACTCGTTGATCCCAAAAGCTTAGGCATAACGGAGATGTTCTTTCTCCAACAAAAGGATTTAACCGAAGAAGCGCAAGGCAGGATTACGCTAGGTCCCTTAGAATGTGTTGAAACGAACACCCAGCGCTACGTTGTGACGTTCACAACATCGCAATCCTATATAGAGGTGCCCGGATGGCGAAAGGGGGATATCGCTTTTAGTTTTAGGACGACGGGTACAAGTGCGATTCTGTTATTCCAGCCGCCTATAAGACCGAATTATCCATCGTTCATGGTCGCTTTAACAAGTGAACACGAATTAACTTTCAACTTCACCCTCAACACGGGTACCACGCGGAAGTTGGTCATCAACTCAAAGAGAAAACTAAATGGAGGGGAATGGCATAAAATCTGGATCGACTACAACTTCTACCACGTGAGGTTCATGCTCAACACTGAGTACCAGATGCTTAATCTTTTATTGGAGGAGGAGTTCGGACCTTTTGAGGGTTCTATGTTCATTGGAGGGGCGACTGCAGAACATTTAAAGAAATCAGCTGTCAACCAAGGTCTCATCGGATGCTTTCGAGGCTTGGTTGTGAATGGTGAAATACTTGACATATACAGTTATATGTCTGTTCATTTATCTGAAATCATCAAAGACTGCAAGCCATCCTGCGTCCCTAATCCCTGCCAGAACAGAGCCACTTGTAAAGAACTCTGGTCCACATACGAGTGTATCTGCAAGAACCCGTGGGCGCACTTGGGTGAACATTGTGAAGAAAATATCAATGAAAAAGCATTGACTTTCCAAACTAAGGAGTCTTATTTGAAAAAAAACTACCTGGTCGATAACACGACTGACGCAGAAAAAGCAAGATTAAAAAAGATGATGATAGAAAACGTCCTAATGAATCTGAGAACTTACGACGACAATGCACTAGTACTGTACGCTAATGACAATCTCAATAATTTCATACATCTCTTCATACACAATGGAACGGAAATTATATATCTGTTTAATAACGAAGATGAAATCGTTAAAATGAATGTTACTTACGAGAAAATTAACAAAGGGGAAAGTGTTCAGATTGCAATCATAAGGACGGAGAACTCGACCACTTTGCATGTTAACGATAAGAATACAACTATAAATAAAGTTGCTAAACTTCTGTCTAATTACACGAACAAGCCGTGGAAGAATCCGGAGTTGGAGGTAATCCGACCTCAACGGCCTCCAGCGCCACCCACAGACTACTTCCAAATGAACCTGGGTGGCTATGACCAATACTCGCTTCATCTAGCATCGCAAGCAGAAAACTTCCCACAAGGAGGGTACGTTGGCTGCGTAAGAGGATTTAAAATCGCCGACCACGTAGTAGATCTGTCTAAAAAGGCACAGCAAAATATTGATCAAGATTTAACAGGTGTACTACCAGAATGTAATATGAAATGTGACTCCGAGCCATGTAAAAATGGCGGTATTTGTACCGAAGACTTCACAAACCAAGAGAGCAGCTGTGATTGTGAATTAACAAGTTATTTTGGAGAATACTGTATGGAAGAGAAAGGAGCAGATTTTAATGGCGAGAGCATTTTACAAAGGAAATTTGTTAAAATAAAGTTGGCATTCTCCAGCAACGACCTTCGCCAAAAGAACACAGTTTTATTGCTTGTGCAAACAGAAAACAAACGCAGCTATTATCTTCTGGTAGCAATAACACAAGACGGTTACTTAAAATTCGAAGAAGATCGCGAAGATTCTGCGTATGGAGTAGAATTTAAGAACAGAAACTTTTTAAACGGCGCCCGGCATACAGTATATTATACAAGGTCAGATGACGAAGCGAAACTCTTAATAGACAGAATAGAAGTGCCATTAGAGAAGTTACCTCCACAAGATCTGTGGAAGGTGTTTGACGTTGGATCTAACGAAGTACAAATAGGAGGACTCAATACTACCGATCCACGGCTTAAAATATACAAGGGTTACAATGGATGCCTCTCTAATATTTTCGTGGAAATAAACGAGCACGTTATGAAACCTCTAGAGGAGTATATGCTTTTCACGCGTTCTGACTCAGAAAAGGTAAACGCAGTCAACGCTCAGGGTGTGAGGAGCGCGCAGTGTTCCGCGGACTTTGATGAAGCGTGGCCTGAGCACGATCAGCTTGGCGCTACACATAACGGCAGCTTCCTTATCAGTGTAGATAAGACTTGGGTAGAGGATCCACCATCCCGCCTGCCCTACGATTCTCTGCACCAGCAACCAGACACTGAGGAAGAGAATACAGACAAATTCTTTATAGCACTCATAGTAATATTCTTATTGGGGCTCTGTTACACAGCGTCGCACCTAAAAGAAATAGAAAATGGCGACAAAAAGGCAAATGGAGTCGTGATAGACTTAGTTCCTACAATAATCGTGGAAGTGAATGAAGAAAAACCTCCGAGCAGGAGAGGTTCACTTCGTTTTCGAGATATGGTAGATAAAGATATAGCTTGGCAACCTCTTGAAGAAAAGGATGAAATTTTAGAAAACGAAGAAGAAGAAGAAGAAGACGAATCAGAAAAGCAGGAACAAAATACTTCAGAAGAAAGCGAAGAAAATAATACAGATAACGAAGATGATATCTCGGATCATTTTGAAAATGAATCAATTGACGCTGTCAACGTTGTAAGGAAATTGTCAACGCTGTCGAATAAAATAAGCGAAGAAAATTCTATAGAGTTAACTTCGAGTGCATAA

Protein sequence:

>DPOGS207309-PA
MGLRVRRGLYVTIILISYGIADVDLSLPVDLAVEEKAPQQTTLPATSTSPLPTTINVSTSTYATIIPPIPPSDRDRFLTFAESGHHQTFMFAKDNTYIQLDGDIIQRFQLRLCREISFKFRTRLPHGLLVYHNVKNPVFKMQPYALYVIVEKGELKVVHVFGKHLTSVTVGRALNRDQWHSVVVTIDVHGARLIAKVDNLKEEVYLKGLSFDTNYGITDNLTSVILIGGLSSEEKLHGVKYIIESFVGCISDMVLSSGKAASDLLPIVPLIATKHENVKEGCINKCKTMENLCFEGSRCINEYNGYRCDCFGTLYEEQLCDVYTATILTLRGSSYVSYRVYDWKDRVHSTNTRVSLHFKTRFDDSALFYASGQIDDKHHYIALSIHQEKVGIQIDLGDGPVEDYLGVRVNNNMWHNITVILQEKTVHVYLDNISAIYEVPGDARFVCIDPEIYICGGPDLHKMKGLKSFNNFAGNLKYVYYNDVSILYELKQNNPKVHYIGVLDPEFEDIDIELIPITYPFATSHIWWPLNQSNSINLVFDFKTSKNMAVLAYSQITSGQGYFEVRMVKEEIRFELVPDVGKNVTVLKSVKFNVSNDWHNVELDYRKGRIKLTVDYHNKHAQMFGLDFQLQDKIVIGSGLKSANLGLIGCMRNIKINGLQIEPRYVINTERVVGEVAIDDCRYVDPCTRPNTCEHDGICSIREDRVICNCDNTGYIGENCHFATFRKTCEELALLGYTRNDVYLIDIDGNGKFPPAHVKCEFQIEADSSTTVVEHNLPSQVDVRSALGQDFSFHIKYREFTAEMLQELISHSLFCRQYIKYDCNMAPLELHSATWFISSSNDTVDYIGNVKKGYCPCGVNATCVNPTKSCNCDANENKWHSDEGTLVDPKSLGITEMFFLQQKDLTEEAQGRITLGPLECVETNTQRYVVTFTTSQSYIEVPGWRKGDIAFSFRTTGTSAILLFQPPIRPNYPSFMVALTSEHELTFNFTLNTGTTRKLVINSKRKLNGGEWHKIWIDYNFYHVRFMLNTEYQMLNLLLEEEFGPFEGSMFIGGATAEHLKKSAVNQGLIGCFRGLVVNGEILDIYSYMSVHLSEIIKDCKPSCVPNPCQNRATCKELWSTYECICKNPWAHLGEHCEENINEKALTFQTKESYLKKNYLVDNTTDAEKARLKKMMIENVLMNLRTYDDNALVLYANDNLNNFIHLFIHNGTEIIYLFNNEDEIVKMNVTYEKINKGESVQIAIIRTENSTTLHVNDKNTTINKVAKLLSNYTNKPWKNPELEVIRPQRPPAPPTDYFQMNLGGYDQYSLHLASQAENFPQGGYVGCVRGFKIADHVVDLSKKAQQNIDQDLTGVLPECNMKCDSEPCKNGGICTEDFTNQESSCDCELTSYFGEYCMEEKGADFNGESILQRKFVKIKLAFSSNDLRQKNTVLLLVQTENKRSYYLLVAITQDGYLKFEEDREDSAYGVEFKNRNFLNGARHTVYYTRSDDEAKLLIDRIEVPLEKLPPQDLWKVFDVGSNEVQIGGLNTTDPRLKIYKGYNGCLSNIFVEINEHVMKPLEEYMLFTRSDSEKVNAVNAQGVRSAQCSADFDEAWPEHDQLGATHNGSFLISVDKTWVEDPPSRLPYDSLHQQPDTEEENTDKFFIALIVIFLLGLCYTASHLKEIENGDKKANGVVIDLVPTIIVEVNEEKPPSRRGSLRFRDMVDKDIAWQPLEEKDEILENEEEEEEDESEKQEQNTSEESEENNTDNEDDISDHFENESIDAVNVVRKLSTLSNKISEENSIELTSSA-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: