MonarchBase - Protein-coding gene

DPOGS207947
Transcript	DPOGS207947-TA	5583 bp
Protein	DPOGS207947-PA	1860 aa
Genomic position	DPSCF300090 - 169232-188223
RNAseq coverage	110x (Rank: top 59%)

Annotation
*Heliconius*	HMEL014211	2e-167	62.57%
*Bombyx*	BGIBMGA000387-TA	0.0	38.33%
*Drosophila*			%
EBI UniRef50	UniRef50_Q16U55	3e-41	23.35%	Putative uncharacterized protein n=1 Tax=Aedes aegypti RepID=Q16U55_AEDAE
NCBI RefSeq	XP_001660565.1	6e-42	23.35%	hypothetical protein AaeL_AAEL010014 [Aedes aegypti]
NCBI nr blastp	gi\|157124873	1e-40	23.35%	hypothetical protein AaeL_AAEL010014 [Aedes aegypti]
NCBI nr blastx	gi\|157124873	4e-58	23.17%	hypothetical protein AaeL_AAEL010014 [Aedes aegypti]

Group
Gene Ontology	GO:0016020	1.4e-12	membrane
	GO:0005509	1.4e-12	calcium ion binding
	GO:0007156	3.5e-07	homophilic cell adhesion
KEGG pathway
InterPro domain	[1455-1580] IPR015919	1.4e-12	Cadherin-like
	[1458-1568] IPR002126	3.5e-07	Cadherin
Orthology group	MCL30147		Lepidoptera specific

Nucleotide sequence:

>DPOGS207947-TA
ATGTGGAAACAAGCTTATACAGTTGTAGTGATACTTGTAGCATCTGGATTTTTTCACTACAGTCATGCTTGCACAGTAGAAGACGTAGACCAGAGCGTTCCTGTTACAAGAGAAATAAAAGACACATTTAGAGGCATCTTTTTTTCAAGTAATACTCAAAATATTCAAGAACCCGTTTCTTTAATACAAAACGAAGGTCTAAAGGAAGGACCGTATCTTGATATTTTCCTAAATAACTCACTACTTACCATCGGTACCAACGACAACTTTGCCAATTATGAAGAAGTTGAAACCGAAACGACTATGAGATACACAGTAAATTTAGGATGTACAAGTGGTTCGCGACTGAGTTTTGTTTTGATTATAAACATAAGAGACACAAACAACAATAACCCTATATTTCTGCAACCGGAATACGAGTTTAACATCGTCCTACCAGTTCCGCCTGGATTCATGGTCACCAATTGTGAAAATGACATTGTTGTCAGAGATATAGATCTCACCACTCGAAGGATTGATTATAAACTGAATGGAAGCGATCTGTTTGAAATATCGTACGACCCATCTTCTAAAGTTCCAAAAGAATTTAAATCGATACTCAGAACGACTACTTTGATAAGATATATACCCGAGCAAATAACACTGACGTTGACTGCCACGGATGTCGACGAAACTAGCGATCCGGCAAGATCAAACACTACGACGGTTATCATCAAAGCAGACAATCAATTTCAATTTCCTGATGAGCCAATATTTTCACAACCTTTTTATTTGGCATCATATGAAAGGGAAAGCGATTTTGTATTACAAGATACCATTTATTTGGAACAGGGATATGACGATCAAGTAAAATTCAGTTTTGAAAGCGATTATTCTGAATACTTTAATATGGTCGTAGACGGTAACAAAGTTCAGTTTAATATGAATAAATCGATACCAGTCCAATTGTATGAAAAAAAACAGATATATTTAGTTGTAAAAGCAGAAAGAGAGTATACTAGTGGTGCCACTGCTGCGGTTATTTTGAAATTACCAATAGATACTAAGTTAGAATTTGAGAGAGCTATTTACAAAGGAAAAATAACTGATAACGTTTTAAATCTAACAGATTTAATATTAAAACAAGGCTATGAACATTCCAATATAACAGTAGAAATAAGCAGTGAATACTCTTTCAAAGCGACTGTTCTATCAAATATCATAAAATTATCAATGGATCCTTTGACGGAGGATGTTATTAGAAATAATAATTTTATTGGTTTGGAAGTACTAGCCTCAAATAACCGAACTACGGCAATAACTGCTGTAGTATTAGAAATCATCAAAGAAGATACCATAACTCCAGTATTTGAAAAATATATATATAATGAATACATCACATTCTTCGAAATATCGCAGGATGGAGCAAGAATAAGACTTAAACCTTTGGCTACACCTGAAGAATTGCTGAAAACAAATATCATTTTAAGCATACTTGCTGATAAACCAAGAACAGTCGGAGCACATGCTACAATCAATATAGCGGTGCCATCAGCTAGATCTTTGGTTTTTGATAAGGATTTGTATATTGGAACAATAGAAAAGAATAATTTAACACTCAACAACATTGTTCTAACCGAAGGATATGCCTCAGACATTAATTTCACCTTAACTGGCGATCTTTCAAATCACTTTTCCGTAAGCAACAATCAAAACATCCTAACTGTCTCCGTAACAACGGAATTGCCGGAGACAGTTGTATTGGAGAACGACTTTATTGTATTGACTCTCGTTGCATTTGGAATGAAAGCTATTACAACTTCAACAAATATCGTCATTCGAATAATAAAAGAGGACTATCTAACTCCCATTTTTAACGAGCGGATCTATTCTGTAAAGTACGAGAATGATCAACTAAATGCCGTCAATATGACATTGATCCAAGGTTTTGACGAAACTGTCACATTTGAATTGATTGGCGTCCACAGAGAATTCTTTAGTTTAGAAACTAGTCTCAACACAATAAAACTAGTTGTGAACTCCACTATACCAGAAGATATTATATTTAATGAAAAGGTTATCATATTAAATGTTGTGGCTCGAAAGCCCCTAACAGTTGGAGCAAATGCAGCAGTGTATATTACATTTCCACCAGAGATGACAGAGCTAGGCGTATTGAATTTCACCCAAAATGCCTATAGTGGTTCTTTAAAAGAGGGTGTCCTTATAGTAGAAGATATAATACTTGAATATGGTTACACGCCACAAACTACATTTATTCTAAGCGGAGACTATTCAGATAAATTTTCCTTAAATTATTCAAGCAATGTTATCACAGTGATACTAAAAAGTAATGTATCGTTGGAGGAAATCGAAAGACAGAATTTTATTACTTTAGAAGTTAAAGCAACAAGAAGAAGGACTATTCCAGCAACAACTGTAGTAGTGGTGTATATCAATAGAACTAGCATAGTTAGTCCCATATTTGAACAAGCATTTTATAACGGCAGTTACACTAACGATGGTGGATTAGTATTTGAGCAAGTAATATCATTACAGGAAGGTTTTGATAGTACTGTAGAATTTAGTTTAGAAAAAGAATATTCACAGTGGTTTGTGTTGGAACAAAATGGCAATTCTGTAATATTAAAATTAAATACTTCAAATCCTATACCAGAGGCCATCACAGAAAAAAACAAGCAATTTTTAATCACAATTTTTGCCAGGAAACCAGAAACGGTTGATGGAAGAGCAGTCATATATATAGATCTACCGAAAGAAAATAGCAATGTCAGAATTCTTCAATTTGAACATGTCAGCTATTTGGGAAGTATAGAAAGCGGAGTAATACAACTAGAAGAGATTCGTCTCAGGACCGAAATTACGTCAGCGATGGATTTCAATATAACCGGAGAATACGCATCGTATTTTACGATCTCTAAACAGACTGAATCTATACAGATTGACATCATGGACGCGCCGCCAGAAGTATTTGAAAACAATGACTTTTTAGTTCTCAATATAAATGTGTTTGAAGTCGGATCTGTAAGTGGACATACCACTGCCGTATTGAATATAATAAAAGATAGACAGTATAAAAATATTACCCCCGTATTTAGCGAAGCCTATTACACTGGACAGTATTCTAAAGATACTGGCCTTTTATTCTCATCTATAATAACCCTCATCCAAGGTTATGATGAAACTGTGACATTTTTACTTGACAGCGAAGACTCGAAAGGTTTTGAATTAGTAGAGACAGACGTAAATAATTTTACACTGACATTCAATGGAAGTTCAAGTGAAGGACATAAGAAGAATTACTTATTGTTCCCCGTTATAGCACTTAAACCAAACTCCAGACAAGGAAGCGCTGCAATATTTATTTCTATGACAGGATCTCCGGAGACGAATGTATTCTTTGATAAAATTCTTTACAATGGGAAACTAGAGGATGACATTCTCTCACACGATACCATAACATTGACAGGTTTTAATGGAACAAATATTTTAATAACGGGTGAAAACTCGAGACTTTTTGAAGCGGAATTCATTAACGGCTTTGTAAAAGTCACAACAACGTCTTCTTCAGAATTTCCGAGAGAGCTTACCCACATAGCACTTGAATTACAAGCAGGGAGTGCAAAGTCAGTACTTTTAATAGATGTCAGTTTTTCAGATAATCCGGATCTGCCAAAGATATCATTTAAATCAGAATCTTACTTCTTTTGGGCCGATGTCAAACAGACGGGAGAAATTGGAAAAGTTGAAGCAACGGTTGATAATGATGAAGCTGTCACGTACTCCCTGCGTGTCACTAATGATCACATAGCATCTCGGCTTAACATAGATGAAAGTAATGGAGTATTACAGTTAACAAACGTCGCCGAGAAGGGAATATATAATTTCAATGTTAAAGCGACTTCAGTTCAAAGCAAAGTTGAAGCTACGGCATCAGTGCTATTGCGTGTTGACGCTCTGCCGGATTGCGGCGGCGAGGTTGGCTTATCACCTTTGATAGTTATTGAAAGAGTTGAAGAAGAAGCTCATTATAATTTGGTTGTCTTAAATGAGACTGAACATGAAGGTTGCAAGTATACATTAACAAACGTCTTCCCCGAAGATCAATCCTGGCTATACGTCGAAAATAACGGATTGCATACAAAGCCTATTGACCGAGAGGACAAATCAATTGCTTTCATGACTCTGTCTCAGATTCAAGTGGAATTAACACTTAAGTGCGACAGTGATGGAGTACCGGCCTTCGCTAAGCGTTCATTAGACGCAGACGATAGCTCGTACCTCTATTCTTACGACTACGGTCCTAATAAATGGGTCCTGACTGACACCATTTTATATAATGCCAGACGAAGCTTCGTGAACCTTATCGTCAAAGATATTAATGATAATTCACCAAAATTCAACGGAAAGGAAAATGATACAATTTACGTCGGATATCCGATGTCCGAAATAGAGGGGCTCGTTCTTCCACGTGCTCTTGCTGAATTGAAGGCGACAGATGAGGATATAGGAGAAAATGCAGCTATAATGTATTGGAGCAGGGAAGACAATCTGGCCGTTTCACCAAATACCGGTTTAGTTCACGTTCGCAATAACGCAAAATTGGAAAACAATTCCCGTTTAACAGTATATGCTATCGACCAAAACGGACAAGGGAACAACGGCTCTATAGTTATTGTGGTTAAATTATTAAATAAAAACCAAATTGCCGTCCTGACTATAAGAAACGCATTCTTGGAGGATGAATCTAACGTTTTAAATGACTTGAGTAATTCGGTGGGATACGACATTAAGGTTTTAAGGTCTATTGTGATTTCTGATAGCTATGAAGAATCCAATAGAACGAAACGAGACATAAATAGCAATAGTGGATCGTCTCTGCAACTATATGTTTATGGTTTAAAGGAAAGTGAACCAGTCGACATCAATCAATTGACCGGTGATATTAACAATAATAACGTAGCTACAATCACCATAGCCAGGATTCTATCTTTAGAAGATCATCTTGACAGTCTAGCGATATGTCCCGGACTGGAACGTGATATAGGCCTCCTAGCTACGACCATCGCATTATCTATCCTGATATTAATTTTAATTATTGCGATATCTGTCTTGTTCTTCCTTAAATGGAGAATAACAAGAAACTACGAGAGATTCAGTGATAGCAACAGTACTACTTCCCAGCTAGCATCACCCAAGCTTCCTGTTATTGAAGTTCCTCAGAAAACACGTCTCAATATGGAGGAAATAAAAAGGAGTGAGAAGAGACTACAAGAAATGTTAGAAGAACCGGTCGAAAGTCAACTCGATTCCGAAACAGACGATATTAAAGATGTAAATGAGACTCTTGATGAGGCCATTGTTAACATATCAAGTGATGTTCAATTACCTATTATAATACAATCAATAGATAAGCTGAAAGATGGTAATGACGAGTCTGATGATAATGACGAATATGGTGAAATGAAACAACCGCGGAAATCTGTTGTGACGTTCAATGAAAACGTTGAGAAAATCATTCATATAGAAGACGTTAATGAAGATGAAAGCTCAGAGCAGAGTTTTGAAGTTTATAAATTTTAA

Protein sequence:

>DPOGS207947-PA
MWKQAYTVVVILVASGFFHYSHACTVEDVDQSVPVTREIKDTFRGIFFSSNTQNIQEPVSLIQNEGLKEGPYLDIFLNNSLLTIGTNDNFANYEEVETETTMRYTVNLGCTSGSRLSFVLIINIRDTNNNNPIFLQPEYEFNIVLPVPPGFMVTNCENDIVVRDIDLTTRRIDYKLNGSDLFEISYDPSSKVPKEFKSILRTTTLIRYIPEQITLTLTATDVDETSDPARSNTTTVIIKADNQFQFPDEPIFSQPFYLASYERESDFVLQDTIYLEQGYDDQVKFSFESDYSEYFNMVVDGNKVQFNMNKSIPVQLYEKKQIYLVVKAEREYTSGATAAVILKLPIDTKLEFERAIYKGKITDNVLNLTDLILKQGYEHSNITVEISSEYSFKATVLSNIIKLSMDPLTEDVIRNNNFIGLEVLASNNRTTAITAVVLEIIKEDTITPVFEKYIYNEYITFFEISQDGARIRLKPLATPEELLKTNIILSILADKPRTVGAHATINIAVPSARSLVFDKDLYIGTIEKNNLTLNNIVLTEGYASDINFTLTGDLSNHFSVSNNQNILTVSVTTELPETVVLENDFIVLTLVAFGMKAITTSTNIVIRIIKEDYLTPIFNERIYSVKYENDQLNAVNMTLIQGFDETVTFELIGVHREFFSLETSLNTIKLVVNSTIPEDIIFNEKVIILNVVARKPLTVGANAAVYITFPPEMTELGVLNFTQNAYSGSLKEGVLIVEDIILEYGYTPQTTFILSGDYSDKFSLNYSSNVITVILKSNVSLEEIERQNFITLEVKATRRRTIPATTVVVVYINRTSIVSPIFEQAFYNGSYTNDGGLVFEQVISLQEGFDSTVEFSLEKEYSQWFVLEQNGNSVILKLNTSNPIPEAITEKNKQFLITIFARKPETVDGRAVIYIDLPKENSNVRILQFEHVSYLGSIESGVIQLEEIRLRTEITSAMDFNITGEYASYFTISKQTESIQIDIMDAPPEVFENNDFLVLNINVFEVGSVSGHTTAVLNIIKDRQYKNITPVFSEAYYTGQYSKDTGLLFSSIITLIQGYDETVTFLLDSEDSKGFELVETDVNNFTLTFNGSSSEGHKKNYLLFPVIALKPNSRQGSAAIFISMTGSPETNVFFDKILYNGKLEDDILSHDTITLTGFNGTNILITGENSRLFEAEFINGFVKVTTTSSSEFPRELTHIALELQAGSAKSVLLIDVSFSDNPDLPKISFKSESYFFWADVKQTGEIGKVEATVDNDEAVTYSLRVTNDHIASRLNIDESNGVLQLTNVAEKGIYNFNVKATSVQSKVEATASVLLRVDALPDCGGEVGLSPLIVIERVEEEAHYNLVVLNETEHEGCKYTLTNVFPEDQSWLYVENNGLHTKPIDREDKSIAFMTLSQIQVELTLKCDSDGVPAFAKRSLDADDSSYLYSYDYGPNKWVLTDTILYNARRSFVNLIVKDINDNSPKFNGKENDTIYVGYPMSEIEGLVLPRALAELKATDEDIGENAAIMYWSREDNLAVSPNTGLVHVRNNAKLENNSRLTVYAIDQNGQGNNGSIVIVVKLLNKNQIAVLTIRNAFLEDESNVLNDLSNSVGYDIKVLRSIVISDSYEESNRTKRDINSNSGSSLQLYVYGLKESEPVDINQLTGDINNNNVATITIARILSLEDHLDSLAICPGLERDIGLLATTIALSILILILIIAISVLFFLKWRITRNYERFSDSNSTTSQLASPKLPVIEVPQKTRLNMEEIKRSEKRLQEMLEEPVESQLDSETDDIKDVNETLDEAIVNISSDVQLPIIIQSIDKLKDGNDESDDNDEYGEMKQPRKSVVTFNENVEKIIHIEDVNEDESSEQSFEVYKF-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: