MonarchBase - Protein-coding gene

DPOGS210693
Transcript	DPOGS210693-TA	3177 bp
Protein	DPOGS210693-PA	1058 aa
Genomic position	DPSCF300013 - 613694-620874
RNAseq coverage	1299x (Rank: top 10%)

Annotation
*Heliconius*	HMEL020585	72.44%
*Bombyx*	BGIBMGA006308-TA	66.49%
*Drosophila*	chp-PA	39.70%
EBI UniRef50	UniRef50_E2A0X8	41.29%	Chaoptin n=8 Tax=Formicidae RepID=E2A0X8_CAMFO
NCBI RefSeq	NP_001107810.1	40.48%	cell surface protein chaoptin [Tribolium castaneum]
NCBI nr blastp	gi\|167234367	40.48%	chaoptin [Tribolium castaneum]
NCBI nr blastx	gi\|307188199	40.43%	Chaoptin [Camponotus floridanus]

Group
KEGG pathway	tgu:100227176	1e-26
	K04309 (LGR4, GPR48)	maps->	Neuroactive ligand-receptor interaction
Orthology group	MCL12740		Insect specific

Nucleotide sequence:

>DPOGS210693-TA
ATGATACTTGTTGCATACACTACCAAACAAAATATTAACAAAACCAAAACTTTGTATGTTAATCAAATCTTAGTATGTCATATCAATTTAAAAGAAGATGCGTTCCGAAATGCAAAGATTAAAACATTGTCTCTACGAGACTGCGGCGTCACGGACCTATCTCCAGCATCATTCGCCGGCCTTGAAAACACTCTTCAGTCCCTAGATTTATCAGAAAACAACCTAACAATGATATCCAAATTCATGTTAAACAAGTTAGACTCGTTGCGGTTCTTGAACCTAAGAGAAAATAAGGTGGACACGAATTTACTAGCAACGAATAATCCATCAGAGTACTCGACGCCATCGATAAATAACTTTCAGTATAAGTTGTTCTTCTTGGACATCAGTGGCTCATCGTCTCTTGAAATTAGCTTGCAAGATGTGAGAAGAATGCGTTCCCTCAGATATTTGTCTGTGAGTAAATTGATAAGACGCAGCATATCTGCAGAAGATTTCCTAGAATTCGGCGTGGAATTGGAGGATCTAAAAATAATCGGAAGCACTATCAATCGAATCGAAGCGAGCGCCTTTCAACATGTACGGACTATAAAGTCCTTAGATCTGTCTGAAAATAACATTGACTTTATAGACCCATTCGCGTTTGCGGAGTTACATAGCTTGACATCATTGAAATTAGCCAATGGATTAGCAGATTCCGTAAAAATATTGCCATTTGAACCTTTGAAAGCACTTATAGAATTGCAGGATTTGGACGTTAGTAATAACAAATTGAGGAACGTCCCAGACACATCTTTCCACTTCTTATATAAGTTAAAAACATTGAACCTTCAAGATAATCTCATTGATCACTTCTCTAAAGGAACATTACAGAGTGACATACATCGACAGCTAGAAAGCGTTTCTCTATCGCTAAACCAAATGCAACGAATTGATCAACATACATTTGTCAATTTACGAGAATTACAGGAAATTTTAATCGAAGATAATCTAATAGAAACAGTGCATAGACGTTCCTTCACAAGTTTAGATAACCTGAAGGTGATTCGATTAAGAGGAAATATTATTACTGAAATTAGTGAAGAGGCATTCCAAAATCTACCGGCCTTGAAAGAGTTAGATATATCATTTAATCAATTGGAGACGTTCAAGTTTTCGATATTTGATCAAGTTGGATCTGCGACGGCCTTGAAAGTAAACGTGTCATACAACAGAATAGTTTCATTGACTGATTCAAATGCTGTCAATTTCTTCTCTTCAAACTTTTATCCTCCACCTAAAGCGCAAAGATTAGTTTCTGAGGATCCCAGTCCTCTGCGTATAGAAAGAGGACTTGGCACGGTATCAGTGAATATAAGAGTTTTGGACTTCTCACACAATAACATTTCATACATCGCGCCATACTACTTCAGACACGCGGACCTGACGTTATCCGAGTTGCACCTCTCCCACAATATGATCCGTAATATAACACGAGAAGTGTTTGGGTCGATGCTAATGTTGCAATACTTGGATTTATCGCATAACCAAATATTCCACATGGAGTATGACTGTTTTAAGAAAGTTAAAAGATTGCAAATAATAGACTTGTCCCATAATCACCTGTTCGATACACCGGTGGAAGTGTTCCACGAGATGCAGGGACTTACTACAGTGGATCTTTCGGACAACAACATCAAAAACTTAGCAGATAATCTCATCATATCTCCAGCTTTAGAGAGGCTAGACCTATCTGACAATGATTTGTCACGAATACCAACGAATTGTTTATCTCCGGCTGCTGCTATTAATCTAGTAGAACTAGATTTGAGCGGGAACAACATACCCGCTGTAGCTATTGCTGACTTAGTCCAAAGATATAGGCACGACGACTGGCCCGAGGAACCGGACTACAGTGACGAATACATGTACCACACGGCTAGGCGCGACCACGCCAGAGTGTTCCATCAAAAAAAACAATACCCGCAGAACATATTGTTTAAGTCGCTTGCGTGGTTGGATTTGTCTGACAATCACTTGGTGAGAGTTGAAAGCGGTTCTTTTGCTGCTTTACCAAAACTCCGATGGTTGGATTTAAGTATGAATATGCCCTTTAACAACAATGACCGCGGAAGCAGTTTATTTAAAGGTTTAGAAAGAAGATTATCTCATTTGGGACTAAAGAATGTTAGTCTCACAAATATCCCATCAATGCCGTTGCCGAAGTTAAAAAGCCTAGACCTATCATACAACAACTTTCCCTCCATTCCGACCGACATGACGGCAAACTTGACTCGTCTCAGAGCTTTGGATTTGTCTTATAATGATTTGACTAATGTTCCCGTAGCGACTCACTCCCTCAGCGAACTTCGTTGGTTGTCTCTATCTGGGAATCCAATCACTGCCCTTATGAACACTAGCATGTACGGCGTGTCTCCGAGACTAGAATATTTAGACGTAACTCACCTAAAATTGAGTATACTAGAGGCCGGGGCGTTCAGCAAAATGTACGGATTACGCACTCTTAAAATATCTGTTAATGGAAATATAAGAGACTTCAATATTCCAAAGATATTGACACACAATGACGCATTGAAGAATTTGTATTTACATATAGACAATTCTCAAATCGATCTTGGCAAGGAGATGATTGGAGAACTTCCTCCCAAGCTAAATAACATTACTATTGTTGGTAAAGCTTTGAAATTTTTGTCACAGAATCTGCTAGGTGGTGTTACATCTGAAACTTTGACTCTGACCATTTATAATACCAGCCTTGAGGAAGTAGAAAGTGAAGTTTTTTGGAGACCAGGCCATGTAAAGAATCTAACCCTAGATTTGAGGCATAATAATATAGCTAGGGTTCCCAATCCAGCGAGACATGAATGGCCGGGAGTACCAAATTCTTTATTCCTTCACGACATATTTTTGTCTGGAAATCCTTTATACTGTGATTGTCGCATCGGTTGGGTTCAAGCGTGGGATCGCAAACGAAGACAATATTTGTGCGAGAGTCCCTCTAGTTGTGTTGCTGTACGAGACGATCTCAGATTTGCGAAATGTCCTTCCCATTATAACAGGACTTTCAGTGACGTCATCGCGAAAGATTTAGACTGCACTTGGAGTAAAGGATTCCTGAACTTACCAAACTTATACATAATTACGGCAATATCTATCATGACATGCCTCTACATTTGA

Protein sequence:

>DPOGS210693-PA
MILVAYTTKQNINKTKTLYVNQILVCHINLKEDAFRNAKIKTLSLRDCGVTDLSPASFAGLENTLQSLDLSENNLTMISKFMLNKLDSLRFLNLRENKVDTNLLATNNPSEYSTPSINNFQYKLFFLDISGSSSLEISLQDVRRMRSLRYLSVSKLIRRSISAEDFLEFGVELEDLKIIGSTINRIEASAFQHVRTIKSLDLSENNIDFIDPFAFAELHSLTSLKLANGLADSVKILPFEPLKALIELQDLDVSNNKLRNVPDTSFHFLYKLKTLNLQDNLIDHFSKGTLQSDIHRQLESVSLSLNQMQRIDQHTFVNLRELQEILIEDNLIETVHRRSFTSLDNLKVIRLRGNIITEISEEAFQNLPALKELDISFNQLETFKFSIFDQVGSATALKVNVSYNRIVSLTDSNAVNFFSSNFYPPPKAQRLVSEDPSPLRIERGLGTVSVNIRVLDFSHNNISYIAPYYFRHADLTLSELHLSHNMIRNITREVFGSMLMLQYLDLSHNQIFHMEYDCFKKVKRLQIIDLSHNHLFDTPVEVFHEMQGLTTVDLSDNNIKNLADNLIISPALERLDLSDNDLSRIPTNCLSPAAAINLVELDLSGNNIPAVAIADLVQRYRHDDWPEEPDYSDEYMYHTARRDHARVFHQKKQYPQNILFKSLAWLDLSDNHLVRVESGSFAALPKLRWLDLSMNMPFNNNDRGSSLFKGLERRLSHLGLKNVSLTNIPSMPLPKLKSLDLSYNNFPSIPTDMTANLTRLRALDLSYNDLTNVPVATHSLSELRWLSLSGNPITALMNTSMYGVSPRLEYLDVTHLKLSILEAGAFSKMYGLRTLKISVNGNIRDFNIPKILTHNDALKNLYLHIDNSQIDLGKEMIGELPPKLNNITIVGKALKFLSQNLLGGVTSETLTLTIYNTSLEEVESEVFWRPGHVKNLTLDLRHNNIARVPNPARHEWPGVPNSLFLHDIFLSGNPLYCDCRIGWVQAWDRKRRQYLCESPSSCVAVRDDLRFAKCPSHYNRTFSDVIAKDLDCTWSKGFLNLPNLYIITAISIMTCLYI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: