MonarchBase - Protein-coding gene

DPOGS203200
Transcript	DPOGS203200-TA	3822 bp
Protein	DPOGS203200-PA	1273 aa
Genomic position	DPSCF300035 + 527511-531332
RNAseq coverage	67x (Rank: top 67%)

Annotation
*Heliconius*	HMEL011010	81.47%
*Bombyx*	BGIBMGA011085-TA	81.31%
*Drosophila*	Tollo-PA	55.26%
EBI UniRef50	UniRef50_E0VDA3	65.53%	Toll, putative n=3 Tax=Neoptera RepID=E0VDA3_PEDHC
NCBI RefSeq	XP_002424097.1	65.53%	toll, putative [Pediculus humanus corporis]
NCBI nr blastp	gi\|242006518	65.53%	toll, putative [Pediculus humanus corporis]
NCBI nr blastx	gi\|189234217	65.25%	PREDICTED: similar to vasorin [Tribolium castaneum]

Group
Gene Ontology	GO:0031224	2.2e-35	intrinsic to membrane
	GO:0007165	2.2e-35	signal transduction
	GO:0004888	2.2e-35	transmembrane receptor activity
	GO:0045087	2.2e-35	innate immune response
KEGG pathway	oaa:100082591	2e-42
	K06839 (SLIT2)	maps->	Axon guidance
InterPro domain	[1066-1207] IPR000157	2.2e-35	Toll-Interleukin receptor
Orthology group	MCL10048		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS203200-TA
ATGTGTCCGATGTGGATTACAAGCGCTATATTAGCGCTTAGCGCTGTTTTACCGGTATGGAGTGCTTCCCTGTCAGCAACCACAGGAACTCGATACCAAGCTCCAGACGAATGTCGATGGACAACTGACGAGGAAGACGCTGGAGTTGCGTTACAGTGTAGACTAAGAACTATAAATAGTGAATTAGAAAATACTAACTTTAGTGCTATTCAACCACATCTAACTGTTCGTTTACGACTGGAGTGTAGTGATGCGCTCTTTTTCCAAAGCTCCCTCGCACCGGCTAGTTTTCGTCAGTTAGTGGAATTGAGAGAACTTACGATTGAATATTGTAAAATAGGCAATCTATCTGATGGCGCCTTCACTGGCCTTCGTGAATTAAGAAATTTGACTATAAGAACACATAATACAGACTGGTCTTCAATGTCGCTAGAAATAACGCCAACAGCTTTTTCCAGAGATGTCCAAAATTTGGAGCGCCTTGATTTAAGCGAAAATAATATGTTGTCATTTCCTGAGGGATCTCTATGTTCTTTAAGAAATCTCGAATATTTAAATATGACTGGTAATAGAATGAGAGATGTCAGCCATTTTCAATTTTCAACTGCACATCGTCATCCGAATGAAAAATGTGGGGAAAATATTTTAGTGTTAGATTTATCTAAAAATGTAATTGATACATTACCACCAGGACTTCTTTCGGGATTAAGACGACTACAAAAATTCTATCTTCAAGGAAATGGGCTTAACTCTGTAGCAGACAGAGCTTTGGAAGGGTTAATATCATTGACAAAAATAAGATTTTCGGATAACCAACTTACTAGCTTACCTCCGGAGCTATTTAGCGATACTAAGGAATTAAAAGAAATTTATCTCAACAATAACACAATTACAGTACTTGCTCCAGGATTATTTAGTGATCTTTTACAACTTTTAATCTTAGATCTGTCCTATAACGAATTGACATCTGATTGGATAAATACTTCTACATTTTCGGGTCTGAAACGACTTGTTTATTTGGATATATCACATAACAGAGTGTCAAAAATGGAAATAGCATTGTTTAGAGATCTGCATAACCTTCAAATTCTAAAATTGCAAGATAATTTTATTGAACACATACCTGAAAACGTGTTTATTTCCCTACAGAATCTACATACTTTGATATTATCCAATAACAGGCTGACGAATATTGAAAGCTATGCTTTTATCGGTTTACCTGTTTTATCTGTATTGTCAATTGACAGTAATCGCATTTCAAAGATACATCCACATGCTCTACGTAATTGTACCTCCTTACAAGATTTACATATAAATGTTAATAGACTGGATGAAGTTCCTATAGCATTAAAAGAAATACCTCAATTGAAAACTTTAGATTTAGGAGAGAATTTAATCGTCAGTATAGAAAATGCATCTTTTATGACAATGCAACAAATGTACGGCTTAAGATTAACTGAAAACAACATCGGCAACATAAGCAAGGGTGTTTTTGACAAAATGACTTCACTTAAAATTTTAAACCTTTCTAGAAATAAAATTCATAAGATTGAATCAGGAGCTTTTGACAATAATATAAATTTACAGGCTATAAGATTAGATGGGAACTACTTGACCGATATAGGCGGTCTTTTTGCTAAATTACCCAATCTCGTATGGCTGAACATTTCCGATAATCGTCTTGAATGGTTTGACTATGCTATGATTCCAACAGGATTACAGTGGCTGGACATTCATGCCAACCGAATTGCTGAACTTGGAAATTACTTTGAAATTGAATCTCAACTTTCTCTTAGCACGTTTGATGCCAGTTCTAACAGACTTGCAGAAATAACAGGAAGTGCGATACCTAATTCAGTAGAAATGTTGTACTTGAACGATAATTTAATTTCAAAAGTACAGTCTTATACATTTTTCAAGAAGCCTAATCTGACAAGAGTAGATTTATATGGAAATAAAATAACAAGTTTAGACCCTAACTCTCTCAGAATATCAGCTGTGCCACAAGATAAGACTGTACCCGAGTTTTTCATTGGCGGGAACCCATTAGAATGTGATTGTACAATGGAATGGTTACAAAAAATTAATACTGGAAACAGAGCAAGGACACAGCCTAAGTTAATGGACTTGGATAGCATATATTGCAAATTACTTTATAATCGTGGAAACTCATATGTGCCTTTAGTTGAAGCAGCATCACACCAATTTCTTTGTAAATATGACTTTCATTGCTTCGCACTATGCCATTGTTGTGATTTTGATGCGTGTGATTGTGAAATGACTTGCCCAAATAACTGCACTTGTTACCATGATCAGTCATGGTCCGCTAATGTTGTAGAATGTTCTAACTCGGGATACGTTAACTCACTGCCAGAAAGAATACCCATGGAAGCCACTCAGTTATACCTTGACGGTAATGATATTAAGATGCTACCAAGCCATGCATTTATTGGTAGAAAACGCCTTAAAGTATTATATTTGAATTCATCACACATTGAAACTATTCACAATAGAACGTTCAATGGATTAAAAGAACTGGAAGTTTTACATCTTGACTTCAACTTATTAACAATAGTTGAAGGACAAGAATTTGATGGATTGGATAATTTAAAAGAACTTTATCTTAATAATAATAAAATAAAAACAATCGGTAAAGACATGTTTAATCACATGGCAAAATTAAAAATATTATACCTTTCACACAACAGGCTGGTATCACTAACTGTCTGGCAAATAAATTCCGCTATAACCTCTATTACGCTTTCGTTTAACCCTTGGTCGTGCGATTGCGAATACACAGAAATCTTCCGTGAATGGACAAAACGAGTATCTTCAAGTATTATGGATCTATCGAACATTAGGTGCATTTATACGAAAACGAACAGTACAGATATCGCAGTACATAACGAAAGCGTATATGATGATCCAAACTCAGGATTTAAAATAATAGAAGAAAATGGTACTATATGTACCGGATTACCAAGTATTGATAATAGTATCAACGGCAACTTAACAGCAACCAAAACAATTATAACCAATGAAGATGTTCCTGATTACATTCCATTTCTTCTGGCGACTGCAGGGGCATCTCTATTTCTCATTATAACCGTTATCGTTATTTTTAAATACAGGCAAGAATTGCGAGTATGGGTTCATTCGAAATTTGGTGTAAGATTATTTTATACCAACGTGGACCGTGAAGAAAACCTATTTGATGCATTCGTAAGCTATAGTTCCAAAGATGAAGCATGGGTGACTGATAAACTTGCCCTGGTATTAGAGACAGGCAATCCTCAATACAAATTATATCTGCATTATCGTGATTTACCAGGAGGCGGTTACATAACACCACAAAGTATTACGCAAGCGGTGGAGTCCTCACGTCGTACTATTATGGTGCTCAGTGAAAATTTTATGAATTCGGAATGGAACCATGTCGAATTTAAATCAGCATATCTTCAACTTTTAAGAGACCGCCGGAAAAGACTTATCGTGATCCGAAAGGATAATATCCCGTTAAAGCAACTAGATACTGAAATCAGATTATATCTCAAAACTAATACTTATTTAAATTGGGGTGAAAATTTGTTCTGGGAAAAACTAAAATTTGCTTTGCCAGATGTTTCTGATAAACAAAGGTGCCGAAGTATGCCGAGTCCGGGCCCAGGTGCCGTACCGGTGCATAGACCTCATTTACCAAGAAACCATCTAGGGGCATTGCCTCCGCCACCTCATGTTCCCCATCAAATGTTACCCCCTCATCCGTCACACACACAATTTCCACCAAGAGCGTCTCCGCGGAATCTTTCTGCCCATGTGTAG

Protein sequence:

>DPOGS203200-PA
MCPMWITSAILALSAVLPVWSASLSATTGTRYQAPDECRWTTDEEDAGVALQCRLRTINSELENTNFSAIQPHLTVRLRLECSDALFFQSSLAPASFRQLVELRELTIEYCKIGNLSDGAFTGLRELRNLTIRTHNTDWSSMSLEITPTAFSRDVQNLERLDLSENNMLSFPEGSLCSLRNLEYLNMTGNRMRDVSHFQFSTAHRHPNEKCGENILVLDLSKNVIDTLPPGLLSGLRRLQKFYLQGNGLNSVADRALEGLISLTKIRFSDNQLTSLPPELFSDTKELKEIYLNNNTITVLAPGLFSDLLQLLILDLSYNELTSDWINTSTFSGLKRLVYLDISHNRVSKMEIALFRDLHNLQILKLQDNFIEHIPENVFISLQNLHTLILSNNRLTNIESYAFIGLPVLSVLSIDSNRISKIHPHALRNCTSLQDLHINVNRLDEVPIALKEIPQLKTLDLGENLIVSIENASFMTMQQMYGLRLTENNIGNISKGVFDKMTSLKILNLSRNKIHKIESGAFDNNINLQAIRLDGNYLTDIGGLFAKLPNLVWLNISDNRLEWFDYAMIPTGLQWLDIHANRIAELGNYFEIESQLSLSTFDASSNRLAEITGSAIPNSVEMLYLNDNLISKVQSYTFFKKPNLTRVDLYGNKITSLDPNSLRISAVPQDKTVPEFFIGGNPLECDCTMEWLQKINTGNRARTQPKLMDLDSIYCKLLYNRGNSYVPLVEAASHQFLCKYDFHCFALCHCCDFDACDCEMTCPNNCTCYHDQSWSANVVECSNSGYVNSLPERIPMEATQLYLDGNDIKMLPSHAFIGRKRLKVLYLNSSHIETIHNRTFNGLKELEVLHLDFNLLTIVEGQEFDGLDNLKELYLNNNKIKTIGKDMFNHMAKLKILYLSHNRLVSLTVWQINSAITSITLSFNPWSCDCEYTEIFREWTKRVSSSIMDLSNIRCIYTKTNSTDIAVHNESVYDDPNSGFKIIEENGTICTGLPSIDNSINGNLTATKTIITNEDVPDYIPFLLATAGASLFLIITVIVIFKYRQELRVWVHSKFGVRLFYTNVDREENLFDAFVSYSSKDEAWVTDKLALVLETGNPQYKLYLHYRDLPGGGYITPQSITQAVESSRRTIMVLSENFMNSEWNHVEFKSAYLQLLRDRRKRLIVIRKDNIPLKQLDTEIRLYLKTNTYLNWGENLFWEKLKFALPDVSDKQRCRSMPSPGPGAVPVHRPHLPRNHLGALPPPPHVPHQMLPPHPSHTQFPPRASPRNLSAHV-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: