MonarchBase - Protein-coding gene

DPOGS203198
Transcript	DPOGS203198-TA	3231 bp
Protein	DPOGS203198-PA	1076 aa
Genomic position	DPSCF300035 + 322153-325563
RNAseq coverage	66x (Rank: top 67%)

Annotation
*Heliconius*	HMEL003843	84.38%
*Bombyx*	BGIBMGA011084-TA	87.55%
*Drosophila*	Toll-6-PC	54.19%
EBI UniRef50	UniRef50_B4GUC8	53.35%	GL24793 n=9 Tax=Neoptera RepID=B4GUC8_DROPE
NCBI RefSeq	XP_971999.1	68.63%	PREDICTED: similar to toll [Tribolium castaneum]
NCBI nr blastp	gi\|91076464	68.63%	PREDICTED: similar to toll [Tribolium castaneum]
NCBI nr blastx	gi\|91076464	67.48%	PREDICTED: similar to toll [Tribolium castaneum]

Group
Gene Ontology	GO:0031224	6.3e-39	intrinsic to membrane
	GO:0007165	6.3e-39	signal transduction
	GO:0004888	6.3e-39	transmembrane receptor activity
	GO:0045087	6.3e-39	innate immune response
KEGG pathway	xtr:100036682	3e-37
	K06838 (SLIT1)	maps->	Axon guidance
InterPro domain	[857-1011] IPR000157	6.3e-39	Toll-Interleukin receptor
	[864-878] IPR004075	2e-06	Interleukin-1 receptor, type I/Toll precursor
Orthology group	MCL10048		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS203198-TA
ATGAGTTTAGAAATCGCATCTGAAAGTTTTACAGCTGTAAGACAGTTAGAAAAGTTGGACTTGAGCTATAATAATATCTGGTCGTTTCCGGAAAACTTATTCTGCCCTTTGACTAACTTAGTTTACTTGAACGTGTCTTCAAATAGACTACAAGATGTAAGTGATTTGGGTTTTAGAGAACGGGCTATGCATCAAGCTCTTATAAGTGAACATGAAGGCCCTTCACCATCAACGTCCACTTCACCGCATACATCATGTTCTTTGGATATCGAAGTATTAGATGCATCGGTAAACCAATTTGTTCTTATGCCAGAAAATGGATTTATGGCTCTACGAAGACTTAAAGAACTACATATTCACGACAATGAGATTTCTATGGTCGCTGACAAAGCTTTATCCGGTCTGAAACAACTGCAAATAATTGATCTTTCCAATAACAAAATAGTGGCCTTACCTCAGGACTTATTTCGGGATTGTAGACCAGTGATTAAAGAAATATACTTACAAAATAATTCTATAAGTGTTCTTTCACCAAGTCTGTTTGCAAATTTAGATCAACTGCTGGCATTAGACTTATCAAACAACCATTTAACAAGCACTTGGATAAATGAAAACACGTTTACTGGTCTCATAAGGATGATTGATGCGTACGCTTTAAATGGGCTGTACGTTTTATCTTTACTATCCATTGATAATAACCACCTAGAAGAACTTCACCCTGAGGCTTTTCGGAATACTTCTTCTCTACAAGATTTGAATTTAAATGGAAATCGATTGAAAAAAGTGCCGACAGCTCTTAAAAATATGCGTTTATTAAGAACCCTTGATCTAGGAGAGAATCAGATTATGTCGTTAGAAGAACCTGGCTTTGTAGGTTTACATAATGTATATGGATTACGTCTTATAGGGAATAAAATTGAAAATATAAGCAAGGAAGTTTTCACAGATCTACCTTCCCTACAGATTTTAAATTTGGCGCGCAATAAAATAAAACAGATTGATATGGATGCCTTTGAAACATTATCAAATTTACAAGCTGTGAGATTAGATGCTAACCAACTCAAAGATATCCAGGGCCTTTTCGTAAATATACCCTCTCTTCTGTGGTTAAACGTGTCAGGTAACCAAATAGAATGGTTTGACTACGCTGTGATACCAGTTGGACTTCAATGGTTAGATGTTCACAGTAATAACATCAAAGAATTAAGAAATAACTACCGTTTGGATAAAGAACTACGGTTACAAACACTAGACGCCAGTTTCAATTTAATGACGAAAATCTTTACTTATTCTATCCCCAGTAGTATTGAGCTCTTGTTCTTAAATGACAATCAAATTACACAAGTTGAAGCCCAAACTTTTGTCGGAAAAACCAATTTAACGAGGGTCGATTTGTATGCAAATCAGATAACTAGCATGGACCTTAATGCTCTTCGTTTGACGCCAGTTGATCCTGGAAGACCATTGCCAGAATTTTATATCGGAGGAAATCCTTTTCAATGTGATTGTACGATGGAATGGTTGCAAAGAATAAATAAATTAGATCATTTAAGACAACATCCTCGAGTTATGGACTTGGAAAGTATATATTGTAAGCTACTATATAACCGTGAAAGAACTTATATTCCGCTTATTGAAGCGGAATCATCTCAGTTTTTGTGTACATATAAAACTCACTGTTTTACTTTGTGTCATTGTTGTGATTTTGACGCTTGTGATTGTGAAATGACGTGTCCGTCGAACTGTACTTGTTATCACGACCAACCGTGGTCAGCGAATATTGTGGACTGTTCCGGTGCTGGCTATGCTGAAATACCTAACACTATACCTATGGATGCAACTGAGCTATATTTAGATGGAAATAATTTTGGAGGGTTAACCAGTCACGCTTTTATCGGACGTAAAAATTTAAAAATATTATATGCAAATAACTCGAACATAGATGCACTGTACAATAATACTTTCAGTGGACTAAAACGATTAACCGTATTACATTTGGAAAAGAACAACATAAAGGAGTTGTTAGGATTTGAATTGTCGCCTCTTGAGAATTTACGAGAGTTACATCTTCAAGACAATAAAATACATTATATCGACAATCGAACATTTATGGAGTTAAGGCACTTAGAAGTACTACGTTTAGAAGGTAACAACATTTACAGTTTTGCTGTCTGGCAATTCACGATGAATCCATATTTAGTTGAGATAAGCCTATCACGAAACCCGTGGTCTTGCGACTGTCAGTACATGCATAAATTCCGAAATTGGTTTAAAAATAATCTTGGCAAAGTTGAAGCTTCTGATAAGATCACATGTATATTTGACAATGTAACAAACGCCGTTGGACCGTTAATGTCTGATTTTAACTCAACTATTTGTACAAGTCACGTAGGTGGAAGTTCATCAATCATCGAAAACCAAGTTATCAATGACTATCTGCCATTACTATTAATATCACTTTTTGTATTTGTAATGAGTTCTGCGCTTATTTGTGGAATATTTTATTGGAGAAGAGAACTCAGAGTGTGGGTTTATTATCATTGCGGATTCCGAATGTGCTATAAAAGTACCGCTTTCGACGACGAGGCCGACAAAGATAGGTTATTCGACGCCTACATTAGTTACAGCGTGAAAGACGAAGCATTTGTTGCTCAAATGTTAGCGCCCGGCCTAGAATCCACGGACCCAAGTTTCCGCCTTTGTCTTCATTACCGCGATTTTAATGCATCAGCCTACGTAGCGGACACCATTATTGAAGCAGTTGAATCTTCAAAGCGAACTATAATAGTGCTGTCTAAAAATTTTATTAACAACGAATGGTGTCGATTCGAATTTAAAACGGCACTTCATGAAGTTCTTAAAGAGAGACGAAGAAGACTGATAATAATATTATTGGGTGACTTGCCGAATAGAGACATGGATCCTGAATTAAGGTTGTGTTTAAAAGCGAATACGTGTATTGAGTGGGGTGATAGACAATTTTGGCAAAAACTAAGGTTCGCCATGCCTGATCTGCGGAAGTGTCAATATCATCGTTCAACTGTGAACATTTACGCGTCAGTGTCACCTGTAGGGGCCGGGCGTGCGCCAGCGCCGACCCCTCCTCCGCCGCCTGGCAAGCTGCCACCTCTGCTGGCTGATGGGCTAGCCGACAGACTTGGAATGCCGACCAGCGTACACCGCGATCATCATTCCCACCGAATGCCTCCACATGCTCAGCTGTGGGCGTAG

Protein sequence:

>DPOGS203198-PA
MSLEIASESFTAVRQLEKLDLSYNNIWSFPENLFCPLTNLVYLNVSSNRLQDVSDLGFRERAMHQALISEHEGPSPSTSTSPHTSCSLDIEVLDASVNQFVLMPENGFMALRRLKELHIHDNEISMVADKALSGLKQLQIIDLSNNKIVALPQDLFRDCRPVIKEIYLQNNSISVLSPSLFANLDQLLALDLSNNHLTSTWINENTFTGLIRMIDAYALNGLYVLSLLSIDNNHLEELHPEAFRNTSSLQDLNLNGNRLKKVPTALKNMRLLRTLDLGENQIMSLEEPGFVGLHNVYGLRLIGNKIENISKEVFTDLPSLQILNLARNKIKQIDMDAFETLSNLQAVRLDANQLKDIQGLFVNIPSLLWLNVSGNQIEWFDYAVIPVGLQWLDVHSNNIKELRNNYRLDKELRLQTLDASFNLMTKIFTYSIPSSIELLFLNDNQITQVEAQTFVGKTNLTRVDLYANQITSMDLNALRLTPVDPGRPLPEFYIGGNPFQCDCTMEWLQRINKLDHLRQHPRVMDLESIYCKLLYNRERTYIPLIEAESSQFLCTYKTHCFTLCHCCDFDACDCEMTCPSNCTCYHDQPWSANIVDCSGAGYAEIPNTIPMDATELYLDGNNFGGLTSHAFIGRKNLKILYANNSNIDALYNNTFSGLKRLTVLHLEKNNIKELLGFELSPLENLRELHLQDNKIHYIDNRTFMELRHLEVLRLEGNNIYSFAVWQFTMNPYLVEISLSRNPWSCDCQYMHKFRNWFKNNLGKVEASDKITCIFDNVTNAVGPLMSDFNSTICTSHVGGSSSIIENQVINDYLPLLLISLFVFVMSSALICGIFYWRRELRVWVYYHCGFRMCYKSTAFDDEADKDRLFDAYISYSVKDEAFVAQMLAPGLESTDPSFRLCLHYRDFNASAYVADTIIEAVESSKRTIIVLSKNFINNEWCRFEFKTALHEVLKERRRRLIIILLGDLPNRDMDPELRLCLKANTCIEWGDRQFWQKLRFAMPDLRKCQYHRSTVNIYASVSPVGAGRAPAPTPPPPPGKLPPLLADGLADRLGMPTSVHRDHHSHRMPPHAQLWA-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: