MonarchBase - Protein-coding gene

DPOGS209354
Transcript	DPOGS209354-TA	3216 bp
Protein	DPOGS209354-PA	1071 aa
Genomic position	DPSCF300118 - 460933-467338
RNAseq coverage	9x (Rank: top 85%)

Annotation
*Heliconius*	HMEL006371	0.0	47.36%
*Bombyx*	BGIBMGA005685-TA	0.0	43.78%
*Drosophila*	CG4168-PB	1e-96	30.88%
EBI UniRef50	UniRef50_D6WHI0	9e-106	29.20%	Chaoptic-like protein n=1 Tax=Tribolium castaneum RepID=D6WHI0_TRICA
NCBI RefSeq	XP_975409.1	2e-106	29.20%	PREDICTED: similar to putative GPCR class b orphan receptor 1 (AGAP009007-PA) [Tribolium castaneum]
NCBI nr blastp	gi\|91079120	3e-105	29.20%	PREDICTED: similar to putative GPCR class b orphan receptor 1 (AGAP009007-PA) [Tribolium castaneum]
NCBI nr blastx	gi\|91079120	4e-110	29.52%	PREDICTED: similar to putative GPCR class b orphan receptor 1 (AGAP009007-PA) [Tribolium castaneum]

Group
KEGG pathway	dme:Dmel_CG5195	2e-31
	K05401 (TLR3)	maps->	Toll-like receptor signaling pathway
Orthology group	MCL12737		Insect specific

Nucleotide sequence:

>DPOGS209354-TA
ATGAATCAAGCCTCGGTGTGCTGCAGTCGCTCTGCGGAGGTGACCGGCGTGTGGACGGAGCTAGTTTTTGTACCAGCGTGTGGTGCGATGCGTGGATCGTGTCGTCCGAGGCTCTGCTTCGCCTCAAGTGCAGCGTTGTTTCGCTTTCTCACTCTCTTATATTGTATCACACCTGTCCGTCGAGCAGCACAGCTGCAGTTTGCAGCTCTGTTAGTGCTGCTGGTGTCGGCAACAGCTCGAGCACCGCGTCCCTGTGCCGCCAGCCCGCTATGCGTTTGCCGCGACGACCACTTCGCGTGCGACGCCGTACCCTTTCACAGATTTCCAGAGACCGAGACAGGCGTGCTTCACGTGTCAATATCCGCTGCTCGTCTGGGCGTACTGGGGGAAGCGGCTCTGGACGGACGGCCTCTACGTACGCTCGTGCTGGTCGCCTCGCGTCTGCATCAAGTCGACGGCGCCGCGCTAGCCTCCATGGCCACATCGCTCGCATCATTAGATATGAGTTATAACGAGTTTACCGAGGTTCCAATAGAGGCGTTGCGACATTTGAAAGTTTTAAATTGGCTAAATTTACAAAACAATTTCATAAGCGATTTAAACTCTGTGATGGATTGGGGCGGCCTCACCGACTCTTTGAGTAGCTTATCGTTAAGTAACAATCATATCTGTGTAATTAGCCAGGGCGTATTTTCTTCGCTCCGTCATTTAACTCAGTTAGAGCTTGACGGCAACAGACTAAGACAACTGGACGCCGAAGCTCTCCCCATCTCTCTGGCTATTCTACGCCTTTCCGATAATTTACTTTCGGGCCTTCCCTGCAGAGCATTAACTCACCTTCCTCGTCTACGTCACCTTCATTTAAGAAATAATATTCTGCAACCAAAGTTTAATATAACATGTCGCAGCGAGCGATCAAAAATAGATTCACTCGATCTTAGTCACAATGAACTTAGCGACGGTTTTAACTTTGACTTTCATCATAGTATTCAACTGAAGCAATTGGTTTTAGACCTCAATGACTTTACTGCTGTTCCAGCATTTGTTCTTGAATGTGGTCGGTTAGAAAAGTTATCCATTTCCTACAATAACTTACAACATGTATCAGACACTATAGTCCATGGTCTAAAGCATAGTTTACAGAGATTCGATTTGGACCACAATGAATTAACATTATTACCAGATTCTTTACGTGAGATGAACCGACTACGACATCTGTCTGTAACATACAATCGTTTGGAAGATATCAAACACTTACCACCAAAGTTACATTCCTTATCATTATCCGGAAATTATTTCAATGCATTTCCAAGTGCTCTCCAAAATTTAAGTGTAGCAACTTTGTCTTATTTAGATCTCGGCTACAATCGAATTTCCTACGTTGCTTCTGATAATTTCGGTGTATGGTCTAAGGCCCTGACAACTCTTGGTCTCCGAGGAAACAGGATAGCCCAGTTGTTGCTCGATTCCTTCCCACCCTTGCCGCTCCGTGAACTTGTACTTAGTTTTAATGACTTGTATTATATTGAAGCTGGCGTATTTTCAAATTTAACACAGTTAAGAATTTTAGAATTATCTTCTGCTGTATTTAGTGGTGATATTTCTACGGGGTCTGGTCTCAGAACTTTGACGTGGCTCGGTCTAGACAATAATAACATTCATTATATGTCGTCCGAAGACATTCTACAGTTTCCCTCTTTAGAATATCTAAATTTAGATTTTAACAAGATAATTGAATTCCCCAGCGATTTGGGAAATACACAAGGATCCAAACAGTTTCATAGCCTTCCCTGGTTGAGACTGTTACGATTGGAGGGAAACAGATTGCGGGCTCTACCTCGTGACGTCTTTAAGAATACTTTACTAGAATACTTAGATTTAAGTAACAACCAGTTATCTTTGTTTCCGAGCAGTGCACTGGCCCAAGTCGGTTTCACTTTACGTCGTCTTGAATTATCAAAAAATAAAATAGAATATCTCGATGCGGCTATGTTCCACGCGACAGCTTTCTTACATGAACTTGGTTTAGCTCAGAACGCTTTGACTGTCTTGTCAGACAACACTCTCGCAGGGTTGCCAAGATTACGTAGACTCGATCTGTCGTTTAATGCTATAAAAACAAATTTCAAAGAATTATTTCACAACGTACCTCGTTTGCGGCGATTATCTTTAGCTAATACCGGATTAAAAACTGCTCCTCATATTCCACTGGCTAATCTCACGGAATTGAACCTGAGCAATAATTACATAACATCATACAGTGAGGTCGACATGAAGCATTTTCAAAATTTAAGAGAATTAGATATTGCAGGAAATAAATTTACAACACTTCGTCCTGCTATGTGGGTGGCTGTACCGAAATTGTTGTCACTCGATGTTTCGAGAAATCCAATAGTTCGAATACAACAGGGTTTGTTTGAGGGATTACAAAGACTTTTGTATCTCAAGATGGATGACTTAAAGTATTTGGAAACATTAGAACCTCGCGCTTTTCGCGCCTTGATATCCCTCAGGTCTCTTACTTTAGAGACGCCTGCGGGCGAAGGGAGGGCGGTTCCTATAACAGAAATCGTATCATCATCACCTTATATAGAAGTGTTAGCCGTCCACGTACATAAAGAAATCGTGGATTCTCAATTTTCGGGAATGGTTGCGCCAAAACTAAGATCACTAGAAGTACGAGGTGCCTCAATTAGGACTGTAACTGCAGATGCTTTTTCTGCCTTAAGTAAGCAACGAGCGCTGACTTTGCGTCTGACTGGTTCTTCAGTAGCGGAGCTGCCGGCAGGGCTCATACTGCCGTTAGTTCGAGTACCTCACCTCGCACTCGATTTAACTGACAATCAGTTAGTTAGTTTTGGTCCGTCAATTCTTTATCCAAATCTCACTGGGTGGAATCGTTACGCTACAAAAGTGTTGCCCGGTGGTCTTTTATTGGGTGGAAATCCTCTCCGCTGCGGTTGCTCTGCGTCCTGGGTGGGCGGTTGGTTGCGTCGCTGGACGAGCGAGGTCGGCGGCGGCTCCCGTCGAGCTCGAGCCGCAGCCCGCCACACCACCTGTCTGACTCCGTCCGGACCCCGCGCCTTGCTCGCGGTCAACGCTGACGATGCCGAGTGTCACGCCAGCGCTCTTTCCAGTCGCTCCTGTACGCTTGCGTATCGTCATGTTTTCTATTATATGTTTTTATTGGTGATGACGTTGTATTTTTTTAGTTAA

Protein sequence:

>DPOGS209354-PA
MNQASVCCSRSAEVTGVWTELVFVPACGAMRGSCRPRLCFASSAALFRFLTLLYCITPVRRAAQLQFAALLVLLVSATARAPRPCAASPLCVCRDDHFACDAVPFHRFPETETGVLHVSISAARLGVLGEAALDGRPLRTLVLVASRLHQVDGAALASMATSLASLDMSYNEFTEVPIEALRHLKVLNWLNLQNNFISDLNSVMDWGGLTDSLSSLSLSNNHICVISQGVFSSLRHLTQLELDGNRLRQLDAEALPISLAILRLSDNLLSGLPCRALTHLPRLRHLHLRNNILQPKFNITCRSERSKIDSLDLSHNELSDGFNFDFHHSIQLKQLVLDLNDFTAVPAFVLECGRLEKLSISYNNLQHVSDTIVHGLKHSLQRFDLDHNELTLLPDSLREMNRLRHLSVTYNRLEDIKHLPPKLHSLSLSGNYFNAFPSALQNLSVATLSYLDLGYNRISYVASDNFGVWSKALTTLGLRGNRIAQLLLDSFPPLPLRELVLSFNDLYYIEAGVFSNLTQLRILELSSAVFSGDISTGSGLRTLTWLGLDNNNIHYMSSEDILQFPSLEYLNLDFNKIIEFPSDLGNTQGSKQFHSLPWLRLLRLEGNRLRALPRDVFKNTLLEYLDLSNNQLSLFPSSALAQVGFTLRRLELSKNKIEYLDAAMFHATAFLHELGLAQNALTVLSDNTLAGLPRLRRLDLSFNAIKTNFKELFHNVPRLRRLSLANTGLKTAPHIPLANLTELNLSNNYITSYSEVDMKHFQNLRELDIAGNKFTTLRPAMWVAVPKLLSLDVSRNPIVRIQQGLFEGLQRLLYLKMDDLKYLETLEPRAFRALISLRSLTLETPAGEGRAVPITEIVSSSPYIEVLAVHVHKEIVDSQFSGMVAPKLRSLEVRGASIRTVTADAFSALSKQRALTLRLTGSSVAELPAGLILPLVRVPHLALDLTDNQLVSFGPSILYPNLTGWNRYATKVLPGGLLLGGNPLRCGCSASWVGGWLRRWTSEVGGGSRRARAAARHTTCLTPSGPRALLAVNADDAECHASALSSRSCTLAYRHVFYYMFLLVMTLYFFS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: