MonarchBase - Protein-coding gene

DPOGS208301
Transcript	DPOGS208301-TA	3996 bp
Protein	DPOGS208301-PA	1331 aa
Genomic position	DPSCF300079 + 648596-664150
RNAseq coverage	118x (Rank: top 58%)

Annotation
*Heliconius*	HMEL021496	86.49%
*Bombyx*	BGIBMGA006467-TA	81.31%
*Drosophila*	CG7896-PA	53.42%
EBI UniRef50	UniRef50_B3LYV9	53.60%	GF18811 n=10 Tax=Endopterygota RepID=B3LYV9_DROAN
NCBI RefSeq	XP_968875.1	55.75%	PREDICTED: similar to GA20668-PA [Tribolium castaneum]
NCBI nr blastp	gi\|183979307	83.33%	similar to CG7896 [Papilio xuthus]
NCBI nr blastx	gi\|183979307	83.60%	similar to CG7896 [Papilio xuthus]

Group
KEGG pathway	dme:Dmel_CG5195	5e-44
	K05401 (TLR3)	maps->	Toll-like receptor signaling pathway
InterPro domain	[1115-1162] IPR000483	1.9e-06	Cysteine-rich flanking region, C-terminal domain
Orthology group	MCL15826		Insect specific

Nucleotide sequence:

>DPOGS208301-TA
ATGGCAAAGGGAACTCTGGTCACAATGTGGTTTCTTCTATTACTCTTCATGCCGTACGTCATCAGTCAGCAACCATGGGTACCGTGTTCAGAGTTGAACGATGACCTTCGGTACCCTTGTCGGTGCAGGGTTCAAGTCGACAGAGCATTGCAGTTACGAATATTGATGAACTGTGACCACGTGGTATTCGCGGGTGACTTTCCACCACTTCCTTACGGCGCCCCCATAGTTTCGTTCAGTCAACGTTGGGCTGGACAACAGTCATTACCAACACAGATTTTCTCATCTTACGGTCTTCCGTTAAAAGAGCTGGACTTTTCTCATAACAGTCTCCGTCGGTTGCCTGACCGTTTGTTAGCGGGAATCAAAGGCAATATTACCAAAGTAGTTTTAGAAGATAATCTCCTCGGTGACAATTTGAATCCAATCTTCTCGACCGCCGAGTTTCACAATCTTCCAGCGTTGGAAGAATTGGATTTAAGCGGAAATAATATAAGAGGACTTGAAGAAGGTCTCCTAATTGGTTGCGATGTGCTCAAGGTTTTACGCTTGAACCGTAACAATATGAATTTCGTCCCATCCTCTTCTCTCAACGGGCCACAGTCATTAAAAGTTCTTTCGCTTAGAGAAAATAGAATAGGCATAATAAGACAAGCAACTTTCATATCTCAAAAGTCTTTACAAGAAATAGATTTGCATGGGAACATGATATCTACGATTGAAGGAGGAGCATTTATAGGCTTGAAAGGTTTAGAGAGTCTGGATCTTGGACGGAACAGACTGTCCAAATTCAACAGTGACGTATTTCAAGGAATAGAGAACTTGGAGAAATTGGATTTGTCGGAAAACTTTATAGGCGATTTTCCGACAGTTGCACTTAAATTGTTCGCCGGATTAAAGCATTTGAATATGTCCAGCAATATGATAACGAACATGGATCACAGTCACCTTAATGCTCTATCAGCATTGGTAGTTTTGGATCTGAGCAGAAACAATTTAGTAAAACTCTCACCAGGAACTTTCGTTGGTTTAACTGAATTGAAATATCTTGATATTGGTGTGAATTCTTTACGTACTGTGGAGGACGATGCATTCGATGGCCTTACTAGTTTAGAAACATTGTTATTGAGGGACAATAACATTTTACTTATTCCTGCAGCTGCATTGTCTCGATTGCCTAGTCTGACGTCTATTCATTTAGGATTTAATAGAGTAACAGCGCTCTCTAGCGATATTTTACGGGCAGTCTCCGAAGGCATAAATTCGTTGGTTCTATCGAGAAACGTTATCAGGGAATTGCCCCCGGCTGCTTTTGAACATTTTAAATATATACGTCATTTAGATCTATCTGGAAATCTCTTAAATTCGATAACAGCAGACGTATTCAGCGGTCTAGAGACTACGCTTGAATTTTTGTCTCTCAGCCAAAACAGAATATTAGGATTCACTGGAGAATATTTAAAATTTGTGAACCTGTGGTTTCTAGATATATCTGGAAATCAAATATCAGAGATACCAGTTAACGCATTCGAATCAATAAAGAGTTTAACGCACCTTAATATGAGTCATAACTTACATATTAATGTGTTGCCACAGAATCTTTTCGATTATAATGAAGGACTTCTATCCGTAGATATAAGCCATGTTGGACTCAAAGCATTGCCGGTTAATTTGTTTTCAAAGACTCATAATTTGGAATACATATATTTATCACATAATTTGTTACAAGAAGTATCGGAAGGTACTTTTAAGAATCTTAAGAACCTAACTCATCTCGACCTTTCGTACAATAACATAGTTACAATAAGAACACCTGCCTTTGTAAATGTCATGTCAATACAATATTTATCTCTGAAAGGAAATCAACTGAATGCGTTTAAAGGTGAATTCTTTAATACTGGGACCAGCTTAGAGGTTTTAGATGTATCAGATAATCAGCTGAGCTACTTATTTCCATCCTCTTTTAAGATTCATCCTAGATTAAGAGAAATAATACTTGCTAATAACCAGTTCAATTTCTTCCCCGCAGAACTTATTAGTACCTTGCAATATTTGGAAAAAGTAGATTTGTCGGGCAATGTTTTGAAAAATGTGGATGAATTAGATTTTGCTCGACTGCCTAAATTACGTACGATCTTACTAGCAAGAAATGAACTCGAATCCGTAAGTGAAATGGCTTTCCATAATTCTACACAGATCCAGCGTTTAGATTTGTCTTACAATAGAATAGATCGTTTAGGTGATCGATTATTCGAGGGTCTCATTAGATTAGAACTTTTGAATTTAGCCGGAAATCTTCTATATGAACTACCAGATAATATATTTGACAGATCAAGGCTCCATATGCTGGAATCAATAGTACTCAGTCACAATTTATTTGAACATGCGCCGTTAAAAGCGCTGCAAAAACAATATTTCTTTGTGTCATCAGTAGATTTATCCTATAATGAAATCGTAGATATTCCCGCAGAAGATAGCGTAATGGTCAATATTAAGAAACTTGACCTCTCCTTTAACCCATTATCAGAGAAAACAATAGATAATGTCCTAACAGAACCAAAAACAGTAAGAGAATTAAATCTAGCTGGCACCGGGATAAAATATGTTAAACAATTGGAGACGCCGTTTTTATATCGATTAAATCTATCTCATAACAACATTACTAAATTACCCGAAAAGACCTTCGCAAGAACCACTATGCTTGAATCTTTAGATCTCTCCTTTAATCAGATCGGTGATGTGTCTAATTCCCTTTCTATATCCTGGCCTAAATTAAAAAATCTTCAAAAGTTAAATATTTCGAATAATCCTATAATAATGGTACTGGAAGGTAATTTTGAAGGACTAATTTCACTTCGATTTTTAAATATGGAAAATCTAGAAAAATGTACAAAAATAGAAAAGAATGCTTTCAGACCCCTATCAAATCTTGTAGAACTTCGCGCATATGGATATCCAAGATTGGGTTATTTCGATGTTCAAGGAGCTCTACAGTATGTATTAGCAATGGAAAAATTAGATGTTGAAGTAAAAGATACTAATGTTGGCCCAGACCAATTACATTCAACATTACATCCCCGTCTCGAAGAATTGGGTTTAAGAGGAAGTAGACTAAAGACAATCTCTTCTGGGGTACTTGCAGGTTTAAAAGCACCTTCAATCACTGTACGATTCCGTAATACATCTATTACTAATTTGCCTCCAGCACTATTGTTTCCTTTGCCACGTTCCTCACAAATTACAATCGACGTAGGAGGTAGTTCATTGACAACACTGCAGCCACAATTATTGGTAGCTCTTGATGATCGTCGTGCAGATTTGTCTATGTTTGGGCTAGATGCTAATCCAATACGTTGTGATTGTAACGCCAGAGCTTTAAGGAGATGGTTACCTACCGTAGGTATTCAAGGTGTGAGATGTCACTCACCCGACCATTTATCAGGATATTTAATAGTTGAAATAGGGGACGACGAGCTCTCATGTGATTCTAGAAAGAGAACTACAGCTACTTCTTCCAGTAGTATTGCTACAACATCACCTCCAAGACTTGTACATAAAACGTCAGCGGAGCCGGATATTATCTGGTCAGTGGCACCCTCGCATGATCGACCAAAAGCAACAGGAGAGCCTAAAGGAGCACCTGTTATCGGAATTGCCACTTCTAATAATGATGACAATTTGATAATAGGGATAGTAGGTGGTGTTGTTGCTTTTATAGCAATACTTATTGTTGCTATATGTATTGTGCGTTTACGTATGACTTCGACATCTTATCGCGGAGGGCCCTTAGCGAATAGTCCCGGTGCTGGGGCAGCTCAATTATGGGGTGCAGCCTGGCCTGGATATGCAGCGACTTTACCCCCACCATCATTGTCTACAGCAACATTACCTCATAAAGTGCAATCCGGGCCTGGTTCAGTACGTTATATGGCAGCTCCACCTCCAGCCCCTTACTTTATAAGCTTGCCACCTCATGACGATAAAATTTATCGATGA

Protein sequence:

>DPOGS208301-PA
MAKGTLVTMWFLLLLFMPYVISQQPWVPCSELNDDLRYPCRCRVQVDRALQLRILMNCDHVVFAGDFPPLPYGAPIVSFSQRWAGQQSLPTQIFSSYGLPLKELDFSHNSLRRLPDRLLAGIKGNITKVVLEDNLLGDNLNPIFSTAEFHNLPALEELDLSGNNIRGLEEGLLIGCDVLKVLRLNRNNMNFVPSSSLNGPQSLKVLSLRENRIGIIRQATFISQKSLQEIDLHGNMISTIEGGAFIGLKGLESLDLGRNRLSKFNSDVFQGIENLEKLDLSENFIGDFPTVALKLFAGLKHLNMSSNMITNMDHSHLNALSALVVLDLSRNNLVKLSPGTFVGLTELKYLDIGVNSLRTVEDDAFDGLTSLETLLLRDNNILLIPAAALSRLPSLTSIHLGFNRVTALSSDILRAVSEGINSLVLSRNVIRELPPAAFEHFKYIRHLDLSGNLLNSITADVFSGLETTLEFLSLSQNRILGFTGEYLKFVNLWFLDISGNQISEIPVNAFESIKSLTHLNMSHNLHINVLPQNLFDYNEGLLSVDISHVGLKALPVNLFSKTHNLEYIYLSHNLLQEVSEGTFKNLKNLTHLDLSYNNIVTIRTPAFVNVMSIQYLSLKGNQLNAFKGEFFNTGTSLEVLDVSDNQLSYLFPSSFKIHPRLREIILANNQFNFFPAELISTLQYLEKVDLSGNVLKNVDELDFARLPKLRTILLARNELESVSEMAFHNSTQIQRLDLSYNRIDRLGDRLFEGLIRLELLNLAGNLLYELPDNIFDRSRLHMLESIVLSHNLFEHAPLKALQKQYFFVSSVDLSYNEIVDIPAEDSVMVNIKKLDLSFNPLSEKTIDNVLTEPKTVRELNLAGTGIKYVKQLETPFLYRLNLSHNNITKLPEKTFARTTMLESLDLSFNQIGDVSNSLSISWPKLKNLQKLNISNNPIIMVLEGNFEGLISLRFLNMENLEKCTKIEKNAFRPLSNLVELRAYGYPRLGYFDVQGALQYVLAMEKLDVEVKDTNVGPDQLHSTLHPRLEELGLRGSRLKTISSGVLAGLKAPSITVRFRNTSITNLPPALLFPLPRSSQITIDVGGSSLTTLQPQLLVALDDRRADLSMFGLDANPIRCDCNARALRRWLPTVGIQGVRCHSPDHLSGYLIVEIGDDELSCDSRKRTTATSSSSIATTSPPRLVHKTSAEPDIIWSVAPSHDRPKATGEPKGAPVIGIATSNNDDNLIIGIVGGVVAFIAILIVAICIVRLRMTSTSYRGGPLANSPGAGAAQLWGAAWPGYAATLPPPSLSTATLPHKVQSGPGSVRYMAAPPPAPYFISLPPHDDKIYR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: