MonarchBase - Protein-coding gene

DPOGS210850
Transcript	DPOGS210850-TA	1905 bp
Protein	DPOGS210850-PA	634 aa
Genomic position	DPSCF300027 + 501137-506360
RNAseq coverage	364x (Rank: top 33%)

Annotation
*Heliconius*	HMEL021703	0.0	65.47%
*Bombyx*	BGIBMGA006978-TA	4e-144	64.01%
*Drosophila*	CG7896-PA	3e-20	28.34%
EBI UniRef50	UniRef50_Q178X4	2e-65	31.82%	Putative uncharacterized protein (Fragment) n=1 Tax=Aedes aegypti RepID=Q178X4_AEDAE
NCBI RefSeq	XP_001651397.1	3e-66	31.82%	hypothetical protein AaeL_AAEL005739 [Aedes aegypti]
NCBI nr blastp	gi\|157111115	6e-65	31.82%	hypothetical protein AaeL_AAEL005739 [Aedes aegypti]
NCBI nr blastx	gi\|157111115	3e-66	31.82%	hypothetical protein AaeL_AAEL005739 [Aedes aegypti]

Group
KEGG pathway	bta:520189	4e-21
	K04308 (LGR5, GPR49)	maps->	Neuroactive ligand-receptor interaction
Orthology group	MCL18852		Insect specific

Nucleotide sequence:

>DPOGS210850-TA
ATGCGCGCCATCAAACTTTTGACGTTTTACTTTTTAATTTGGAACCCGGTGCGGACGCAGGAGATCACAGAGGAATCCAGATTAATAAAAGTTTGTTCATATTGTACGTGCAGTGAAATACCAGAAGTGGATGGCACACATTTGGTGTTAAATATATTGTGTTCTGAATTGGATCGCATAGAAAATCTCGCTGATTTGGATAAAATTCAATGGCCGGAAAATCCTAATGGTTTGAAAATATCCGCGACTTTTGAGGGGATGGGTCTATCCACTCTAGGCAAATTACCACCTAATTCTCAAGTAGAGACGCTCAGATTCACAAATAATGCTATCAAAACATATTGGCCCGATCCATTCAGCGATGTTCCCAACCTGAAGAGAATATCGTTCACACAAAACGAACTCTCAGAGATCACTCCAGACCTCTTTACGAAGATAGAGAGCTTGGAAGATTTAGATTTGTCGTATAATAAAATCGGAGACATAAATCCTCTAGATTTTAAATTTTTACACAACCTAAAGAGGTTGAATTTGCAAAGTAATCTTCTAAAGAAAATACCAGTAGCTTCACTCGAACCTGTGACAGTGTTGGAAGACTTGGACCTCAGTAAAAATGGAATTCAGGAAGTGTTGCTCAGACGGGTGGAGAGTGTAACGTTGAAAGGAATTAAAAGGTTAAATTTAAATAGCAACAGAATACGATCAATACTTAAAGAATCTTTTCCGGATAACAACAGCATAGAACTGTTGGATTTATCTAATAATATAATTGAGATGGTCGAAGAGGATGCGTTGTCCTCGTGCATCAATTTAAGAGAATTGAACCTTGCGCAGAACAACATAACGTTTCCTTTCGCTGTTCCGCCGACACTTCAGATCGCTATATTGAAGATAAACACCTTGTACCACTGGCTGAACTTCCCCGCCGGCATCACCTACATAGATCTTTCTTATAATCGTTTATCAGCTCTGTATAATGAGGAGACTGTTGATTTTAATAACCTTGAGGTTCTAAGTATAGGCGGTAATCAATTACGAGATTTTGATATACAAAGAAAACTTCCAAAGCTATTCAGCTTAGATATATCTTATAATCTGTTACAAGAAGTGCCAAAATGTCTGAGCAGTGAAATTCTCCCGAATTTGGAAGAGTTGCGTTTAGATGGCAACCCAATGGAGAGTATTTATTTTAAGAATATAATAGCCTTAAAGTATTTATATATGAACGATCTGATTAAACTGACAGTAGTAGATGATAAGGCATTCAGTAATGTTATTGGCAGACGCGGTGACGACGATGCTAATTCAGAGAAGAGTTGTTTTTCTCTCTATCTCTCTCATAATCCATCCCTCAGTAACATCCAAGATGGAGCATTCGACGGTACAAACGTTTGTATGTTAGACATAAGTCACAACAACCTTAGCGTACTGTCTCGTTCGGTGATGTCTCCTCCGCCGACGGAGGGAGTTGATCTCCAATACAACCCATGGCGGTGTTCCTGCGAGATGCAGTGGATTGTTGACGACCTGCTGCCAGTGCTGTATAGAGACAGCCCTCGGTTATTAGATGAGCTCAGATGCGGTTCTCCACGAGCGCACGAGGGTCTTCGTCTTGTACATTGGTACAACTGGACAGGACGCGCTTTGTGTGACCAAAGAGCGCTTGGAGGCTACGAGATTGAATCCTCAACGGAGCCGAGTAAAGTGACTAATCTGACCCTCATTTTGGGAGGGTGCGTCATAGTTGCTCTCCTCATAGCCATTGCTTTGTTTGTGTACTTGGTGAAGAGTCGAAGAAGACACAGAATAAGACAGGCCGCTCTCAATCGCAAGAGACAAAGTTCTAGTGACGCTAAAAATACCAACGGGCTACACAACGAATTCGCAGCTCTGAATAAGACATGA

Protein sequence:

>DPOGS210850-PA
MRAIKLLTFYFLIWNPVRTQEITEESRLIKVCSYCTCSEIPEVDGTHLVLNILCSELDRIENLADLDKIQWPENPNGLKISATFEGMGLSTLGKLPPNSQVETLRFTNNAIKTYWPDPFSDVPNLKRISFTQNELSEITPDLFTKIESLEDLDLSYNKIGDINPLDFKFLHNLKRLNLQSNLLKKIPVASLEPVTVLEDLDLSKNGIQEVLLRRVESVTLKGIKRLNLNSNRIRSILKESFPDNNSIELLDLSNNIIEMVEEDALSSCINLRELNLAQNNITFPFAVPPTLQIAILKINTLYHWLNFPAGITYIDLSYNRLSALYNEETVDFNNLEVLSIGGNQLRDFDIQRKLPKLFSLDISYNLLQEVPKCLSSEILPNLEELRLDGNPMESIYFKNIIALKYLYMNDLIKLTVVDDKAFSNVIGRRGDDDANSEKSCFSLYLSHNPSLSNIQDGAFDGTNVCMLDISHNNLSVLSRSVMSPPPTEGVDLQYNPWRCSCEMQWIVDDLLPVLYRDSPRLLDELRCGSPRAHEGLRLVHWYNWTGRALCDQRALGGYEIESSTEPSKVTNLTLILGGCVIVALLIAIALFVYLVKSRRRHRIRQAALNRKRQSSSDAKNTNGLHNEFAALNKT-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: