MonarchBase - Protein-coding gene

DPOGS200456
Transcript	DPOGS200456-TA	3492 bp
Protein	DPOGS200456-PA	1163 aa
Genomic position	DPSCF300260 - 124917-137467
RNAseq coverage	19x (Rank: top 80%)

Annotation
*Heliconius*	HMEL013069	0.0	66.15%
*Bombyx*	BGIBMGA011187-TA	0.0	61.33%
*Drosophila*	CG9304-PA	6e-14	23.81%
EBI UniRef50	UniRef50_D6WUH9	1e-134	62.46%	Putative uncharacterized protein n=1 Tax=Tribolium castaneum RepID=D6WUH9_TRICA
NCBI RefSeq	XP_971871.1	2e-135	62.46%	PREDICTED: similar to AGAP012225-PA [Tribolium castaneum]
NCBI nr blastp	gi\|91087935	4e-134	62.46%	PREDICTED: similar to AGAP012225-PA [Tribolium castaneum]
NCBI nr blastx	gi\|91087935	4e-136	62.46%	PREDICTED: similar to AGAP012225-PA [Tribolium castaneum]

Group
KEGG pathway
InterPro domain	[279-534] IPR019336	2.3e-64	Rhodopsin-like GPCR transmembrane domain
Orthology group	MCL16557		Patchy

Nucleotide sequence:

>DPOGS200456-TA
ATGCCCGGAGTGGACGCCAAGTGGGTCGAGGGCTGGGTCAATACCAAGGAGAACTGGGCGTTTCTGGCTCGTTTCTGTTTCCTGTCGCTGGAGGGGCAGTTCGAGTACCTCATAGAGTATGACAGAGATCTGGGAACACCGAACCTACTGCTGTATTATGACGAGGAGTCTCAGTGGCCCGCAGTCTATCATAGCAGTAAGACATGCAGAGAACGTGAGGCGGTGCTGAACAAGGGAGGACAGAACCAGATTGTGAAGCTATCTCACTGGTATCCAGACACAGAGTACTCTGGATGCATTCTGACACAGTCAAACAAAGAGTTGCCAGCTTCGAAAAGCACAACAGCAACAGTCCCAACGACAACAACAAAAAAGACAAATTCAACTAGGAATGACCTGGGCTTCCTGGGCGACATGATGCTTCAGTTTTTAAAAACTACCACACCAAAACCAAAAACTACCATAATAGATGCAAATTCTACCATCTGGTACGAATTGCTACCAGAGAACATAACGACAACAGTGTTGCCAGAGGACGAGTGGGAAAACATCGGTCCGCAAGAAAACGACACTCAAACGGAAAAACTAAAAGACGTGGAGTTGTTATTCGACAATACGAACAGCAGTGCGCTGAAAATCAAACGTTCGACGTTTGAACTTTACGAGAGGTTCCGCAAAAGGAGGTTGTATTCTGAATCGAATCAAAATGGAGAAAGTGGGTCCAATACTGACACTGTCAAATTTATAGTCACTTGTCGTAACTCGAGGAGGTTCCGGTCAGCGAGAGAGAGGTGGTGGTTCATCGCCATAAGTAACTGCGGCAGTCCTAAGGGCTTGGACGTTAGATATAAATTTTTGATGACGAATGGCCCGAGTGGAGATTTTTGGCATGAACATTTCTCAGCTGACGAATTCTATGTGCTACCAATACTCCTGGCATACACTTTCGCCTACGTCATAGTCATGGTGGCGGTAGTGATGTGCAGCGTGGAACTCAAGACGCGCCACTTGTTGCACTCGACCTACAAACTATTCCTGATATCGATAGTGTCGCAACACTTCGGTGTTATCTTGCAGAGTCTCGCCGGGATCAGATACGCCTATAACGGTATTGGTAACCCCGCTGCTAGAGTTCTGGGTCAGATTCTCTGCGGTGTCTCGGAGACGAGTTACCTCCTGCTCCTGATTCTCTTGGCCAAAGGTTACACTATAACCCGCGGGCGGCTGAAGGTCGCCTTCACCGTCAAACTGACAGTTTTCATGTGTTGCTACGTCATCACTTATATTGTCCTGTTCGTGTATCAGGCTAAGGCGTTCGATCCTGGTGAGGTGTTATATATATACGAGAGCCCGGCCGGCTACGGTCTCATCGTGTTGAGACTCAGCTCGTGGTTCGCTTTCGCGTACTCAACGTTTTTCACCGTCAGGAAATTTCCAGAGAAGAATTTATTCTACTGTCCGTTCTTCATCTGTGGGACTTTGTGGTTTTTCGCGGGACCTCTTTTCATCTTGACCGCCAACTCTTATATAGACAAATGGGTCCGCGAGAGCGTGGTGACAGCCGTGTTGCTACTCATCACGTTTTGCGGACACACGATGTTTTTGCTGTTAACACTACCGGTTTTCGCAAATAAAAATTTTCCCTACCACGTGAGGACCACTCAGATAGGTGTGATGGAGGTCAACGGCAACAATTTGGATAGGTTTGGACCGACGCCCTACCACCCCAGCGGCGGCACGGCGCAGACTGTTATAATACCTCTCACAAGACGCACAGAAGAACTCATCGGTAATATGTACAACCAGTACATGGCAAGCGCTCCGTCTTTGTCAATGGAAACACAACAACCAAAACCGAACGCGCCAAAAAGTTTAGGCTCAATAAGGTCCGGAAGTCTCGTCACGCAGAACAGTTCAGAGACGAATAGATCTGACGACATACAGCCATCGATTAAAGAAATATATACAGTCGAGGGGGAAATCAACAAAATGGACACCGAAACTGAGGCAGTGTTGCCAGATGAAAAGCTACCGAATGAAATGGTAGAAAATACAGAATTACCGCCCATTGTTAGGTCAAGGAGAAATATTTTGGAGCCCATAAAAAGAGATGTCCCCGATTGGTCGTTAGCTAAGGGAGCGTGTGTGGTCGCTATGCAGTTAAAGAAACTAAAGACTGCAGAAGACGAAGAAGTTTCCGAACTTCCACCGCTACAAATAAACGGCAAGAAAGTTTTAAGGAACGGGCAAACAAGTCTAGCGGAAATGGGGACCATACATGAAGGTCAGATTCTCTGCGGTGTCTCGGAGACGAGTTACCTCCTGCTCCTGATTCTCTTGGCCAAAGGCTACACTATAACCCGCGGGCGGCTGAAGGTCGCCTTCACTGTCAAACTGACAGTTTTCATGTGTTGCTACGTCATCACTTATATTGTCCTGTTCGTGTATCAGGCTAAGGCGTTCGATCCTGGTGAGGTGTTATATATATACGAGAGCCCGGCCGGCTACGGTCTCATCGTGTTGAGACTCAGCTCGTGGTTCGCTTTCGCGTACTCAACGTTTTTCACCGTCAGGAAATTTCCAGAGAAGAATTTGTTCTACTGTCCGTTCTTCATCTGTGGGACTTTGTGGTTTTTCGCGGGACCTCTTTTCATTTTGACCGCCAATTCTTATATAGACAAATGGGTCCGCGAGAGCGTGGTGACAGCAGTGTTGCTACTCATCACGTTTTGCGGACACACGATGTTTCTGCTGTTAACACTACCGGTTTTCGCAAATAAAAATTTTCCCTACCACGTGAGGACCACTCAGATAGGTGTGATGGAGGTCAACGGCAACAATTTGGATAGGTTTGGACCGACGCCCTACCACCCCAGCGGCGGCACGGCGCAGACTGTTATAATACCTCTCACAAGACGCACAGAAGAACTCATCGGTAATATGTACAACCAGTACATGGCAAGCGCTCCGTCTTTGTCAATGGAAACACAACAACCAAAACCGAACGCGCCAAAAAGTTTAGGCTCAATAAGGTCCGGAAGTCTCGTCACGCAGAACAGTTCAGAGACGAATAGATCTGACGACATACAGCCATCGATTAAAGAAATATATACAGTCGAGGGGGAAATCAACAAAATGGACACCGAAACTGAGGCAGTGTTGCCAGATGAAAAGCTACCGAATGAAATGGTAGAAAATACAGAATTACCGCCCATTGTTAGGTCAAGGAGAAATATTTTGGAGCCCATAAAAAGAGATGTCCCCGATTGGTCGCTAGCTAAGGGAGCGTGTGTGGTCGCTATGCAGTTAAAGAAACTAAAGACTGCAGAAGACGAAGAAGTTTCCGAACTTCCACCGCTACAAATAAACGGCAAGAAAGTTTTAAGGAACGGGCAAACAAGTCTAGCGGAAATGGGGACCATACATGAAGGTAGGGAGCAGACATACATACGCTCGCCCGCGGATATATTCACAGTTACAACTAGGAGTTAA

Protein sequence:

>DPOGS200456-PA
MPGVDAKWVEGWVNTKENWAFLARFCFLSLEGQFEYLIEYDRDLGTPNLLLYYDEESQWPAVYHSSKTCREREAVLNKGGQNQIVKLSHWYPDTEYSGCILTQSNKELPASKSTTATVPTTTTKKTNSTRNDLGFLGDMMLQFLKTTTPKPKTTIIDANSTIWYELLPENITTTVLPEDEWENIGPQENDTQTEKLKDVELLFDNTNSSALKIKRSTFELYERFRKRRLYSESNQNGESGSNTDTVKFIVTCRNSRRFRSARERWWFIAISNCGSPKGLDVRYKFLMTNGPSGDFWHEHFSADEFYVLPILLAYTFAYVIVMVAVVMCSVELKTRHLLHSTYKLFLISIVSQHFGVILQSLAGIRYAYNGIGNPAARVLGQILCGVSETSYLLLLILLAKGYTITRGRLKVAFTVKLTVFMCCYVITYIVLFVYQAKAFDPGEVLYIYESPAGYGLIVLRLSSWFAFAYSTFFTVRKFPEKNLFYCPFFICGTLWFFAGPLFILTANSYIDKWVRESVVTAVLLLITFCGHTMFLLLTLPVFANKNFPYHVRTTQIGVMEVNGNNLDRFGPTPYHPSGGTAQTVIIPLTRRTEELIGNMYNQYMASAPSLSMETQQPKPNAPKSLGSIRSGSLVTQNSSETNRSDDIQPSIKEIYTVEGEINKMDTETEAVLPDEKLPNEMVENTELPPIVRSRRNILEPIKRDVPDWSLAKGACVVAMQLKKLKTAEDEEVSELPPLQINGKKVLRNGQTSLAEMGTIHEGQILCGVSETSYLLLLILLAKGYTITRGRLKVAFTVKLTVFMCCYVITYIVLFVYQAKAFDPGEVLYIYESPAGYGLIVLRLSSWFAFAYSTFFTVRKFPEKNLFYCPFFICGTLWFFAGPLFILTANSYIDKWVRESVVTAVLLLITFCGHTMFLLLTLPVFANKNFPYHVRTTQIGVMEVNGNNLDRFGPTPYHPSGGTAQTVIIPLTRRTEELIGNMYNQYMASAPSLSMETQQPKPNAPKSLGSIRSGSLVTQNSSETNRSDDIQPSIKEIYTVEGEINKMDTETEAVLPDEKLPNEMVENTELPPIVRSRRNILEPIKRDVPDWSLAKGACVVAMQLKKLKTAEDEEVSELPPLQINGKKVLRNGQTSLAEMGTIHEGREQTYIRSPADIFTVTTRS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: