MonarchBase - Protein-coding gene

DPOGS210103
Transcript	DPOGS210103-TA	1269 bp
Protein	DPOGS210103-PA	422 aa
Genomic position	DPSCF300017 + 853929-862509
RNAseq coverage	502x (Rank: top 25%)

Annotation
*Heliconius*	HMEL013357	0.0	80.19%
*Bombyx*	BGIBMGA012681-TA	6e-99	84.26%
*Drosophila*	CG10585-PA	1e-133	61.19%
EBI UniRef50	UniRef50_Q9VP87	2e-131	61.19%	CG10585 n=28 Tax=Endopterygota RepID=Q9VP87_DROME
NCBI RefSeq	XP_970126.1	1e-146	71.20%	PREDICTED: similar to candidate tumor suppressor protein [Tribolium castaneum]
NCBI nr blastp	gi\|91084147	2e-145	71.20%	PREDICTED: similar to candidate tumor suppressor protein [Tribolium castaneum]
NCBI nr blastx	gi\|91084147	8e-141	71.20%	PREDICTED: similar to candidate tumor suppressor protein [Tribolium castaneum]

Group
Gene Ontology	GO:0008299	1.2e-05	isoprenoid biosynthetic process
KEGG pathway	tca:658669	3e-146
	K12505 (PDSS2)	maps->	Terpenoid backbone biosynthesis
InterPro domain	[38-420] IPR017446	2.8e-150	Polyprenyl synthetase-related
	[272-417] IPR008949	5e-32	Terpenoid synthase
Orthology group	MCL11473		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS210103-TA
ATGAGTTTAAGTCGTTTGGGAGGTGCTCTGAAGTTTGATTCGGTGAAAGTTAGTCAGTGTAGTGCATTAGTTGCAAAACTTTGGGGACCTTGTATTCGGGAAGTGAACACGAGCAGTTCAAATCGGGCTGTTGCACAACACAACAGTAAACCAGATTGGAATAGGGCCGTTAGCGAGGCTGAGAAGATCGTTGGCTATCCGACCTCCTTCCTTAGCCTGCGATGGGTGCTCAGTGATGAAATTGCGAATGTCGCTTTGCACTTACGAAAACTTGTTGGAAGTAATCATCCGTTGCTCAAAACCGCAAAGAATCTCATATACAATGGTAAGAATAACATGCAGGCGTGGGGGCTGATAGTGCTGCTAGTTTCCAAGGCTGCGGGACACAGTCCGGAAATACCAGATATGGAACAGGACAAAGCAGCGGGAGTATTGCACAGCCAGCGCGCCCTGGCGGAGGTGACTGAGATGATCCGCACGTCTCACTTGGTACACAAAGGTCTGGTCAATATGAACACAAGGCTCGGCCCTGGAGAGCCCGACGACATGATGTTTGGAAACAAAATCGCATTACTCAGCGGGGACTACCTCCTGGCCAACTCCTGTACTGAACTGGCTAATTTGAGGAACCAGGAATTGGTAGAGCTTATGTCGTCAGCAGTGCGAGATTTGGCTGAGGCCGAATTCCTCGGGGAGAGAGACGAACAGAACAACCCGCTACCATCACGACCACTGCCTCACCACCAGAGAGAAGAGGCTTCAGAATGGGACTGCGTACTCTCCCCGCTGCCAATGGCGGGTGTGTCAGGGTGTATGGGCAGGGAGTGGAGCGCCCGCCACGTGTTGGCGGCCGGCGCACTCCTCGGGAAGAGCTGCTCGGCCGCTCTCAAGCTGGCCGGTCACGGTCAGGGGCTACAGACACAGGGTTATCTTTTCGGTTGCCACTTGGCGCTAGCGTGGCAGGCCTTCCTAGACCTGGAGGCGTTCTCTGGTCCGGAGCCCGCTTGCTTCTCGCTAGTGGGAGCTCCCCTCGCCTTCACCCTCGAAGAACGTCCCGAGCTCTACCGGTACATAGAGGCTGGTAGGCGGAGTGTTCACGACGTGGACTACCACGCGCTGTACCAGGCCGTGCTGGAGGGGACCGGTATCGAGCAGACGAAACATCTCCAGAATGAACACGTGACTCGCGCCAGGGAGGTGCTGGACTCCTTCCCCAACTGTGACGCACGGACGGCCCTCACTAACATCATAGTGGCCATGTTACCATAA

Protein sequence:

>DPOGS210103-PA
MSLSRLGGALKFDSVKVSQCSALVAKLWGPCIREVNTSSSNRAVAQHNSKPDWNRAVSEAEKIVGYPTSFLSLRWVLSDEIANVALHLRKLVGSNHPLLKTAKNLIYNGKNNMQAWGLIVLLVSKAAGHSPEIPDMEQDKAAGVLHSQRALAEVTEMIRTSHLVHKGLVNMNTRLGPGEPDDMMFGNKIALLSGDYLLANSCTELANLRNQELVELMSSAVRDLAEAEFLGERDEQNNPLPSRPLPHHQREEASEWDCVLSPLPMAGVSGCMGREWSARHVLAAGALLGKSCSAALKLAGHGQGLQTQGYLFGCHLALAWQAFLDLEAFSGPEPACFSLVGAPLAFTLEERPELYRYIEAGRRSVHDVDYHALYQAVLEGTGIEQTKHLQNEHVTRAREVLDSFPNCDARTALTNIIVAMLP-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: