MonarchBase - Protein-coding gene

DPOGS210312
Transcript	DPOGS210312-TA	1275 bp
Protein	DPOGS210312-PA	424 aa
Genomic position	DPSCF300025 - 991143-994743
RNAseq coverage	90x (Rank: top 63%)

Annotation
*Heliconius*	HMEL021738	4e-176	70.18%
*Bombyx*	BGIBMGA011878-TA	0.0	73.30%
*Drosophila*	CG3706-PA	1e-58	32.86%
EBI UniRef50	UniRef50_E9H641	4e-101	43.99%	Putative uncharacterized protein n=1 Tax=Daphnia pulex RepID=E9H641_DAPPU
NCBI RefSeq	XP_002731927.1	1e-67	33.58%	PREDICTED: hypothetical protein [Saccoglossus kowalevskii]
NCBI nr blastp	gi\|321461712	2e-100	43.99%	hypothetical protein DAPPUDRAFT_308079 [Daphnia pulex]
NCBI nr blastx	gi\|321461712	2e-98	44.20%	hypothetical protein DAPPUDRAFT_308079 [Daphnia pulex]

Group
KEGG pathway	bfo:BRAFLDRAFT_121021	2e-15
	K01007 (E2.7.9.2, ppsA)	maps->	Reductive carboxylate cycle (CO2 fixation)
			Pyruvate metabolism
Orthology group	MCL17578		Insect specific

Nucleotide sequence:

>DPOGS210312-TA
ATGACACCTTTATTCATCACAGCTGTTATATTTATAGTATTTATTGTGATTTATCTAAAGAGAAAAGATCCCGAACCGATATTCGGCGTGTATACTGTAGCAGGAAAGTGGTACTATTTGAAATATGTCGCCTTTTCCTGTATTTATTATTATAGACGGTACTCGAATAAGAGCAAAGCGGTCGGTGCTGATGGTGGAGCGGGTCAAGGTGTGAAGGCTATCTCAGACCCGAAAGAAATGGACAAGGCTCAGCCCCTGAGTGACCACGCTAAGGCTTTCGATGCGGTATTTTTCATATCCGCAAAGAAGGACGAACATGACAAGGGAATATACGTAATCGCTGGTTGTGAGAGACGACCTTTGGGAATGTGCAATGGACTTTTCTACATTGGGTTGCCAGGAAAAGGACTTTTGTGCAGTAAAAAGATTCCGGACACGGTCCTTTTCGGTGCACAAATCGGTGAATTTGGAGCTGAAGGGGTTCTTATTACCCCCGCGGAACCGATGAAGAAATGGACCGTCTCTTATAAAGGACCTATGTGGTATCAAAATGAGCCCAGCAAAATAGTAGAAGTAGAATTCAATGGTGAATGGACAGCGACGAGCAACTACTTTGATTACGACACCGATTTACACCCTCCAGCTGTAATCCGATCAATTGCTAGAGAAAAGTGGAGTCGAAAATACTTTAATAACCTGAAAACAGCTCACCAATCTCACTATGAACAGTTCGGCGTAATGAAGTGTAAATTTACTATTGAAAAGGAATCCTTTGAATTCACCTTACCCTCCTTCAGGGATCACAGCTTTGGTCAAAAGCGGGACTGGACGCTTATGCACAGATACGCCTTCCATCATATTTTCTTACATGACGGCACCAACATCAGCGTTGGAGTCATCTGTCAGCCTTCCACCGCGACACGCATGGAGGTCGGCTACGTTAGTCTTCCGAGCGGTGAGACTTTGCCTGTCGAGTGGGTGGAGATGCAGTTGTACCAACACGGGGAGGGCGGCGCCGCGCCTAAAGACTACGCGTTCAGGATAAAGGCTGGAGATGTTGTTTACATTGTTCAGGTGTTGGTGGAATACGAGTCTATACACTTTGTGTCTCAAGATTGGGACGCCCGAATGGTGGAGCGCTTCTGCAAGTTTGTGGTGAACGGCGTCCCGGGGCGAGGGGTGTCTGAGTTCCATTACAGACACCACGGAGGACGGCCAGATGAGGTCGCGCAGAATGACCCCGAGTGGTACAGGAAGATGTGCCATAAGATATAG

Protein sequence:

>DPOGS210312-PA
MTPLFITAVIFIVFIVIYLKRKDPEPIFGVYTVAGKWYYLKYVAFSCIYYYRRYSNKSKAVGADGGAGQGVKAISDPKEMDKAQPLSDHAKAFDAVFFISAKKDEHDKGIYVIAGCERRPLGMCNGLFYIGLPGKGLLCSKKIPDTVLFGAQIGEFGAEGVLITPAEPMKKWTVSYKGPMWYQNEPSKIVEVEFNGEWTATSNYFDYDTDLHPPAVIRSIAREKWSRKYFNNLKTAHQSHYEQFGVMKCKFTIEKESFEFTLPSFRDHSFGQKRDWTLMHRYAFHHIFLHDGTNISVGVICQPSTATRMEVGYVSLPSGETLPVEWVEMQLYQHGEGGAAPKDYAFRIKAGDVVYIVQVLVEYESIHFVSQDWDARMVERFCKFVVNGVPGRGVSEFHYRHHGGRPDEVAQNDPEWYRKMCHKI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: