MonarchBase - Protein-coding gene

DPOGS210010
Transcript	DPOGS210010-TA	1812 bp
Protein	DPOGS210010-PA	603 aa
Genomic position	DPSCF300327 + 10877-15188
RNAseq coverage	106x (Rank: top 60%)

Annotation
*Heliconius*	HMEL010186	6e-115	52.21%
*Bombyx*	BGIBMGA008403-TA	1e-151	53.33%
*Drosophila*	CG33964-PA	9e-52	31.54%
EBI UniRef50	UniRef50_D6WAX8	6e-61	33.20%	Putative uncharacterized protein n=2 Tax=cellular organisms RepID=D6WAX8_TRICA
NCBI RefSeq	XP_001866633.1	1e-66	37.04%	conserved hypothetical protein [Culex quinquefasciatus]
NCBI nr blastp	gi\|170062356	3e-65	37.04%	conserved hypothetical protein [Culex quinquefasciatus]
NCBI nr blastx	gi\|170062356	5e-68	37.04%	conserved hypothetical protein [Culex quinquefasciatus]

Group
KEGG pathway
Orthology group	MCL10503		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS210010-TA
ATGGCTGAAGAAATTGACTTTAACGATGCCCTCGACAGTATAGTGTTAAGTGAAAATTCTTTATGCAAGGAAAGTTACGACGAAGGTTACAAAAGTGGTTATGAGGCTGGAAATCCTGAAGGTTATCATTTAGGCTACCACAGAGGTGCTGAATTGGGCAGAGAATTAGGATACTACTTTGGCGTTGTTACGAACCACATAGAAAACAAAGAATCTTTATTTATCTCCGAGAAAGTTTTGAAACAGTTGGAAAAAGTTCGAGATCTGATAAACTTATTTCCTCAGACAAATTCAGAAGATCATGATCTTCTAAATTTGGCGGAGAACATACGAGCGCAGTATAAGAGAGCTTGTGCCTTATTAAGGATTCCATCCAAAAAATTTAGTATGGAATCGAGTATAGCTAAAGTGAAAGGTGATTTAGATGCCGCCACAACATTCCTCGATCAATACTTACATCTTGCTAATTGTCATATGGTTGAATTCTTCACTGAGAGCCATTGGGACAGATTAGTGCCAAAAAAACTCAGGAATTATCTAGACGTATGTGAATTATCTCAAGCCATTGATAACTTTTGGAAGTATGCTGATGGAAATTGTTGTGATGATAATGAATTGAACAAATGGATCAAGGAATCAAGGAAATATTACACCGCATTAAACACATACTGTATATCAACGGAAAAACTACAAGAAATAATTAAGTCCTGGGGCGGAGAAATAAAACCTCAAGTTCAAATAACTGAGTTTATGACAAGTAAAAAGAGTTATGAAGTAAAAACTATGTCCCACTTAATAGCATCACTGTGTACCGTCTGTGATGTGACCCACTGTGTGGAGGCTGGTGGGGGTAAAGGTAACTTACCTGTGGCGCTCTCACTAAGTTATCACTTACCCAGCCTTACCATTGATTGTAACCCAATCGCTGTAAACAATGGTGAGAAACGGGTTAAGATTATACAGAAACAATGGCACGCCATATCAAAGAAGGTGAAAGATGGCTCAAAACATCTTGCATCAGACAGCATAGAAACCAATCTTCACAGGTTCGCCGCAGCATACATCACTACAGACACGGACTTTACGCGACTCGTCAGAGAGAAGTTCCCGGAATATTCTGGAGATGTCAAATTACTTTTGACAGGTCTTCATACATGTGGTAACCTCGGTCCGGATTCTCTCGTTATCTTCACCACTAACCCGTCTATATCTTCGCTCTTCAACGTGCCTTGCTGTTATCACCTCCTCACTGAGGACGTGGATGTGGAACTGTTCGATGTGTTCCAGAGGTACGGCGAGGGCTGCGGCGGAAGCAAAGGATTTCCAATGTCTGAAGGTTTAAAAGGTTATAATTTAGGAAGAAATGCTCGTATGTTAGCTGCGCAATCAATACACAGAGTTGTTTACAATAAACAGATTCCGGACAAGGGGCTCTTGTACAGGGCTTTGATACAGATTATTATAAAACAACGTTTACCGGATTTACATGTGTCAGAGGGTAAGCTGAAAGGTATATCTTCGAAATGTCAAAACTTCGACGACTATGCCAAGATGGCGGACGCGATACTCAAAATCGGCGTTGACCAAAACTCTGAGATTTACCTTGAAGTACAAAAAGACATAGATGTTAAGTGGAAGAAAATAGTTATGTTTTATTTATTGAGGCTGTGCCTGGCGCAGGTCATAGAGCATGTGATTCTGTTGGACAGATTGTTGTTTTTATTGGAAAATGGTTTCCAAAAATGTTTTCTCGTCAAATTGTTCGATCCCGTCACGTCGCCGAGGTGTCACGGGCTGGTAGCTGTGAGGTAG

Protein sequence:

>DPOGS210010-PA
MAEEIDFNDALDSIVLSENSLCKESYDEGYKSGYEAGNPEGYHLGYHRGAELGRELGYYFGVVTNHIENKESLFISEKVLKQLEKVRDLINLFPQTNSEDHDLLNLAENIRAQYKRACALLRIPSKKFSMESSIAKVKGDLDAATTFLDQYLHLANCHMVEFFTESHWDRLVPKKLRNYLDVCELSQAIDNFWKYADGNCCDDNELNKWIKESRKYYTALNTYCISTEKLQEIIKSWGGEIKPQVQITEFMTSKKSYEVKTMSHLIASLCTVCDVTHCVEAGGGKGNLPVALSLSYHLPSLTIDCNPIAVNNGEKRVKIIQKQWHAISKKVKDGSKHLASDSIETNLHRFAAAYITTDTDFTRLVREKFPEYSGDVKLLLTGLHTCGNLGPDSLVIFTTNPSISSLFNVPCCYHLLTEDVDVELFDVFQRYGEGCGGSKGFPMSEGLKGYNLGRNARMLAAQSIHRVVYNKQIPDKGLLYRALIQIIIKQRLPDLHVSEGKLKGISSKCQNFDDYAKMADAILKIGVDQNSEIYLEVQKDIDVKWKKIVMFYLLRLCLAQVIEHVILLDRLLFLLENGFQKCFLVKLFDPVTSPRCHGLVAVR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: