MonarchBase - Protein-coding gene

DPOGS215782
Transcript	DPOGS215782-TA	3570 bp
Protein	DPOGS215782-PA	1189 aa
Genomic position	DPSCF300041 + 1861495-1865633
RNAseq coverage	185x (Rank: top 49%)

Annotation
*Heliconius*	HMEL002619	0.0	65.88%
*Bombyx*	BGIBMGA005056-TA	2e-49	36.67%
*Drosophila*	armi-PA	0.0	32.43%
EBI UniRef50	UniRef50_D6WE13	0.0	36.66%	Putative uncharacterized protein n=1 Tax=Tribolium castaneum RepID=D6WE13_TRICA
NCBI RefSeq	XP_001605981.1	0.0	34.78%	PREDICTED: similar to conserved hypothetical protein [Nasonia vitripennis]
NCBI nr blastp	gi\|91092442	0.0	36.66%	PREDICTED: similar to armitage CG11513-PA [Tribolium castaneum]
NCBI nr blastx	gi\|198476076	0.0	33.68%	GA25304 [Drosophila pseudoobscura pseudoobscura]

Group
KEGG pathway
Orthology group	MCL11796		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS215782-TA
ATGTCGTCTTCTAGCAACATATCTCAATCTACATACTCTACATCTGAACCAGAGACTCCCAATAGTACCTCTAAGAGCCAAAGTCAAAATTTTGATCAATCCTTGAACAATGAAGACAGTATTGATCAACCGTTAAAAAATCCCCAAAAAGAATTACACCAAAAGAGAATACAATCTTTAAGAAAAGAACTTGAATATCTGAAAGCAACAGAATGGAAATTTGAATGTGATAAGGGTTTTCAAGATGAAGAGTCTGATGAAGATAAAGAGATGTTTTTAGCTGAAGAACTTTTACAATTAGAGTTTGAAGCCGAAAATGAAGCATCCATGATTAATCACTCGTACCCTGTTGAACCTCCTAAGCTTGCCGCCGGTGCAGTTTGTTTTCAAAAAACTGGTATTATAACAGATTGTGGTGATGACTATGTCCTCATTGATGGAATGTTATATTTTGCAACACAGAACTCACTGAGTTATAATGTCAATGACAAAGTTCTATATCTTGGTTACAAGGATTCAAATGATTCAATAAATGTTGTAAGAATATTGGAAAACCAAGGCTTATTTTGGGGTGACGAGGATGAAGAAGATGTTGAAAACTTCAATACTATTGAGCACATCTTAATAGGTCAAGTAGATTATAGAGAAGAACGGATGGTTTACATTGTGGACAGTGACTTGAAATTCAACTTAGACAATGTTGCCGGAACATTTGTTCCAATTAAAGGTGATTGGTTGGAAATGAAATGTACAGTACAACAAAATGAAAAGAGACCTGTGGATATCAACACAAAACAAGTGTTACAGGTGAAATCCTTTAATGCTATAAGAACCAAAACGAAGACGGCCATAGTTACTCAGTGGTCTGGAAGTGAAGGGGTTTGTGATAGACAAATATATATCAATAATAGTGCATTGGTCAATGGATCACAAATAAATATTGGCACGAAGGTCATGGTAGAAGCAATTGAAAGCAATCAAGGATTGTGCACATGGAGGGCACTGAAATTAATGACTCTCGAAATTGGGTCCGAGAAGAATGTGGCAGAGGAATCAAACGAAGGTCAAATTAGTCTGGCCCTAGAAAAAGAAAAAAAAATTCATATGACATACCCATTAAAGTTTGAGAATGTTAAATTTGATCAAACAGAGAGTATAATATTAAATATAACAAATAAGAGCAACAATATGTACATACTAAATAAGTGGATAGTGCTGAGTAAGAAACGAGATTCACAAGTCTGTATAACGCCATTCATCAATCAACCAATAAAATTATCACCAGAAGAAAATATCAGCTTCACTATAACATGCTCTCCAAAGTTCATGGGATATGCACAGGAGTGCCTCGTTATATTGTTTCGAGGTTTCCAACTGAAGAGACATATCAATATACATGTGTGCAGTGATCACCGACAAGTTAATTTTGATTTAAATGGTGATTGCCATATAATGGAATCAGATAAAGCTGATATGATGAGAAAAATTAGACGCAATACTAATTCATATGTACCAGGTGTGAAACCAATCAAATCACCAGCTTTCGTATCCGTGAAAATTGGTAATTTTCCTATCCCAGACAAAATCTGGGCTGTTGTCTTGGGCGATTCCAAGCAGACCATCTGTAGCAATGATTTCAATAGGGTATTATCCTTCATTGAAAGACAGCTACCTTATTTATCTCAAGATTTGAATATTACAAATTATATTGATAAATGGCACGCCCTTTTGTACATGGAAGAAATACAAGCTAACCTCAATATGCGTGTTTACGACAGGTCAAAGGTATTCTTGGTACATTGTGACGAATATCTTGGCATTGAAATACCAGGGTTGTCAGAAAAGAGACCGTCGCTCATCAAAGGAGACAGGGTCATTGTGAAAGATATTTGGAACGAATCCAATCCGGAATACGAAGGCTATATACATGCAATAAACGGTGATATGGTACTGATGAAATTCAACAGCAGATTTCATGAATATTACAGCGGCAGTGATGTTTCGATTGAGTTCCACTTTAGTAGGGCTGTGTATAGACGATCGCACCATTGCATCAACCAAGCCCTATCAAATTTAGGGCCGGACATCCTATTTCCGTCTCGTGTTATAACTAAAGAATCTCAAGTGTCCAATGACGTTTTGGAAGATATGAAATGGTTTAACCCAACTTTAAATAAGGATCAGAGAAATGCAGTGATTAATATATTGAAAGGCGAATGCCGACCGATGCCTTATATCATCTTCGGACCCCCTGGTACTGGGAAGACTGTAACTGTCATAGAAACTATTTTGCAAATTTTAACCTTAATACCAGACAGTAGGATTTTAGTTGCGACACCGTCAAACAGTGCGTCAAATTTGATAACTGAAAGACTTATAAAATACAAGGACTCGTTCTCAGGATCAGTCGTAAGATTAATCGCTAACTATCTAGTTGATTCTGACACCATACCAGAGGATGTGAAGCCATTTTGTGCCACATTGGATATAGCCAAAGAGAATACAACAAAATCGAAACATTACGTCAAGGATAACATACAACTTAATTGTCAGAAATCTTTAATAGTCAGGCATCGTGTCACTATAGGGACGTGCTATTGTTTAGGATCTTTAAAACATTTAGACATACCTCGAGGTCACTACACTCATATCATTGTGGACGAAGCTGGTCAGGCTACAGAGCCGGAGATAATGTTACCTTTGACCTTCACCAATAAGGAACATGGACAAATTATACTCGCAGGGGATCCTATGCAATTAGGACCTGTCGTTATGTCAAAATATTGTAAGGAGTTTGGACTGGACGTATCGTTCCTGTGCAGACTTCTAGAGTGCTTCCCATACTTGAAGGATTATGAATCTTACGCTTGCGGTTTCGATAAACGTCTCGTCACCAAATTGAATGATAACTATAGGTCGCTGAAGGAAGTTTTAACATTACCGAGTGAAATGTTTTACGATGGGACATTAGTGCCAAATGTAGACAAAAGTATGCCCTGGACAGAGAAATTCATTGATGCGACTTGTCAGATTTTCGGTTCGGATGATAGGAACGGCGGGATATTCGTATATGGTATTAAAGGAACCAACATGCGAGCACAGGACAGCCCGTCCTGGTACAATCCACAAGAAGCGGCGATGGTCGCATTGACGACCTGTAAACTGTTTAAGAAGAACATCACCGAAGAGGAAATTGGCATAATCACACCATATATAGCACAGACAAAATATCTACGTTTGCTTTTCGATTCCATGGGCTTGAATCAACCAAAAATTGGCACTGTTGAAGACTTTCAAGGTCAAGAACGACCGGTAATTTTAATTTCAACCGTTAGATCCAGCGAGTCGCACCTGGAGGAAGATGCCAAACATTATTTAGGTTTTGTTAAAAGCCCGAAAAGACTAAATGTAGCTCTGACCCGGGCACAAGTGTCAGTTATATTATTTTGCAATCCACATCTATTGTCCAAAGACCATTTGTGGAGAAAAGTTATAAGTTACGCCGTCTCTAGTGATAAGTATATGGGCTGTGATTTGCCAACCAGCCTCTTAAACAATTTATCTTTATGA

Protein sequence:

>DPOGS215782-PA
MSSSSNISQSTYSTSEPETPNSTSKSQSQNFDQSLNNEDSIDQPLKNPQKELHQKRIQSLRKELEYLKATEWKFECDKGFQDEESDEDKEMFLAEELLQLEFEAENEASMINHSYPVEPPKLAAGAVCFQKTGIITDCGDDYVLIDGMLYFATQNSLSYNVNDKVLYLGYKDSNDSINVVRILENQGLFWGDEDEEDVENFNTIEHILIGQVDYREERMVYIVDSDLKFNLDNVAGTFVPIKGDWLEMKCTVQQNEKRPVDINTKQVLQVKSFNAIRTKTKTAIVTQWSGSEGVCDRQIYINNSALVNGSQINIGTKVMVEAIESNQGLCTWRALKLMTLEIGSEKNVAEESNEGQISLALEKEKKIHMTYPLKFENVKFDQTESIILNITNKSNNMYILNKWIVLSKKRDSQVCITPFINQPIKLSPEENISFTITCSPKFMGYAQECLVILFRGFQLKRHINIHVCSDHRQVNFDLNGDCHIMESDKADMMRKIRRNTNSYVPGVKPIKSPAFVSVKIGNFPIPDKIWAVVLGDSKQTICSNDFNRVLSFIERQLPYLSQDLNITNYIDKWHALLYMEEIQANLNMRVYDRSKVFLVHCDEYLGIEIPGLSEKRPSLIKGDRVIVKDIWNESNPEYEGYIHAINGDMVLMKFNSRFHEYYSGSDVSIEFHFSRAVYRRSHHCINQALSNLGPDILFPSRVITKESQVSNDVLEDMKWFNPTLNKDQRNAVINILKGECRPMPYIIFGPPGTGKTVTVIETILQILTLIPDSRILVATPSNSASNLITERLIKYKDSFSGSVVRLIANYLVDSDTIPEDVKPFCATLDIAKENTTKSKHYVKDNIQLNCQKSLIVRHRVTIGTCYCLGSLKHLDIPRGHYTHIIVDEAGQATEPEIMLPLTFTNKEHGQIILAGDPMQLGPVVMSKYCKEFGLDVSFLCRLLECFPYLKDYESYACGFDKRLVTKLNDNYRSLKEVLTLPSEMFYDGTLVPNVDKSMPWTEKFIDATCQIFGSDDRNGGIFVYGIKGTNMRAQDSPSWYNPQEAAMVALTTCKLFKKNITEEEIGIITPYIAQTKYLRLLFDSMGLNQPKIGTVEDFQGQERPVILISTVRSSESHLEEDAKHYLGFVKSPKRLNVALTRAQVSVILFCNPHLLSKDHLWRKVISYAVSSDKYMGCDLPTSLLNNLSL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: