MonarchBase - Protein-coding gene

DPOGS200631
Transcript	DPOGS200631-TA	3276 bp
Protein	DPOGS200631-PA	1091 aa
Genomic position	DPSCF300076 + 312653-325839
RNAseq coverage	506x (Rank: top 25%)

Annotation
*Heliconius*	HMEL003294	0.0	46.74%
*Bombyx*	BGIBMGA011311-TA	1e-164	69.55%
*Drosophila*	Haspin-PA	9e-62	36.57%
EBI UniRef50	UniRef50_UPI0000D57283	2e-98	41.25%	UPI0000D57283 related cluster n=1 Tax=unknown RepID=UPI0000D57283
NCBI RefSeq	XP_971131.1	4e-99	41.25%	PREDICTED: similar to Haspin CG40080-PA [Tribolium castaneum]
NCBI nr blastp	gi\|91091654	7e-98	41.25%	PREDICTED: similar to Haspin CG40080-PA [Tribolium castaneum]
NCBI nr blastx	gi\|91091654	4e-92	37.27%	PREDICTED: similar to Haspin CG40080-PA [Tribolium castaneum]

Group
KEGG pathway
Orthology group	MCL15965		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS200631-TA
ATGTCTCATACTATAACATTTATTAGTGATATCAATGGTAGTATGAGGTGGTTAGACCACTGTATAGTGACACAGGAAGCGTGGAATACTATTTTAAATGTTAGAATTGATAGTGATGTGCACGGGTCTGACCACCTCCCGCTTCTGTTCAAGATGAGACGAACATATAGATCTAAAAAGGAAACCGCGGGTGCCATAGATCCCAGAGATGTCTTGTTTACGATCGACGCAAAAAGTTCTGTTTTCGATGCCTTTTATATTCAAAATATCAAACAAACTAAAAGAGATATGTCTGTCGGAAGTACAATGCAGTTTGCTGCTTCAAATAAAGTACGTAAAAGGAAATACGTTAAACGACTCAAGGAACAAGAAACATTGTGTCGGACAAGGGAATCAACTTCGAGCTCAGCGTTTTTAACCCCGGATAAGTCTTTCCGAGTCAATAAACCACCAGATTTATTCGATCAGTTACTTAATTCTTCTAATAACTCACCAGAACCTGTACCGTTATATAATAAACCAATATTCACACCGTTTCATGATAAATATAGGGGTGCATCCATATATAGATTTTCACCTATATCAATAAACTTAGATGACAGCCCTAAAGAAAAAACTGCCATCAAGAATAATGAAGAGCAAAATGATTTTTCATACAAAGAGGAAAATGTAGACAATATTGAACAAGATATAGAGGCTGTAGAAATTGAAAATCCAGAATCTCGCAGTTGTCAAGATAGTATCAATGAAAGAGATGATTCTAAAACAAATAAATTAAATGAATCCCAATATAAAAGTATATGTCCGACGGATAATCATTCACCAATATTGTCCAACCCGACCATAACTAAGAGAAATCGAATAAAAACTATAAAAAATTCATTAAGTTTCCAAACAACCGAAATGGAATCATTCCACGGTTTCGGTGACAGCGACATACATTGTAATGATTTAGATGCTATCCGTGAAAAATATAAGGAAATAGAAAATATATTAACGGAAGATAATTCTCATAACGAAACATCTGAAACATTACAAGAAGATGAAAACAGTCATGCAAATGGTTCCACAAATTCAGATTCCGATGCAAGTTTTATTTCCGGATCGGAATCCAATTATGATACTTGCAATAGTGAAGACGATTCCGATGAGTTCAAACGACTCGGTCAACCTGTAGTTGTTGTCGAAAGACTGAACGATTCCATATTTAACAAATATTATGAATTAATGCCGAAATCCGAAAGCCTTAATTCAGATTATAGTACAGATTTTAACGATAGTTACAATAATTCTAACATTACAGGCTCTTTAAGTGTATCTGACAATTGTGATGATATAGATTTAGTTGAAAATGTACCTGATATGACTAGCATTAATTTATCAGATTGTTCGAATACATGTAACGATAATAAGATGGACGAAGAGGTTTGTGTTAGTTTTGTGACAACCAGAAGAAGGATCCTACCAAATGATTCAATTATTTTAGATGTAGATAGTTCTGTTGCTGATTCAAGTGGCAGTGATGCTGATAAGACTGTACTTAGAAAGAGTGTAGATGATAGTAGTAATTTACAATTAAAATCTGAACATGCAGAGAATATATTAGATAATAATAAAGAAATAGAACGAGATGGTGCCATTAGTTTAAAATCAGAATTACATACTGAAGATGTTGATCAATTAAAAACGTTGCCGGAACCTCCAAGAATGGTTACCAGGAAAAGTGCTCGGATGATTCTTAAAACAGATACAACCTCCATTAACTGCGCAAGAAATATTGAGAGAAATTCGAGGATTGATGGAAATATAAAGGATATGAGCGAGACTGAGACAAACATACTAAACATGTCCAAAGAAAAACCGTCCATAGTCCTACAGCCGGGCAAGAGGTGGGAGCGGTCATTAAGCATATACAGGAGAATGACAACAATGGAAAACTTCGACAAAACGATCTTAGACGAAGAACAGTTGCAGAATAAAGGCAGGAAATACAGGCAGAGCGTCATAGCCACCATGGAATTGCAGGAAAAGGGTTCACTACACAATGATTCGATTAAAAGTCGCAGGAGTACGTTCGTTTCAAAACCAAGCCGGTCAACCATTAAAATTGTAAGAGAATCTGATCTTTCCCGGGATAGTTTGTGTTCGACCATAGTATGCGAAGATTTACAAGGATTTTTGGGCGAAGACTGTGATGATACGATTGTTGAGTTATCAAAACTGTCGATTGCCGATTCGGAACACGAGGTCACTCTCATAGAGAAGTTTCATGATACTTCTAACCGTATAGCGACCGCTCGCGATTACGTCCTGCGACGGTGCAACCAGACAGATGTGTTACTCTTCGACGAATGCTATCCCGATCCGCTTTTGAAGAACTGCCGCAAAATCGGTGAAGGTGTTTATGGGGAAGTGTTTCTGTGGCGAGCTCGTGACGGAAGGGCTCGTGTCTTAAAGGTTATACCAATCGCTGGGGACATCAAAGTCAATGGGGAAGAACAGAAGGGCTTCCATGAAATTCTCTCGGAGATTGTGATTGCTATGGAATTGAGCGCACTACGCGCTCCAATAGCAGACATAACGAATCATTTAAATGAGGGCAAGAGCTTGGAAACATTGGATTTACATACTGTAGAAAATGCTACGGATGTTTTTAATGAGGTGTTATCAGTACGCTGCGTGACTGGGGGCTATCCGTCCAGACTTCTGGACCTCTGGGACCTGTATGACGAGAGCAAGGGCTCGGAGAACGACAACCCAGCTGTTCTGCCGCCCGACCAGCAGTTCATTGTGCTGGAACTGGCCAACGCTGGACAGGATTTGGAAAGCTATCAGTTTGTGAACGCCGAACAGTCGTATGCACTGTTCAAACAGAGTTCGTGTTTCGTGGTTCGCGGTCGCGCCTTCAACCTGCCGAGCTGTGGAGTGAAGGCTTCCATCATCGACTACTCGTTGTCCCGGGCCTCGGTGAGCCGTGGAGTTCTGTACTCTGATCTGGCCCAAGACGAAGCCCTGTTCGAAGCCCTGGGGGACTATCAGTTCACGGTGTATAGACTCATGAGGGATAAGCTTGGTAATGATTGGAAGAATTTCGAACCATACACTAATATACTGTGGCTGCATTACACTTTGGATAAGATGATAACGGCCCTCCGTTACACAAGGACCAACACTAAAATACACAAGCACTACATAGCGAAGCTGAAGGAGGTGAAGAACAGGATCCTGGACTACGGCAGCGCCGTTCAGTTTGTGCTCACAGACAACGAAATATAA

Protein sequence:

>DPOGS200631-PA
MSHTITFISDINGSMRWLDHCIVTQEAWNTILNVRIDSDVHGSDHLPLLFKMRRTYRSKKETAGAIDPRDVLFTIDAKSSVFDAFYIQNIKQTKRDMSVGSTMQFAASNKVRKRKYVKRLKEQETLCRTRESTSSSAFLTPDKSFRVNKPPDLFDQLLNSSNNSPEPVPLYNKPIFTPFHDKYRGASIYRFSPISINLDDSPKEKTAIKNNEEQNDFSYKEENVDNIEQDIEAVEIENPESRSCQDSINERDDSKTNKLNESQYKSICPTDNHSPILSNPTITKRNRIKTIKNSLSFQTTEMESFHGFGDSDIHCNDLDAIREKYKEIENILTEDNSHNETSETLQEDENSHANGSTNSDSDASFISGSESNYDTCNSEDDSDEFKRLGQPVVVVERLNDSIFNKYYELMPKSESLNSDYSTDFNDSYNNSNITGSLSVSDNCDDIDLVENVPDMTSINLSDCSNTCNDNKMDEEVCVSFVTTRRRILPNDSIILDVDSSVADSSGSDADKTVLRKSVDDSSNLQLKSEHAENILDNNKEIERDGAISLKSELHTEDVDQLKTLPEPPRMVTRKSARMILKTDTTSINCARNIERNSRIDGNIKDMSETETNILNMSKEKPSIVLQPGKRWERSLSIYRRMTTMENFDKTILDEEQLQNKGRKYRQSVIATMELQEKGSLHNDSIKSRRSTFVSKPSRSTIKIVRESDLSRDSLCSTIVCEDLQGFLGEDCDDTIVELSKLSIADSEHEVTLIEKFHDTSNRIATARDYVLRRCNQTDVLLFDECYPDPLLKNCRKIGEGVYGEVFLWRARDGRARVLKVIPIAGDIKVNGEEQKGFHEILSEIVIAMELSALRAPIADITNHLNEGKSLETLDLHTVENATDVFNEVLSVRCVTGGYPSRLLDLWDLYDESKGSENDNPAVLPPDQQFIVLELANAGQDLESYQFVNAEQSYALFKQSSCFVVRGRAFNLPSCGVKASIIDYSLSRASVSRGVLYSDLAQDEALFEALGDYQFTVYRLMRDKLGNDWKNFEPYTNILWLHYTLDKMITALRYTRTNTKIHKHYIAKLKEVKNRILDYGSAVQFVLTDNEI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: