MonarchBase - Protein-coding gene

DPOGS200868
Transcript	DPOGS200868-TA	2922 bp
Protein	DPOGS200868-PA	973 aa
Genomic position	DPSCF300071 + 485322-499770
RNAseq coverage	829x (Rank: top 16%)

Annotation
*Heliconius*	HMEL012626	86.32%
*Bombyx*	BGIBMGA009857-TA	78.07%
*Drosophila*	Myo61F-PD	57.46%
EBI UniRef50	UniRef50_E3X096	51.83%	Putative uncharacterized protein n=5 Tax=Coelomata RepID=E3X096_ANODA
NCBI RefSeq	XP_002109061.1	44.78%	hypothetical protein TRIADDRAFT_49825 [Trichoplax adhaerens]
NCBI nr blastp	gi\|312377942	51.83%	hypothetical protein AND_10622 [Anopheles darlingi]
NCBI nr blastx	gi\|383852356	61.13%	PREDICTED: myosin-IB-like [Megachile rotundata]

Group
Gene Ontology	GO:0005524	1.4e-281	ATP binding
	GO:0016459	1.4e-281	myosin complex
	GO:0003774	1.4e-281	motor activity
	GO:0005515	1.3e-05	protein binding
KEGG pathway
InterPro domain	[38-635] IPR001609	1.4e-281	Myosin head, motor domain
	[776-958] IPR010926	1.8e-26	Myosin tail 2
Orthology group	MCL10069		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS200868-TA
ATGGGGTACAAAAGTAAAAACGAAGTGGATTGTGCACTGTTGTTTAGGATATTGAAACGTCGCGAACGCTTTCTGCGTCCGGTGTCCGTGCAAGGCGTCATGGAACACTCCCTGCAGCACCGCGAGCGAGTCGGAGTCCAGGACTTCGTGCTGCTAGAGGACTTCCGCTCTGAAGCAGCGTTCATAGACAACCTGAAGAAACGCTTCCACGAGAACATTATATACACGTACATAGGCAACGTGCTGATCTCAGTGAATCCCTACAAGAACCTTCCTATATACACGGAGGAGAAACAGAGGCTGTACTACAAGAAGGCTTTCTTTGAGGCGCCACCACATGTATTTGCTATCGCGGACAACGCCTACAGATCGCTAGTGTACGAACACAGGGAACAATGTATATTGATTTCAGGGGAATCCGGTTCAGGTAAAACCGAGGCGTCCAAGAAAGTTCTCGAATACATCGCAGCTCGCACGAATCACCTGCACAATGTGGAGACCGTTAAAGACAAACTGCTTCAGAGCAATCCGCTCCTGGAAGCGTTTGGGAACGCCAAAACAAACAGAAACGACAACTCCAGTCGCTTCGGGAAGTACATGGACATACAGTTCAACTACGAAGGTGCACCTGAAGGTGGACACATCCTGAACTATCTGCTGGAGAAGTCTAGAGTTGTGAGTCAAATGGCCGGCGAGAGGAACTTCCACATATTCTACCAACTCCTGGCCGGTGGGGACCAGGAGCTGATGAAGCAGTTGAGGCTGCAAGGAAGATCGGAAGTCTACAAATACACTACCGACCTGACGTCAGCAAGTCAGAAAATGAACGACGCTGACCAGTTCCGCGTGGTGAGAGAGGCGATGAAAGTCATCGAGATAGGAGACAGCGAACAGCGCGAGATGTTTGAGATAGTCGCCAGCGTGTTGCATCTCGGCAACGTGAAGTTCGTTCAGAACGATAAAGGCTATGCTGAGATCCTCAACCACGACGCCAACAGCCAGAACGTCGCCGAGTTCTGCATCAACTTCTGCAACGAGAAGCTGCAACAGCTGTTCATCCAGCTGACACTCAAGTCGGAACAGGAGGAGTATCTGAGGGAAGGCATCGAGTGGGAGCCCATCGAGTACTTCAACAACATCGTCATATGTGACCTCATAGAAGAGAGGCATAGAGGCATCATATCGATCCTGGACGACGAGTGTCTCCGCCCCGGGGAGGCCAACGACCTCAGCTTCTTAGAGAAACTCTCCCAGAGACTAGACGGACATAAACACTTCAAGTCACACAAGAAGGTCGACTCCAAGACCCAGAAGCTGATGGGACGAGATGAATTTTGTCTGGTGCACTACGCGGGTGAGGTGACCTACAACGTGAACACCTTCATTGAGAAGAACAACGACCTGCTGTTCAGAGACCTGCAGGGACTCATGGCGGCCAGCGGAAATAACATCGTTGGCCGGTGCTTCAAGGACATGAATCTGATGAGCAAGAAACGTCCGGAGACAGCGGTGACACAGTTCAAGGTGTCCCTCAACGAGCTGATCAAGATCCTCAGCAGCAAGGAACCTTCATACATCCGGTGCATCAAACCCAACGACTTCAAAACACCCATGCACTTCGACGACAAGCTGGTGTCTCACCAGGTGAAGTACCTGGGGCTGATGGAGAACCTCCGCGTGAGACGAGCTGGGTTCGCCTACAGGAGGCAGTACGACGCCTTCCTCGAGAGATACAAGTGCCTAAGCCCTGAGACTTGGCCCAACTACCGCGGCCCAGCGCGAGAGGGGGTCCAGAAGTTAGTGGCGGCGCTCCGATACGAGAAAGAGGAATACAGGATGGGCAACACGAAGATATTCATCCGTTTCCCGAAGACTTTGTTCGAGACCGAGGACGCGTTCCAGATCAAGAAGAACGACATCGCCACCATCATACAGAGCCGCTGGCGAGGGTACAGGCAGCGGAGGAGGTATCTGGAGATGAAGCGGGCGGCGGTCATCATACAGAAGTGGGTGAGGAGGTTCCTCGCCCAGAGACTGAGGGAGAGGAGGAGGCGGGCCGCTGACGTCATCAGGGCCTTCATCAAAGGTTTCATCACCCGCAACGGTCCAGAGACGGTGGAGAACCGACGTTTCCTCGGCATCGCGAAGGTACACTGGCTGAAGCGCCTTGCGACTCAGCTGCCCAAACACCTGCTTGACCTTTCCTGGCCGCCCTGCCCCGCCACGTGTCAGGACGCCTCCAAACAACTCCACAAGCTACACCGACTACATCTAAGCAGGAAGTACCGCCTGGCATTGTCCCCGGAAGATAAGAAGCAATTTGAATTGAAGGTGCTGGCTGAGGCCATGTTCAAGGGTAAGAAGAACAGTTACAACAGCAGCATCCCGGAGCGGTTCGTCGCGGACAGACTGTCTGAAGAACAGCGAGTATTGAGAGACACGTTCATGGCCTCGCCCGCCTGGCCGGCGCAAGAGAAACTCATTTACTCGTGCGAGGCGGTGAAGTACGACCGGCGCGGGTACAAGCCCCGGCCGCGGTCGCTGGTGGCGTCGGACGCGGCGCTGTACGTGCTGGACGCGGGCTCGCGGAAGATGTTCAAGGTGAAGCACCGCCTGCCGCTCGACAAGCTGCGAGTCGTCCTCACCAACGAGAGCGATGGACTGCTGCTGGTAAAAATACCGCAGGACCTCAAGAAGGATAAGGGCGACCTCATAATGTCCGTGACGCACTTGATCGAAGCCCTCACCATCGTCACCGACTACACCAAAAAACCGGAAATCATCGAGATAGTTGACACCAGGACCATCGCTCACAACCTGGTGAACGGTAAGCAGGGTGGTACCATCGAGGTGACGCAAGGCACGCAGCCCGCCATCCACCGCGCCAAGAGCGGCAACCTGCTAGTTGTGGCATCCCCATAG

Protein sequence:

>DPOGS200868-PA
MGYKSKNEVDCALLFRILKRRERFLRPVSVQGVMEHSLQHRERVGVQDFVLLEDFRSEAAFIDNLKKRFHENIIYTYIGNVLISVNPYKNLPIYTEEKQRLYYKKAFFEAPPHVFAIADNAYRSLVYEHREQCILISGESGSGKTEASKKVLEYIAARTNHLHNVETVKDKLLQSNPLLEAFGNAKTNRNDNSSRFGKYMDIQFNYEGAPEGGHILNYLLEKSRVVSQMAGERNFHIFYQLLAGGDQELMKQLRLQGRSEVYKYTTDLTSASQKMNDADQFRVVREAMKVIEIGDSEQREMFEIVASVLHLGNVKFVQNDKGYAEILNHDANSQNVAEFCINFCNEKLQQLFIQLTLKSEQEEYLREGIEWEPIEYFNNIVICDLIEERHRGIISILDDECLRPGEANDLSFLEKLSQRLDGHKHFKSHKKVDSKTQKLMGRDEFCLVHYAGEVTYNVNTFIEKNNDLLFRDLQGLMAASGNNIVGRCFKDMNLMSKKRPETAVTQFKVSLNELIKILSSKEPSYIRCIKPNDFKTPMHFDDKLVSHQVKYLGLMENLRVRRAGFAYRRQYDAFLERYKCLSPETWPNYRGPAREGVQKLVAALRYEKEEYRMGNTKIFIRFPKTLFETEDAFQIKKNDIATIIQSRWRGYRQRRRYLEMKRAAVIIQKWVRRFLAQRLRERRRRAADVIRAFIKGFITRNGPETVENRRFLGIAKVHWLKRLATQLPKHLLDLSWPPCPATCQDASKQLHKLHRLHLSRKYRLALSPEDKKQFELKVLAEAMFKGKKNSYNSSIPERFVADRLSEEQRVLRDTFMASPAWPAQEKLIYSCEAVKYDRRGYKPRPRSLVASDAALYVLDAGSRKMFKVKHRLPLDKLRVVLTNESDGLLLVKIPQDLKKDKGDLIMSVTHLIEALTIVTDYTKKPEIIEIVDTRTIAHNLVNGKQGGTIEVTQGTQPAIHRAKSGNLLVVASP-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: