MonarchBase - Protein-coding gene

DPOGS201190
Transcript	DPOGS201190-TA	3549 bp
Protein	DPOGS201190-PA	1182 aa
Genomic position	DPSCF300262 + 94359-104849
RNAseq coverage	763x (Rank: top 17%)

Annotation
*Heliconius*	HMEL018017	0.0	77.90%
*Bombyx*	BGIBMGA009857-TA	1e-133	46.31%
*Drosophila*	Myo31DF-PB	0.0	50.90%
EBI UniRef50	UniRef50_Q23978	0.0	50.90%	Myosin-IA n=42 Tax=Eumetazoa RepID=MY31D_DROME
NCBI RefSeq	XP_002425047.1	0.0	55.84%	myosin IA, putative [Pediculus humanus corporis]
NCBI nr blastp	gi\|242008511	0.0	55.84%	myosin IA, putative [Pediculus humanus corporis]
NCBI nr blastx	gi\|242008511	0.0	55.84%	myosin IA, putative [Pediculus humanus corporis]

Group
Gene Ontology	GO:0005524	3.8e-289	ATP binding
	GO:0016459	3.8e-289	myosin complex
	GO:0003774	3.8e-289	motor activity
KEGG pathway
InterPro domain	[18-870] IPR001609	3.8e-289	Myosin head, motor domain
	[969-1138] IPR010926	2.2e-25	Myosin tail 2
Orthology group	MCL10069		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS201190-TA
ATGTATTTAGCCTCAACGCCGGCTGATCTTGAACTGAGAACCGGCCTCGGAGGAGTGCGGCCGGTGACGTACCAACACAACAAGATCTACACGTATATAGGCGAAGTGCTGGTCTCTGTGAACCCTTACAAGTCTCTGGACATCTATGGCCAGCAGCACATGGCCCAGTACAGGGGCCGGGAGATGTTCGAGGTCCCTCCTCATGTGTATGCCGTAGCCGACGCCTGTCAGAGAGTGCTCAGGCAACAGGGGAGGGATACCTGTGTGCTGATATCAGGTGAGTCCGGTTCGGGGAAGACGGAGGCCTCCAAGTTCATCATGAAGTACATAGCGGCCAACACCATGCAGGTGCACAGGGAGTATATCGACAGAGTGAAAAACGTCTTGATACAATCGAATTCTATCTTAGAGACATTCGGTAACGCGAAGACGAACAGAAACGACAACTCCTCAAGGTTCGGTAAATACATGGACATACACTTCGACTACAAAGGGGATCCCATCGGCGGACACATCAGCAACTACCTGCTAGAGAAGAGCAGGGTCGTCAGTCTGCAGCCCGGGGAGAGGAACTTCCACGCCTTCTATCAGCTCTTAAGCACAAACAACCCGCAGACGAAAAAGTATGGATTGAACTCGAGTTCCGTGTACAAGATTTTGGGCAACGAGCGCGCGACGGCACAGGACTCTAAACTCTACAACGTGACCAAGAGCGCCTTTAATGCTCTGGGCTTCCCGCCGGCAGTCGTCGACGATATATGGAGCATCGTGGCCGGAGTCATCTTATTGGGTGAGTTGACATTCAGCGAGGGCGCGTCGGGCGAGGTGGTGGTGGGCGGGCCGGTGTCGTCGTGCGTCTCCGCCCTGGGAGTTTCACAGGAGTCTCTAAGGTCCGCGATGGTGGGCAGAGTGCTAGCGGCGGGCGGGGACTTGGTCAGCAAGGAACACACCCTCACTGACGCCCACTACACCCGGCTGGCGCTGGCCAAGGCCGCCTACGACAGACTGTTCAGTTGGATCGTACAACAGATCAACGCGGCGATAGAGGCGCCCTCAGCCTCGTACCGCTCCAGTGTGATCGGCGTCCTCGACATCTACGGCTTCGAGATCTTCGACACCAACAGCTTCGAACAGTTCTGCATCAACTACTGTAACGAGAAACTACAACAGCTCTTCATAGAGCTGGTGTTGAAGCAAGAGCAGGAGGAGTACTCCCGCGAGGGCATCACGTGGACGCCGGTCCCCTACTTCAACAACAGAGACATCTGTGCGCTAGTGGACGCGCCGCACGCCGGGATCATCGCCATCATGGACGAGGCCTGTCTCAACCCCACCAAGATATCCGACGGTCAGCTGTTGGAGGCGATGGACAAGCGCCTGAACTCGCACAAGCACTACACCTCGCGCCAGTTGTCTCCGCTCGACAAGAAACTCAAACACGCCGTCGACTTCCAGATCACCCACTACGCGGGTCAAGTGACCTACAACATCACCGGCTTCATGGAAAAGAACAAGGACTCGCTGTGGCAGGACCTCAAGAGACTTCTGCACCGCTCCAGCAACGCCTCCCTCGCTAAAATGTGGCCCGAGGGAGCCGTCGACATACAACAGATCAACGCGGCGATAGAGGCGCCCTCAGCCTCGTACCGCTCCAGTGTGATCGGCGTCCTCGACATCTACGGCTTCGAGATCTTCGACACCAACAGCTTCGAACAGTTCTGCATCAACTACTGTAACGAGAAACTACAACAGCTCTTCATAGAGCTGGTGTTGAAGCAAGAACAGGAGGAGTACTCCCGCGAGGGCATCACGTGGACGCCGGTCCCCTACTTCAACAACAGAGACATCTGTGCTCTAGTGGACGCGCCGCACGCCGGGATAATCGCCATCATGGACGAGGCCTGTCTCAACCCCACCAAGATATCCGACGGTCAGCTGTTGGAGGCGATGGACAAGCGCCTGAACTCGCACAAGCACTACACCTCGCGCCAGTTGTCTCCGCTCGACAAGAAACTCAAACACGCCGTCGACTTCCAGATCACCCACTACGCGGGTCAAGTGACCTACAACATCACCGGCTTCATGGAAAAGAACAAGGACTCGCTGTGGCAGGACCTCAAGAGACTTCTGCACCGCTCCAGCAACGCCTCCCTCGCTAAAATGTGGCCCGAGGGAGCCGTCGACATACAACAGACGTCCAAGCGGCCTCCGTCCGCGGCCAGCCTGTTCCGCTCGTCGATGGCGGCGTTGGTGAGCGGCCTGTCCAGCAAGGAGCCGTTCTACGTCCGCTGTGTGAAGCCCAACCCCGCGCAGGCGGCCCACCTTTGGGACGAACAGCTGGTCCGTCACCAGGTGTCGTACCTGGGCCTGGTGGAGAACGTGCGCGTGCGGCGCGCGGGGTTCGCCTCCCGCCAGCGGTACGACCGCTTCCTCAAGCGGTACAAGATGCTCTCTCAATACACGTGGCCCAACTTCCGAGGCTCCAGCAACAAGGACGCCGTCATGGTGCTGCTCAGGGACCTGCACATCACCGACGTGCAGTTCGGACACACCAAGCTCTTCATACGGAGTGCTCGTACCCTGCACGAGCTGGAGCGCGCCCGGTCCGAGCTGATCCCCTCCATCGTGGTGCTGCTCCAGAAGCTGTGGAGAGGAACCCTCGCCAGGCAGCGCTACAGGCGGATGAAGGCGGCCCTCGTCATATACAACGGATGGAAACGGTACCGCTTCAGGCGTTACATATCCGAGCTGCAGGCCATCCTCTCCCGGCACCGTAACGTGATCCCGTCGTGGCCGGCGGCACCCCGGGGGGTGGCGGTTCCCTTGCTTCAGGCGGCCTACCGTCGCTGGCGCGCCTACCTCACCCTCAAGCCCATCCCGAGGGACCAGTGGCCTCAACTCAAACTCAAGATATCCGCGGCCAGCGTGCTCAAAGGCAGGAGGGCCCAGTGGGGGGCCTCGAGGGAGTGGCGGGGGGACTACCTGGCTATTAATTCGTACAACGATAAATCATCGTCGTACCTGTCGTGCGTGTCTAGTCTGCAGCGCTCGCAGTCTTTGGGCAAGCCCCTGTTCTCGTGCCGCGTGTTCAAGTTCAACCGCTACAACAAGATGTCGGAGCGCTGCTTGCTGGTGACCGACACGTCCCTGTACAAGCTGGACGCGAGCTCCTTCAAGCCGCTAAAGAAGCCCACGCCCATCACGGAGGTTGGCGGCGTGCGTGTCATGAGCGGGGAGGCCCAGCTGGTCGTGGTGGTGGTCCCGGGCGCCAGGAACGACCTGGTGGTGGGGCTGGTGGCGCCCCCACACACCGACCTGCTGGGGGAACTGTTGGGAGTGCTCGCACATACGTACCACAGGCTGACCGGCTCCGAGCTACCCGTGGAGGTGGAGAGCGGCGCCAGCACGAGGTGTATCCTGGGAGGGAAGACGAGGGCCTTGCAGCTACCGCCGGCGACCACCAGCCCCGCCTCCCCCACCGCCACTCCCGCGCCCTTCACACACGCACACAACGTCATCACATACCACCCGGCGTCGGCGAGGGCGTAA

Protein sequence:

>DPOGS201190-PA
MYLASTPADLELRTGLGGVRPVTYQHNKIYTYIGEVLVSVNPYKSLDIYGQQHMAQYRGREMFEVPPHVYAVADACQRVLRQQGRDTCVLISGESGSGKTEASKFIMKYIAANTMQVHREYIDRVKNVLIQSNSILETFGNAKTNRNDNSSRFGKYMDIHFDYKGDPIGGHISNYLLEKSRVVSLQPGERNFHAFYQLLSTNNPQTKKYGLNSSSVYKILGNERATAQDSKLYNVTKSAFNALGFPPAVVDDIWSIVAGVILLGELTFSEGASGEVVVGGPVSSCVSALGVSQESLRSAMVGRVLAAGGDLVSKEHTLTDAHYTRLALAKAAYDRLFSWIVQQINAAIEAPSASYRSSVIGVLDIYGFEIFDTNSFEQFCINYCNEKLQQLFIELVLKQEQEEYSREGITWTPVPYFNNRDICALVDAPHAGIIAIMDEACLNPTKISDGQLLEAMDKRLNSHKHYTSRQLSPLDKKLKHAVDFQITHYAGQVTYNITGFMEKNKDSLWQDLKRLLHRSSNASLAKMWPEGAVDIQQINAAIEAPSASYRSSVIGVLDIYGFEIFDTNSFEQFCINYCNEKLQQLFIELVLKQEQEEYSREGITWTPVPYFNNRDICALVDAPHAGIIAIMDEACLNPTKISDGQLLEAMDKRLNSHKHYTSRQLSPLDKKLKHAVDFQITHYAGQVTYNITGFMEKNKDSLWQDLKRLLHRSSNASLAKMWPEGAVDIQQTSKRPPSAASLFRSSMAALVSGLSSKEPFYVRCVKPNPAQAAHLWDEQLVRHQVSYLGLVENVRVRRAGFASRQRYDRFLKRYKMLSQYTWPNFRGSSNKDAVMVLLRDLHITDVQFGHTKLFIRSARTLHELERARSELIPSIVVLLQKLWRGTLARQRYRRMKAALVIYNGWKRYRFRRYISELQAILSRHRNVIPSWPAAPRGVAVPLLQAAYRRWRAYLTLKPIPRDQWPQLKLKISAASVLKGRRAQWGASREWRGDYLAINSYNDKSSSYLSCVSSLQRSQSLGKPLFSCRVFKFNRYNKMSERCLLVTDTSLYKLDASSFKPLKKPTPITEVGGVRVMSGEAQLVVVVVPGARNDLVVGLVAPPHTDLLGELLGVLAHTYHRLTGSELPVEVESGASTRCILGGKTRALQLPPATTSPASPTATPAPFTHAHNVITYHPASARA-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: