MonarchBase - Protein-coding gene

DPOGS209862
Transcript	DPOGS209862-TA	1377 bp
Protein	DPOGS209862-PA	458 aa
Genomic position	DPSCF300510 - 13536-22003
RNAseq coverage	618x (Rank: top 21%)

Annotation
*Heliconius*	HMEL022608	93.95%
*Bombyx*	BGIBMGA001683-TA	91.67%
*Drosophila*	betaTub60D-PA	81.42%
EBI UniRef50	UniRef50_Q13509	82.47%	Tubulin beta-3 chain n=160 Tax=Eukaryota RepID=TBB3_HUMAN
NCBI RefSeq	XP_967267.1	84.38%	PREDICTED: similar to beta1-tubulin [Tribolium castaneum]
NCBI nr blastp	gi\|91086093	84.38%	PREDICTED: similar to beta1-tubulin [Tribolium castaneum]
NCBI nr blastx	gi\|313225611	85.62%	unnamed protein product [Oikopleura dioica]

Group
Gene Ontology	GO:0051258	6.5e-138	protein polymerization
	GO:0043234	6.5e-138	protein complex
	GO:0007018	1.1e-108	microtubule-based movement
	GO:0005874	1.1e-108	microtubule
	GO:0005198	1.1e-108	structural molecule activity
	GO:0005525	1.1e-108	GTP binding
	GO:0007017	2.4e-101	microtubule-based process
	GO:0006184	1.4e-80	GTP catabolic process
	GO:0003924	1.4e-80	GTPase activity
KEGG pathway	tca:655614	0.0
	K07375 (TUBB)	maps->	Pathogenic Escherichia coli infection
			Gap junction
			Phagosome
InterPro domain	[1-443] IPR000217	0	Tubulin
	[1-266] IPR003008	6.5e-138	Tubulin/FtsZ, GTPase domain
	[41-58] IPR002453	1.1e-108	Beta tubulin
	[244-430] IPR008280	1.4e-80	Tubulin/FtsZ, C-terminal
	[261-382] IPR018316	1e-47	Tubulin/FtsZ, 2-layer sandwich domain
	[374-429] IPR023123	1.9e-30	Tubulin, C-terminal
Orthology group	MCL10017		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS209862-TA
ATGCGTGAAATAGTACATGTGCAAGCGGGCCAGTGCGGTAATCAGATTGGTTCAAAGTTCTGGGAGGTGATATCGGACGAACATGGCATAGATCCGAATGGTTACTACAAGGGAGTGAGCGACCTGCAAGCCGAACGCCTCAACGTGTACTATAATGAAGCCGCTGAAGGTAAATTTGTTCCTCGGGCTGTTCTCGTGGATCTGGAGCCAGGGACCATGGACTCAGTGCGTTCAGGTCCCTATGGGCAACTGTTCCGACCTGATAACTTCGTATTCGGACAGAGCGGCGCTGGTAACAACTGGGCCAAGGGTCACTACACAGAGGGCGCTGAGCTCGTTGATGCTGTGTTGGATGTTATCCGGAAGGAGGCTGAAGGTTGCGACTGTCTGCAAGGTTTCCAAATGACGCATTCTCTTGGCGGAGGCACTGGTTCAGGCATGGGGACACTGTTGTTGAGCAAGATCAGAGAGGAGTACCCTGATCGTATTATGAATACCTTCAGTGTTGTGCCTTCACCCAAGGTCAGCGAAGTTGTCCTGGAGCCGTATAATGCGACTCTGTCGGTGCACCAACTGGTCGAGAACACGGATATGTCCTATTGCATCGACAACGAAGCCCTTTATAACATTTGCTTCAGAACGTTGCGATTGAGCAGCCCAAGTTACGGCGATCTGAATCATTTGATATCAATGACAATGTCCGGTGTCACGACTTGCCTCCGTTTCCCTGGACAATTGAATGCTGATCTCAGGAAGCTGGCCGTCAACATGGTGCCCTTCCCGAGACTGCACTTTTTTATGCCCGGCTTCGCTCCTCTGACAGCAAGAAACTCGTTCAACTACCGCCCTCAGACCGTTCCGGAGCTTATGAGCCAAATGTTCAACCCTGGGAACATGATGACGGCTTGCGACCCCCGTCACGGCCGCTACCTCACAGTGGCCACCGTGTTCAGAGGTCACATGTCCATGAGAGAGGTCGACGACCAAGTGTTGGCGGTCCAGAACAAGAACTCGAGCTACTTCGTGGAATGGATCCCCAACAACCTGAAGGTGGCCGTCTGCGACGTCCCGCCGCGCGGCCTCAAGATGTCCGCCACGTTCATCGGCAACTCCACCGCCATCCAGGAGATATTCAAACGCATTTCAGAACAGTTCACCGCCATGTTCAGGAGAAGAGCGTTCCTCCACTGGTACACGGGCGAGGGTATGGACGAGATGGAGTTCACGGAGGCGGCCAGCAACATGGCCGACCTCATATCAGAGTACCAACAGTACCAGGAGGCTAACGTGGATGATGAAGAGGTAGGCTTCGACGAGGAAGAGGAAGAAGACGATCAAAATTACGACCACAAGGAGTCGGTGCACGTCCCGCTATAG

Protein sequence:

>DPOGS209862-PA
MREIVHVQAGQCGNQIGSKFWEVISDEHGIDPNGYYKGVSDLQAERLNVYYNEAAEGKFVPRAVLVDLEPGTMDSVRSGPYGQLFRPDNFVFGQSGAGNNWAKGHYTEGAELVDAVLDVIRKEAEGCDCLQGFQMTHSLGGGTGSGMGTLLLSKIREEYPDRIMNTFSVVPSPKVSEVVLEPYNATLSVHQLVENTDMSYCIDNEALYNICFRTLRLSSPSYGDLNHLISMTMSGVTTCLRFPGQLNADLRKLAVNMVPFPRLHFFMPGFAPLTARNSFNYRPQTVPELMSQMFNPGNMMTACDPRHGRYLTVATVFRGHMSMREVDDQVLAVQNKNSSYFVEWIPNNLKVAVCDVPPRGLKMSATFIGNSTAIQEIFKRISEQFTAMFRRRAFLHWYTGEGMDEMEFTEAASNMADLISEYQQYQEANVDDEEVGFDEEEEEDDQNYDHKESVHVPL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: