MonarchBase - Protein-coding gene

DPOGS202402
Transcript	DPOGS202402-TA	1353 bp
Protein	DPOGS202402-PA	450 aa
Genomic position	DPSCF300233 - 186343-187774
RNAseq coverage	1487x (Rank: top 9%)

Annotation
*Heliconius*	HMEL007417	89.53%
*Bombyx*	BGIBMGA004603-TA	86.48%
*Drosophila*	betaTub85D-PA	85.08%
EBI UniRef50	UniRef50_Q13509	82.74%	Tubulin beta-3 chain n=160 Tax=Eukaryota RepID=TBB3_HUMAN
NCBI RefSeq	XP_967267.1	83.86%	PREDICTED: similar to beta1-tubulin [Tribolium castaneum]
NCBI nr blastp	gi\|2443344	86.48%	beta-tubulin [Halocynthia roretzi]
NCBI nr blastx	gi\|327263983	85.94%	PREDICTED: tubulin beta-4 chain-like [Anolis carolinensis]

Group
Gene Ontology	GO:0005874	0	microtubule
	GO:0007017	0	microtubule-based process
	GO:0051258	2.8e-134	protein polymerization
	GO:0043234	2.8e-134	protein complex
	GO:0007018	6.1e-108	microtubule-based movement
	GO:0005198	6.1e-108	structural molecule activity
	GO:0006184	8.5e-79	GTP catabolic process
	GO:0003924	8.5e-79	GTPase activity
	GO:0005525	7.3e-49	GTP binding
KEGG pathway	tca:655614	0.0
	K07375 (TUBB)	maps->	Pathogenic Escherichia coli infection
			Gap junction
			Phagosome
InterPro domain	[1-441] IPR000217	0	Tubulin
	[1-266] IPR003008	2.8e-134	Tubulin/FtsZ, GTPase domain
	[41-58] IPR002453	6.1e-108	Beta tubulin
	[244-430] IPR008280	8.5e-79	Tubulin/FtsZ, C-terminal
	[246-383] IPR018316	7.3e-49	Tubulin/FtsZ, 2-layer sandwich domain
	[374-428] IPR023123	1.5e-26	Tubulin, C-terminal
Orthology group	MCL10017		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS202402-TA
ATGAGGGAGATCGTCCACATCCAGGTCGGGCGGTGCGGAAATCAAATAGGATCGAAGTTCTGGGAGGTGATATCGGATGAACATGGCATAGATCCAAGTGGTTGCTACGCCGGAGATTCTGATCTACAACTCGAACGCATCAACGTGTATTACAACGAAGCGGCAGCCGGTAAATACGTGCCGCGAGCTGTTCTTGTTGATCTCGAACCCGGGACGATGGATTCGTTACGCGCTGGGCCATACGGTCAAATATTTCGTCCCGATAACATAGTTTTTGGTGTATCGGGAGCTGGTAATAATTGGGCTAAAGGACATTATACAGAAGGAGCGGACTTGCTCGAGTCGGTCTTGGATGTTATTAGGAAGGAAGCTGAAGGTTGTGACTGTCTTCAAGGTTTCGAACTGATTCACTCGTTGGGAGGCGGTACTGGCTCAGGTTTAGGAACCTTGTTGCTGAATAATTTAAGGGAAGAGTATGCAGATAGAATTATTTTAACGTTTTCCGTCGTCCCGAGCCCTAAAGTTTCTGATACCGTCGTAGAGCCGTATAATGCCACGTTATCATTAAACCAGCTCATAGAAAATTCCGATCAATCATTTTGTATAGACAACGAAGCTTTGTACGATATTTGTTTCCGAACGTTGCGACTGCAAACACCCACATACGGTGACTTGAACCATTTGGTGTCGGCGACGATGTCTGGTGTCACGACGTGCCTGCGGTTTCCCGGACAATTAAATGCGGACCTTCGAAAGCTTGCAGTCAATATGGTGCCGTTCCCGAGGCTACACTTCTTCATGCCGGGATTCGCTCCGCTCACAGCCAGGGGCAGTCAGCAGTACAGAGCATTGACCGTACCTGAGCTCACTCTCCAGATGTTCGACGCCAAGAACATGATGGCAGCATGCGATCCACGTCACGGACGATATCTCACCGTGGCGGCTGTGTTCCGCGGTCGGATGTCAATGAAAGAAGTCGACGAGCAAATGCTTAATATACAGAACAAAAATAAAGACTACTTTGTGAAATGGATACCCAATAACGTTAAGACCGCCGTGTGTGACATCCCACCCCGTGGATTGAAAATGTCTGCAACTTTTATTGGCAATACGACCGCCATACAAGAGATTCTCAAAAGAGTGTCTGAACAATTCGCCTCCATGTTTCGAAGGAAAGCATTCATACACTGGTACACCGGCGAGGGTATGGACGAAACTGACTTCACCGAGGCAGACAATAACCTCAGCGATCTTATATCAGAATATCAACAGTACCAAGATGCGACAACAGAAGAACAAGAATTCGAGGAAGAGGAGGACGAAGCTGCACCAAATGAAGAGAGTGACCAATAA

Protein sequence:

>DPOGS202402-PA
MREIVHIQVGRCGNQIGSKFWEVISDEHGIDPSGCYAGDSDLQLERINVYYNEAAAGKYVPRAVLVDLEPGTMDSLRAGPYGQIFRPDNIVFGVSGAGNNWAKGHYTEGADLLESVLDVIRKEAEGCDCLQGFELIHSLGGGTGSGLGTLLLNNLREEYADRIILTFSVVPSPKVSDTVVEPYNATLSLNQLIENSDQSFCIDNEALYDICFRTLRLQTPTYGDLNHLVSATMSGVTTCLRFPGQLNADLRKLAVNMVPFPRLHFFMPGFAPLTARGSQQYRALTVPELTLQMFDAKNMMAACDPRHGRYLTVAAVFRGRMSMKEVDEQMLNIQNKNKDYFVKWIPNNVKTAVCDIPPRGLKMSATFIGNTTAIQEILKRVSEQFASMFRRKAFIHWYTGEGMDETDFTEADNNLSDLISEYQQYQDATTEEQEFEEEEDEAAPNEESDQ-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: