MonarchBase - Protein-coding gene

DPOGS209136
Transcript	DPOGS209136-TA	2337 bp
Protein	DPOGS209136-PA	778 aa
Genomic position	DPSCF300061 - 763725-768415
RNAseq coverage	198x (Rank: top 47%)

Annotation
*Heliconius*	HMEL014785	0.0	74.27%
*Bombyx*	BGIBMGA001309-TA	2e-144	77.36%
*Drosophila*	alphaTub84B-PA	5e-132	63.01%
EBI UniRef50	UniRef50_P68363	6e-130	63.29%	Tubulin alpha-1B chain n=1161 Tax=root RepID=TBA1B_HUMAN
NCBI RefSeq	XP_974091.1	1e-148	71.76%	PREDICTED: similar to tubulin alpha 6 [Tribolium castaneum]
NCBI nr blastp	gi\|91077924	2e-147	71.76%	PREDICTED: similar to tubulin alpha 6 [Tribolium castaneum]
NCBI nr blastx	gi\|91077924	2e-149	71.76%	PREDICTED: similar to tubulin alpha 6 [Tribolium castaneum]

Group
Gene Ontology	GO:0051258	3.8e-84	protein polymerization
	GO:0043234	3.8e-84	protein complex
	GO:0016627	6.9e-84	oxidoreductase activity, acting on the CH-CH group of donors
	GO:0016020	6.9e-84	membrane
	GO:0055114	6.9e-84	oxidation-reduction process
	GO:0006461	6.9e-84	protein complex assembly
	GO:0006184	1e-46	GTP catabolic process
	GO:0003924	1e-46	GTPase activity
	GO:0005525	1e-46	GTP binding
	GO:0005874	1.8e-46	microtubule
	GO:0007017	1.8e-46	microtubule-based process
	GO:0007018	7.6e-46	microtubule-based movement
	GO:0005198	7.6e-46	structural molecule activity
	GO:0003824	6.4e-10	catalytic activity
KEGG pathway	aga:AgaP_AGAP001744	2e-135
	K02259 (COX15)	maps->	Oxidative phosphorylation
			Two-component system
			Porphyrin and chlorophyll metabolism
InterPro domain	[7-229] IPR003008	3.8e-84	Tubulin/FtsZ, GTPase domain
	[434-763] IPR003780	6.9e-84	Heme A synthase/Protoheme IX farnesyltransferase
	[207-353] IPR008280	1e-46	Tubulin/FtsZ, C-terminal
	[14-33] IPR000217	1.8e-46	Tubulin
	[6-19] IPR002452	7.6e-46	Alpha tubulin
	[231-343] IPR018316	8.6e-41	Tubulin/FtsZ, 2-layer sandwich domain
	[433-481] IPR009003	6.4e-10	Peptidase cysteine/serine, trypsin-like
Orthology group	MCL34791		Lepidoptera specific

Nucleotide sequence:

>DPOGS209136-TA
ATGTTGGTTTTTTCAGATGATAGAAGCTGTGGAACATTTTTTAGCCATACTGGAGCCGGGAAAATGGTCCCTAGGGTCGTTATGGTTGACTTAGAACCTACACCTATAGATGAGATCAGAACAGGAGCGTATAGGCAACTGTTTCATCCAACATCATTAATTACTGGAAAAGAAGATGCAGCTAGTAATTTTGCACGAGGATATTTTGGTGTGGGTAGAGAGATGATAGATATTGCTCTAAATCGTGTAAGAATAGCGGCGGAAGACTGCAGTTGCCTCCAAGGTTTTATTATCTTCCGATCTTTCGGAGGAGGTACAGGATCTGGATTCACTGCACTATTACTAGATAGTCTCACTAAAGATTATGGTAAACTTTCTAAAATTGAATACGCTATATATCCATCACCAAAAATATCGCCGGTAATAGTAGAGCCGTACAACGCAGTACTGACTGCCCACGCTTGTATGAACACCGAGGACGTATGTTTTATTTTCGACAACGAAGCTCTCTATGATATACTAGCAAGGCTTCTGGATGTACCGAGGCCCACATATACAAATTTAAACAGACTTATCGCACAGGTAGTGTCTTGTATGACGGCGTCATTGAGATTTGAAGGGTCGTTGAACGTGGAACTAGTAGAATTTAGAACAAATTTAATACCCTATCCTAGAATTCATTTCCCTTTAGTGACTTTCGCTCCTTTTGTGCCGCCAACAAAAGCACTTCATGAGACCATGACGACCCAACAGCTAATAATGTCATGCTTCGAACCGTCCAATCAGATGGTTAAATGTGATCCCAGGACGGGAAGTTACATGTCTTGTTGTTTACTGTTCAGGGGCGATGTTAATACTAACGATATTAATTTTGCGATTAATCAAATAAAAAGTATGCGTTCTATTAAATTTGTCTCTTGGTCTCCTACTGGTTTTAAGATTGGTGTAAATAATCAACCACCGACAACCGTCCCTGGGGGCGACTTAGCAGCTCTTCAAAGAGCAGTCGCGATGGTGTCTAATTCTTCAGCTGTTCGTACCGCTTGGGAACGATTAATGTTGGGTATGGCGAATTTATGTCGGTACTCTCAACTTGTAAAAGTTGCTCCGACCAAACTGCTAGGATCAAATTCGGGTGTTAGCCGCTTAGTTTCAAGGCAGCTCATTACACCGATAAGAAACAGCAACCACAAGCACACCATATACAAGGGGTTTCAGATACAGAATATAATAAAATCAAATCCAATAATATTAAGATTCTGTTCATCATCACAACCAAAGAGGTCTAAGCTTGTTGGCTACTGGTTACTGGGATGCAGTGGGATGGTGTTTACTGCTGTTGTTTTAGGCGGAGTGACTCGACTCACTGAGTCTGGGTTATCTATGGTCACATGGAAATTGTTAGGAGAGAAGTTACCAAGAACTGATGAGGAGTGGGAGACGGAGTTCAAGAAATATCAGCAGTACCCGGAGTATATATATAAGAATCATTCACTGACACTGTCCGAGTTCAAATGGATCTGGTATATGGAGTATGCTCATAGGACGTGGGGTCGACTCATAGGGGCCTCTGTCTTCATCCCGGCCGCTGTGTTCTGGGCTAAGGGCTGGTTCGACAAGGCTATGAAGATAAGGGTGTCCGCATACTGCGCGCTCGTTGCTGCACAGGGTCTTATGGGTTGGTACATGGTGAAGTCAGGTCTTGAAGACAGATTTCAAGGGCCGTCGGACGTTCCGCGCGTGTCCCAGTACCGCCTGGCCGCTCATCTCAGTCTCGCCTTCATTCTGTACTCGGGGCTACTGGCCGGAGCCCTGCGGGTGCTCCGCCCCTTCCCTAAGGGAGCTCTCGTGAGGATCAAAGAGCTGGCCGCCGTCACCGGACTCGCGCATGCCGTTAAAGCTATGGCGTTCTTCACGGCTGTTTCAGGAGCGTTCGTGGCCGGTCTAGACGCGGGATTGGTCTACAATTCATTCCCGAAGATGGGTGACAACTGGATCCCGGACGACATCCTGTCCTTCGCCCCCACCATCAAGAACTTCACGGAGAACCCCACGACAGTTCAATTCGACCATCGGGTCCTTGGCACCAGCACATTGATAGCGGCCACCACACTGTGGCTGATGGCGAGGGGCAGGCCACTGTCCCCGGTGGCGAGGAGGGTGGTCAATGGAGTGGGAGCCATGGCCTGGCTACAGGTGTGCCTGGGTATCATGACGTTGGTCCACTACGTGCCCACTCCGCTGGGCGCGTCTCACCAGGCCGGTTCCCTCGTCCTACTGTCGCTGGCAATCTGGCTCACTCACGAGATCAAGCTACTCAAGTACATACCAAAGTGA

Protein sequence:

>DPOGS209136-PA
MLVFSDDRSCGTFFSHTGAGKMVPRVVMVDLEPTPIDEIRTGAYRQLFHPTSLITGKEDAASNFARGYFGVGREMIDIALNRVRIAAEDCSCLQGFIIFRSFGGGTGSGFTALLLDSLTKDYGKLSKIEYAIYPSPKISPVIVEPYNAVLTAHACMNTEDVCFIFDNEALYDILARLLDVPRPTYTNLNRLIAQVVSCMTASLRFEGSLNVELVEFRTNLIPYPRIHFPLVTFAPFVPPTKALHETMTTQQLIMSCFEPSNQMVKCDPRTGSYMSCCLLFRGDVNTNDINFAINQIKSMRSIKFVSWSPTGFKIGVNNQPPTTVPGGDLAALQRAVAMVSNSSAVRTAWERLMLGMANLCRYSQLVKVAPTKLLGSNSGVSRLVSRQLITPIRNSNHKHTIYKGFQIQNIIKSNPIILRFCSSSQPKRSKLVGYWLLGCSGMVFTAVVLGGVTRLTESGLSMVTWKLLGEKLPRTDEEWETEFKKYQQYPEYIYKNHSLTLSEFKWIWYMEYAHRTWGRLIGASVFIPAAVFWAKGWFDKAMKIRVSAYCALVAAQGLMGWYMVKSGLEDRFQGPSDVPRVSQYRLAAHLSLAFILYSGLLAGALRVLRPFPKGALVRIKELAAVTGLAHAVKAMAFFTAVSGAFVAGLDAGLVYNSFPKMGDNWIPDDILSFAPTIKNFTENPTTVQFDHRVLGTSTLIAATTLWLMARGRPLSPVARRVVNGVGAMAWLQVCLGIMTLVHYVPTPLGASHQAGSLVLLSLAIWLTHEIKLLKYIPK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: