MonarchBase - Protein-coding gene

DPOGS202254
Transcript	DPOGS202254-TA	3975 bp
Protein	DPOGS202254-PA	1324 aa
Genomic position	DPSCF300032 - 576401-590984
RNAseq coverage	297x (Rank: top 38%)

Annotation
*Heliconius*	HMEL005099	0.0	79.74%
*Bombyx*	BGIBMGA004906-TA	0.0	71.70%
*Drosophila*	CG8129-PB	7e-126	58.69%
EBI UniRef50	UniRef50_Q21080	2e-125	57.01%	Protein K01C8.1 n=5 Tax=Caenorhabditis RepID=Q21080_CAEEL
NCBI RefSeq	XP_624902.1	3e-151	62.74%	PREDICTED: similar to CG8129-PB, isoform B [Apis mellifera]
NCBI nr blastp	gi\|340714159	8e-152	62.82%	PREDICTED: threonine dehydratase catabolic-like isoform 2 [Bombus terrestris]
NCBI nr blastx	gi\|340714159	1e-146	63.33%	PREDICTED: threonine dehydratase catabolic-like isoform 2 [Bombus terrestris]

Group
Gene Ontology	GO:0008152	6e-101	metabolic process
	GO:0003824	6e-101	catalytic activity
	GO:0030170	6e-101	pyridoxal phosphate binding
	GO:0016597	3.3e-05	amino acid binding
KEGG pathway	ame:552523	9e-151
	K01754 (E4.3.1.19, ilvA, tdcB)	maps->	Valine, leucine and isoleucine biosynthesis
			Glycine, serine and threonine metabolism
InterPro domain	[471-822] IPR001926	6e-101	Pyridoxal phosphate-dependent enzyme, beta subunit
Orthology group	MCL10849		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS202254-TA
ATGGTGTTTCAGACGGTCGAGTTCGACCCCATGTGTGACAAAGACAATCCTCAAATAATAAGTTTTGAGGACGTATCAGCAGCTGCCTATAGAATCCAGAGCGGGATTATAAAAACGCCATGCGTGAAATCTCACATGTCATCTATTTTTGAAATGGATATTTATCTCAAAAATGACTTTCTGCAACACACTGGCAGGCGAGTATTTATAATGAAATCCATAAAAAAAAATAATGGAATTTTCAAAGAACGTGGGGCTCGTAACGCCCTCATTTTGCTATCATCCGAGGCAAAAACTCGCGGTGTGATATCAGCTTCACTCGGAAACCACTCCCAGGGTCTCAGCTACCACGCACAACAGCTGAACATACCGGCCACTGTGGTCATGCCAAATGTGGCACCCATCATGAAAATACAGAACTGCCGTTCGTACGGCGCTAACGTCGTCATCCATGGGCACGACATGAAGGAAGCGAAGTACCATGCTATGACGCTAGCCAAGGAGAGGGGACTCACATATATTAACGGCTACGATCACCCTCACATAATGGCCGGTCAAGGCACCGTGGGGTTGGAGATAGTGGAACAGGTTCCTGATGTAGACGCGGTCATCGTCCCCGTGGGCGGCGGCGGTCTACTCGCCGGAGTCGCCACTGCCATTAAGAATATTAAGCCCCATGTTCTCATATACGGCGCTGAAACCGAAAAATGTCCAAGCATGAAGATGGCTATCAAACATCAACAGCCAGTGAGCGTCAATATCCGGTCCACGCTGGCGGACGGGCTCGCCGTGCCCACGGTCGGCTACAACGCATTCAAAACATCGAAATCGCTCATGGATAGGATGATAACAGTAAACGAGGATTGGATTGCTCGCGCGATTCTGCGTTTGGTGGAACAAGAAAAGTATGTTGTGGAGGGCGGCGGCGCTGTCGGAGTGGCGGCTATCATGGCCGGACTCGTGCCCGAGTTGGTTGGGAAGAAGGTGGTATGTATTCTGTCGGGTGGTAACATCGACACCACAATCCTCGGTCGTTGCTTGGAGCGGGGTTTAGCCGCGGAACAGAGGCTCGTCAAATTCAAGGTCACCGTCAGCGACCGACCCGGCGGCATCGCGGAACTTTGCAAACTCATCTCCTCCATAGGAGTATCTATCAAGGATATAATGCAAGAACGAGCTTGGGTCTTTGGCGACATATTTAGCGTGAAAGTCGTTTGTGAAACCAGAGGTCCGGAACATTTGGAGGAGCTGGAGAAAATGATAACTGACACATATAAAGAGTGGAATTTCTCCAGGGATTGTGAAGAATTTGACAGAAATGATAGAAGACTGAGCACGTTCTCCATCGATGAAACCCAAGACGTTGAATATGACGAATATTGTGATCCGAACAATCCTCGGAAGATTAAATATGACGATATTTTGGCTGCATATAGAAGAATTACGGGTTACGTATTGAAAACGCCTTGTACGAGAGCTCACATGTCAGATAGGTTGGGTATGGAAATATATTTAAAGCAGGAGTTCATGCAACACACTGGATGCTTTAAGGAACGCGGAGTTAGGAATACTATGCTGTTACTGTCGGAGGAGCAAAGGAAAGTTGGTGTAATAAGCGCTTCGACGGGGAACCATGGCACTTCAATGAGTTATCACACCACACAGATGGGTATTCCTTGTATAGTTGTGATGCCGGTTCGAGCACCTATCACTAAACTGACTAAATGTCAAAACTTTGGAGCGAAAACAATACAACATGGCGACAATATGGCCGAAGCGAAACATTACGCTATGGCTCTGTCAAAAGAAAAGAAATTATACTACGTTAATGGTTATGATCACCCAAACGTCATAGAAGGTCAGGGTACTATCGGCATAGAGATTATAGAACAGGTACCGGATGTAGACGCTGTCATTGTACCTGTTGGCGGAGGTAGTCTTTTATGCGGCATAGCTGTTGCCGTGAAACATTTAAAACCGGACACGGAAGTTTATGGTATACAAACAGAAAAAGCTTATAGTATGGTAGAAGCTTTAAAGAGAAATGAAAGGGTGAAAATTGTCATCGACTCTACCATCGCTGACGGTCTAGGAGTAAACTTAGCAGGCGTCAATACTTTTCACAATCTGAAAAGCGGAATATTGGATAAAATGGTAATAGTTAAAGAGGACTGGGTCGCCCGTGCTATAATGCATGTGGTCGAGGAAGAGCGCTACGTCATAGAGGGTGCTGCGGCTGTCACCATAGCGGCCGTTATGGCGGGGCTTTTCCCGAATCTTAAGGGTAAAAAGGTGGTATGCGTGTTGTCTGGTGGTAACATCGACACAACCATCCTGGCTCGGTCGCTGGAGCGCGGTATGGCCGCGGAGGGTAGGTTGGTGAAATTCAAGGTGACGGTGAGCGACCGTCCCGGGGGTATGGCGGAGCTGTGCTCGCTGCTAGCCACCATCGGCGTCACCGTCCGCGACTGTATACCGGAACGAGCCTGGGTCAAGGGAGACGTGTTCAGTGTTGAGATGAAAGTGATAGTTGAGACCAGAGGATGGGATCACACGAAAGAACTGATAGAGCAAATAAAGAAGAAGTACAAGGAATGTTTCTTCCACGAGATGAGCGAACGCAGCGACAAGGGCGCCGGCGCCAAGAGAGGCCCCTGCCTCGCCCCCAACCCGGAAGATTTCGATGAGTTCTGCGATCCTGACAATCCAAAAATAATTAAATATGAAGATGTCGTCGACGCTTTAAAACGTATAAGAAAATATATACCGCAGACTCCAATAATAGCTTCACACTATCAGAAAGAATGCGGCATCAATCTTTTCTACAAACTGGAAACGGTAATGAGAACAGGAAGTTTTAAGGAAAGAGGTGCATTAAACGCGCTAGATTTATTGCCAAGAGATAGACAAAAGATGGGCGTTGTTGTAGCGTCTCTTGGAAACCAGGCAATGGGAATATGTTATTATGGTAAAAAACTAGGGATACCAGTGACTGTGGTGATGCCAACCTCTGTGCCAGTCATAAAACTACAAATGTGCAGCGACATGGGCGCCAAAGTTGTAGTTCAAGGTCACAATTTGGTGGACTCTCAGAAATATGCTCGAGCCTTAGCAAAAGAGAAAGGTCTCACTCATATTAACGCTCGTGACTATCCCGATGTGATGGCGGGCTATGGTACTGTAGCAATAGAAATTATGGAGCAAGTGCCCGCTTTGGACGCTGTTCTATTGCCCATTGGGACCGGCGGCTTGGCGGCAGGGGTCGCTACTGTCATCAAACACGTCAATCCAAACTGCCTTGTATACGGAGTTCAATCTGAACGACTGCCAACATTTTACAAGTCCCTGGAAGCGGGAGAACCTCTTACTTTGCCCTACGAACCATCAATAGCCGAGGGTATAGCGATGCCGTATGTCGGAGTGAATGCGTTTAGAAACGCACAAAATTTGCTCGACAAATTAATATTAGTTTCTGAGGACTGGATAGCTAGGTCTATTTTGCATTTAATTGAAAAAGAACGGCTAGTTGTAGAGGGCGCTGGTGCTTGTCCGTTGGCAGCAGTTCTATGTAGCCAGGTCCCTGAACTGAAGTCAAAAAATGTCGTTATAATCCTCAGTGGAGGTAACATAGACGCTGTATTACTAGGCCGTTGTTTAGACAGAGGACTGGCAGCAGAAGGTCGTCTTATAAAATTCAAAGTACTCGTGAAAGATTTAGGCACAGAGTATGAAAGGTTTACTAAACTGCTAGCGGATAACGGTTATAATTTGGTAAGACAGTTTCAGGATCGCATTTGGGTGGAAAACGAAATTTACCGAGTCGAGATGAAAGCCGTCTGCGAGACGAGAGGACTCGACCACGCTCTGGAGTTGAAGAGAATAATTGAAAAGACATATCCAAATGAATGCGCTTTTGAAACGGAACCCTTTGATAGCGACAACACCTGCTCTTGCTATATACCTTCAAAATGTTAA

Protein sequence:

>DPOGS202254-PA
MVFQTVEFDPMCDKDNPQIISFEDVSAAAYRIQSGIIKTPCVKSHMSSIFEMDIYLKNDFLQHTGRRVFIMKSIKKNNGIFKERGARNALILLSSEAKTRGVISASLGNHSQGLSYHAQQLNIPATVVMPNVAPIMKIQNCRSYGANVVIHGHDMKEAKYHAMTLAKERGLTYINGYDHPHIMAGQGTVGLEIVEQVPDVDAVIVPVGGGGLLAGVATAIKNIKPHVLIYGAETEKCPSMKMAIKHQQPVSVNIRSTLADGLAVPTVGYNAFKTSKSLMDRMITVNEDWIARAILRLVEQEKYVVEGGGAVGVAAIMAGLVPELVGKKVVCILSGGNIDTTILGRCLERGLAAEQRLVKFKVTVSDRPGGIAELCKLISSIGVSIKDIMQERAWVFGDIFSVKVVCETRGPEHLEELEKMITDTYKEWNFSRDCEEFDRNDRRLSTFSIDETQDVEYDEYCDPNNPRKIKYDDILAAYRRITGYVLKTPCTRAHMSDRLGMEIYLKQEFMQHTGCFKERGVRNTMLLLSEEQRKVGVISASTGNHGTSMSYHTTQMGIPCIVVMPVRAPITKLTKCQNFGAKTIQHGDNMAEAKHYAMALSKEKKLYYVNGYDHPNVIEGQGTIGIEIIEQVPDVDAVIVPVGGGSLLCGIAVAVKHLKPDTEVYGIQTEKAYSMVEALKRNERVKIVIDSTIADGLGVNLAGVNTFHNLKSGILDKMVIVKEDWVARAIMHVVEEERYVIEGAAAVTIAAVMAGLFPNLKGKKVVCVLSGGNIDTTILARSLERGMAAEGRLVKFKVTVSDRPGGMAELCSLLATIGVTVRDCIPERAWVKGDVFSVEMKVIVETRGWDHTKELIEQIKKKYKECFFHEMSERSDKGAGAKRGPCLAPNPEDFDEFCDPDNPKIIKYEDVVDALKRIRKYIPQTPIIASHYQKECGINLFYKLETVMRTGSFKERGALNALDLLPRDRQKMGVVVASLGNQAMGICYYGKKLGIPVTVVMPTSVPVIKLQMCSDMGAKVVVQGHNLVDSQKYARALAKEKGLTHINARDYPDVMAGYGTVAIEIMEQVPALDAVLLPIGTGGLAAGVATVIKHVNPNCLVYGVQSERLPTFYKSLEAGEPLTLPYEPSIAEGIAMPYVGVNAFRNAQNLLDKLILVSEDWIARSILHLIEKERLVVEGAGACPLAAVLCSQVPELKSKNVVIILSGGNIDAVLLGRCLDRGLAAEGRLIKFKVLVKDLGTEYERFTKLLADNGYNLVRQFQDRIWVENEIYRVEMKAVCETRGLDHALELKRIIEKTYPNECAFETEPFDSDNTCSCYIPSKC-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: