MonarchBase - Protein-coding gene

DPOGS210696
Transcript	DPOGS210696-TA	2751 bp
Protein	DPOGS210696-PA	916 aa
Genomic position	DPSCF300013 - 535151-546986
RNAseq coverage	91x (Rank: top 63%)

Annotation
*Heliconius*	HMEL022036	75.61%
*Bombyx*	BGIBMGA006311-TA	69.87%
*Drosophila*	CG1544-PA	52.79%
EBI UniRef50	UniRef50_Q7QFL5	53.41%	AGAP000551-PA n=5 Tax=Endopterygota RepID=Q7QFL5_ANOGA
NCBI RefSeq	XP_001650884.1	54.48%	2-oxoglutarate dehydrogenase [Aedes aegypti]
NCBI nr blastp	gi\|157109931	54.48%	2-oxoglutarate dehydrogenase [Aedes aegypti]
NCBI nr blastx	gi\|157109931	54.37%	2-oxoglutarate dehydrogenase [Aedes aegypti]

Group
Gene Ontology	GO:0006096	1.5e-256	glycolysis
	GO:0004591	1.5e-256	oxoglutarate dehydrogenase (succinyl-transferring) activity
	GO:0055114	1.5e-256	oxidation-reduction process
	GO:0030976	1.5e-256	thiamine pyrophosphate binding
	GO:0008152	7.1e-39	metabolic process
	GO:0016624	7.1e-39	oxidoreductase activity, acting on the aldehyde or oxo group of donors, disulfide as acceptor
KEGG pathway
InterPro domain	[27-917] IPR011603	0	2-oxoglutarate dehydrogenase, E1 component
	[566-769] IPR005475	8.1e-57	Transketolase-like, pyrimidine-binding domain
	[218-497] IPR001017	7.1e-39	Dehydrogenase, E1 component
Orthology group	MCL11990		Single-copy universal gene

Nucleotide sequence:

>DPOGS210696-TA
ATGTTCGCGTTCAATAAAGTTAAACCGTTGATAAGATGGAAGCAGTTGAGGTTAGAGCGAGCGAAATACAACTCCGGAGTGGGAGTGTTCGGTCATCGACCGCGTCAAACTAACGATATTGATGTACCTCAAGAAATAATCTCAAGACGAAACGAAAACTGTCGGGCGCAACAACTAGTCGATGCTTACCGGAAGTACGGCCATCTCCGAGCTACCATAGATAATGTCGACTATGAAAATAAAAACCGGGATATCAAAGAGCTTCATCTATCAAGATATGGTTTATCAGGCTCCGACACGGTTGACTTGGGACTGTTATATGGCCACAATGGAAAACAATTTGCGAACGATCTAGTGGAACAATTGGAGAAAATTTATTGCGGTCCAATATCTTACGAATTCAGTCATCTGGAGACGGAGGCCGAAAGAGAATGGTTCTCACAGAGAGTCGAAAGCGGTTCAGATGTTGTGAGTAAGGAACGTCAGATCGAAATAATAAAAGAACTCCTACACTCACAAGCGTTGGACAAATTCCTATCAACAAAATTGCCATCGGTTAAGAGGTACTGCGGGGAAGGCGCGGAGTCTTTATTAACTTTCCTGTCGACTTTGTTCCGACTGACAGCCTCAGAACAAATACAGCATGTAGTAGTAGCAATGGCACACAGAGGTAAACTCAACGCACTGGGTTGTCTTCTAAAAGTTCCACCAGTGAAGATATTCCACAAGCTAGCCGGCAACCCTGAGTTTCCGGACGAAGCCAACGCGGCTTGCGACATTGCCACTCATTTAAGCGTTTCCAACGACATAACAGTGAATGGCAATACAGTTAGATTCTCTTTGATAAACAATCCATCACATCTCGAGGCCGCCAATTCTGTGTCGATGGGCAAAACGAGGTCGAAGCAATTAAAGTTACGAGAAGGCGACTATTCTGAAAACAGTACTTCACGGTTTGGCGACAAAGTTTTAAATGTTCAGATACACGGGGATGCAGCTTTTGTTGGACAAGGAGTGAATCAGGAGAGCCTTATGTTTTCACAATCACCACACTTCGACGTGGGTGGAAGTTTACATGTCGTAGTTAACAATCAATTAGGATTCACACTCCCAGCGAGCCGAGGACGTTCGAGTCGCTACGTTACTGATTTGGCTAAATCAATAGCTGTCCCGGTTATTCACGTCAATGGAGACTATCCTGAGCTTGTAGAAAAGGCAACGAACATAGCGTTTGAGTATCAGAGGAAATTCCGCAAGGACGTTTTCATAGATTACAACTGTTTCCGGAAATGGGGTCACAATGAGCTCGACGATCCGACCGTCACAAACCCTCTCATATACAAAATTATTAATAAAAAACAATCAATACCTAATCACTATGCAAATAAACTTGTATCAGAAGGGATTCTAACTGGAGATGAAGTCGAGAGCATAACAACAGAATTCACTAAATATTTGCAATCGCAATTCGAACAACATAATTCCTACAAACCCGAGGGATCATATTACCAAGATCAGTGGTCAGAAATGAGTGCTGCACCTCGAGCTGTGGAACTCTGGGATACTGGCGTTGACACTGAAATCTTGAAGCAGGTCGGACGAGCCTCCGTCATTGTACCTGATGACTTTGTCATACATCCCCATTTGGCGAAAACCCATGTAAAAAATCGATTGAACAAATTGTCCGAGGAAAAAGGACTCGACTGGGCTACAGCGGAGGCTCTCGCTTTTGGATCATTACTAATGGAAGGCAGGAACGTTCGCATCAGTGGAGAAGATGTTGGTAGAGGTACCTTCGCCCACAGGCATGTTATGTTCGTAGACCAGGAGAAAGAGAATATACACATCCCACTGAACCATATACACAAGGAACAGAAAGCGTTTTTAGAGGTGGCAAATTCAATTCTATCTGAGGAAGCCGTGTTGGGATTCGAATACGGCATGGCATTCGATTCGCCCGAAAATCTTTGTTTATGGGAAGCACAGTTCGGCGATTTTTACACGGGAGCACAGATTATAGTCGATAATTTCATTGCTTCTGGCGAATCGAAATGGGTTCGCAGCAACGGTCTAGTGATGTTGCTTCCACACGGATTCGATGGCGCAGCATCCGAACATTCCTCCTGCAGGATGGAGCGTTTTTTGCAGCTAACAGACAGTTCGGAGATAAGCCCCGACTCTGAGGCCGTGAACATGAACGTAGCGAATGCCACAACACCAGCACAGTACTTCCATTTGTTAAGGAGACAGATGGTTCGCAACTACAGAAAACCGTTGGTTGTGGTCTCTCCAAAAACTCTTCTGCGTTTGGCCGAAGCGACATCCAACTTGTCAGAATTCGCACCCGGGACACACTTTAAGCCTGTTATTGGTGATCAAATCGCTGATCCATTGAAAGTTAAAAGGGTGTTTTTCGTCAGTGGTAAACATTATTACGAATTGCACAACGAACGGATGAAAAGTAAAATTGATGACGTCGCTATTGTGAGGGTAGAATTGCTTTGTCCTTTCCCCGTGCAAACAATACAAGCGGAATTGCAAAAATATACTAACGCTAGAAAATTCATATGGTGTCAGGAAGAACATAGAAATATGGGTGCGTGGAGTTTTGTAAAGCCACGATTTGAAAATCTGGTCGGGAGAAAGCTCCTATACGCAGGTCGTCCTGAAGCACCAACTACAGCAGTAGGAGCACCTAAACTTCACAAACTGGAAGTTGATTATATACTACGCCAACCATTTTTGACATAA

Protein sequence:

>DPOGS210696-PA
MFAFNKVKPLIRWKQLRLERAKYNSGVGVFGHRPRQTNDIDVPQEIISRRNENCRAQQLVDAYRKYGHLRATIDNVDYENKNRDIKELHLSRYGLSGSDTVDLGLLYGHNGKQFANDLVEQLEKIYCGPISYEFSHLETEAEREWFSQRVESGSDVVSKERQIEIIKELLHSQALDKFLSTKLPSVKRYCGEGAESLLTFLSTLFRLTASEQIQHVVVAMAHRGKLNALGCLLKVPPVKIFHKLAGNPEFPDEANAACDIATHLSVSNDITVNGNTVRFSLINNPSHLEAANSVSMGKTRSKQLKLREGDYSENSTSRFGDKVLNVQIHGDAAFVGQGVNQESLMFSQSPHFDVGGSLHVVVNNQLGFTLPASRGRSSRYVTDLAKSIAVPVIHVNGDYPELVEKATNIAFEYQRKFRKDVFIDYNCFRKWGHNELDDPTVTNPLIYKIINKKQSIPNHYANKLVSEGILTGDEVESITTEFTKYLQSQFEQHNSYKPEGSYYQDQWSEMSAAPRAVELWDTGVDTEILKQVGRASVIVPDDFVIHPHLAKTHVKNRLNKLSEEKGLDWATAEALAFGSLLMEGRNVRISGEDVGRGTFAHRHVMFVDQEKENIHIPLNHIHKEQKAFLEVANSILSEEAVLGFEYGMAFDSPENLCLWEAQFGDFYTGAQIIVDNFIASGESKWVRSNGLVMLLPHGFDGAASEHSSCRMERFLQLTDSSEISPDSEAVNMNVANATTPAQYFHLLRRQMVRNYRKPLVVVSPKTLLRLAEATSNLSEFAPGTHFKPVIGDQIADPLKVKRVFFVSGKHYYELHNERMKSKIDDVAIVRVELLCPFPVQTIQAELQKYTNARKFIWCQEEHRNMGAWSFVKPRFENLVGRKLLYAGRPEAPTTAVGAPKLHKLEVDYILRQPFLT-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: