MonarchBase - Protein-coding gene

DPOGS215384
Transcript	DPOGS215384-TA	2814 bp
Protein	DPOGS215384-PA	937 aa
Genomic position	DPSCF300088 - 446149-460819
RNAseq coverage	325x (Rank: top 35%)

Annotation
*Heliconius*	HMEL017419	1e-179	89.06%
*Bombyx*	BGIBMGA012397-TA	3e-168	88.06%
*Drosophila*	CG11859-PA	4e-142	72.33%
EBI UniRef50	UniRef50_Q7PXQ6	3e-142	73.58%	AGAP001526-PA n=14 Tax=Eukaryota RepID=Q7PXQ6_ANOGA
NCBI RefSeq	NP_001037592.1	2e-164	79.13%	sorbitol dehydrogenase [Bombyx mori]
NCBI nr blastp	gi\|95103082	1e-163	79.42%	sorbitol dehydrogenase [Bombyx mori]
NCBI nr blastx	gi\|95103082	6e-162	79.42%	sorbitol dehydrogenase [Bombyx mori]

Group
Gene Ontology	GO:0005524	5.2e-56	ATP binding
	GO:0004674	5.2e-56	protein serine/threonine kinase activity
	GO:0003824	3.4e-52	catalytic activity
	GO:0005488	3.5e-35	binding
	GO:0006468	5.2e-33	protein phosphorylation
	GO:0016772	4.2e-29	transferase activity, transferring phosphorus-containing groups
	GO:0055114	7.4e-29	oxidation-reduction process
	GO:0016491	7.4e-29	oxidoreductase activity
	GO:0008270	1.3e-24	zinc ion binding
KEGG pathway
InterPro domain	[301-476] IPR011032	7.5e-59	GroES-like
	[66-289] IPR000687	5.2e-56	RIO kinase
	[108-279] IPR018934	3.4e-52	RIO-like kinase
	[468-591] IPR016040	3.5e-35	NAD(P)-binding domain
	[9-91] IPR015285	5.2e-33	RIO2 kinase, winged helix, N-terminal
	[94-273] IPR011009	4.2e-29	Protein kinase-like domain
	[326-436] IPR013154	7.4e-29	Alcohol dehydrogenase GroES-like
	[476-605] IPR013149	1.3e-24	Alcohol dehydrogenase, C-terminal
Orthology group	MCL11197		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS215384-TA
ATGGGTAAACTCGATGTAGCAATATTGCGATATCTAACACCGGAAGATTTTCGCGTTCTTACTGCAGTGGAAATGGGTATGAAGAATCACGAACTGGTTCCAGGCTCTTTAGTGGCTTCTATAGCCAATTTGCGACACGGCGGAGTCCACAAACTGATGAAAGATCTTTGTAAACATAGATTGTTGACATACGAACGTGGTAAACACTATGATGGCTACCGTCTTACAAATGCTGGTTATGATTACTTGGCTCTTAAAGCTTTAACAAACAGAAAGGTTATTGCCTCTTTTGGTAACCAAATTGGTGTTGGAAAGGAATCTAACATTTACACCGTAGCTGATGAAGACAGAAACCCGCTATGTTTGAAACTTCATAGGCTGGGCAGAACATGCTTCCGGAACATCAAAGACAAGAGAGACTATCATGCACACCGTAACCGGGCCTCATGGCTGTATCTCTCCCGCATATCAGCTACCAAGGAATTTGCATACATGAAGGCTTTATATGACCGTGGCTTCCCAGTACCAAAACCCATTGATTTTAACAGACACTGTGTTGTCATGCAGCTGGTTGGAGGGGGACCTTTAACCCATGTGTCAGCAGTAGATGATGTGGAAGCACTTTATGACGAGTTAATGAACCTTATAGTGAGACTCGGCAACTGTGGTGTCATTCATGGTGACTTCAACGAGTTCAACATCATGATAGATGAAGAAGGACACCCCATCATCATAGACTTCCCTCAGATGATCTCCACAATGCATCCCAATGCGGAACTATACTTTGACCGAGATGTTCAATGTGTCCGAGCGTTCTTTAAGAAGAGGTTTGGATACGAATCCAGTCTGTACCCCAAGTTCTCTGAACTGGAGCGAGATGAAGACTTGGATCGAGAGGTGGCTTGTTCAGGGTACCGGAAGGAACATGATCACCAGCTGTTACAGGAACAAACGCCGATTCCTGAAATTGGCGACGATGAGGTTCTTCTTCGTATGGACTGTGTGGGCATTTGCGGCTCCGACGTCCACTACTGGCAGGGCGGCAGCTGTGGACATTTTGTATTGAAGGATCCTATGATTATGGGACACGAGGCCTCTGGCGTCGTCGCGAAGGTGGGGGGAAACGTTAAAAATCTGTGTGTGGGCGATCGTGTGGCTATTGAACCGGGTGTTCCGTGCCGCTACTGCGAGTTCTGTAAGACTGGACGGTACCACCTCTGCCCTGACATACAGTTCTGCGCCACGCCTCCCGTCCACGGAAACCTCTCCAGATACTACAAACACGCCGCGGACTTTTGTTACAAATTGCCAGATCATGTCTCTATGGAGGAAGGTGCTTTGTTGGAACCTCTATCAGTGGGAATCCACGCGTGTCGTCGCGGAGGCGTCACAGCTGGGGACTTCGTGCTGATACTAGGAGCTGGTCCCATAGGCCTCGTCACACTCCTCGCAGCCAGGGCCATGGGCGCCAGCAAGATCGTGATCACAGACATCTTGGAGTCTCGGCTGGAGACAGCCCGTGCGTTGGGCGCGGATCATACGTTGTTGGTGTCTCGTGACTCCAACGAGGCGGACCTGGTCCGAGCACTCCACGACCTCCTGGGGGCGCACCCCGATGTGTCCGTGGACGCCAGCGGAGCGCCCGCTACCGTGCGACTCGCGCTACTGGCCACTAAGTCAGGGGGTTGTGCTGTCCTGGTCGGTATGGGCAGCCCTGAGGTCACCCTGCCTCTGGCCGGGGCCATGGCGCGAGAGGTCGACATCAGAGGCATCTTCAGATACGTCAACGAATACCCCATCGCTCTATCGCTGGTGTCGAGCGGTCAGATCAACCTGAAGCCGCTGGTGACGCACCACTTCTCACTGGAGGAGACCTTGGAGGCCTACGAGGTCGCGCGGAGAGGAGCCGGCATCAAGGTCATGATACACGTCCAGCCGAGGGATGCCAACAACAAAGTGGGGGGAAACGTTAAAAATCTGTGTGTGGGCGATCGTGTGGCTATTGAACCGGGTGTTCCGTGCCGCTACTGCGAGTTCTGTAAGACTGGACGGTACCACCTCTGTCCTGACATACAGTTCTGCGCCACGCCTCCCGTCCACGGAAACCTCTCCAGATACTACAAACACGCCGCGGACTTCTGTTACAAATTGCCAGATCATGTCTCTATGGAGGAAGGTGCTTTGTTGGAACCTCTATCAGTGGGAATCCACGCGTGTCGTCGCGGAGGCGTCACAGCTGGGGACTTCGTGCTGATACTAGGAGCTGGTCCCATAGGCCTCGTCACACTCCTCGCAGCCAGGGCCATGGGCGCCAGCAAGATCGTGATCACAGACATCTTGGAGTCTCGGCTGGAGACAGCCCGTGCGTTGGGCGCGGATCATACGTTGTTGGTGTCTCGTGACTCCAACGAGGCGGACCTGGTCCGAGCACTCCACGACCTCCTGGGGGCGCACCCCGATGTGTCCGTGGACGCCAGCGGAGCGCCCGCTACCGTGCGACTCGCGCTACTGGCCACTAAGTCAGGGGGTTGTGCTGTCCTGGTCGGTATGGGCAGCCCTGAGGTCACCCTGCCTCTGGCCGGGGCCATGGCGCGAGAGGTCGACATCAGAGGCATCTTCAGATACGTCAACGAATACCCCATCGCTCTATCGCTGGTGTCGAGTGGTCAGATCAACCTGAAGCCGCTGGTGACGCACCACTTCTCACTGGAGGAGACCTTGGAGGCCTACGAGGTCGCGCGGAGAGGAGCCGGCATCAAGGTCATGATACACGTCCAGCCGAGGGATGCCAACAACAAAGTCAAATTCCAATGA

Protein sequence:

>DPOGS215384-PA
MGKLDVAILRYLTPEDFRVLTAVEMGMKNHELVPGSLVASIANLRHGGVHKLMKDLCKHRLLTYERGKHYDGYRLTNAGYDYLALKALTNRKVIASFGNQIGVGKESNIYTVADEDRNPLCLKLHRLGRTCFRNIKDKRDYHAHRNRASWLYLSRISATKEFAYMKALYDRGFPVPKPIDFNRHCVVMQLVGGGPLTHVSAVDDVEALYDELMNLIVRLGNCGVIHGDFNEFNIMIDEEGHPIIIDFPQMISTMHPNAELYFDRDVQCVRAFFKKRFGYESSLYPKFSELERDEDLDREVACSGYRKEHDHQLLQEQTPIPEIGDDEVLLRMDCVGICGSDVHYWQGGSCGHFVLKDPMIMGHEASGVVAKVGGNVKNLCVGDRVAIEPGVPCRYCEFCKTGRYHLCPDIQFCATPPVHGNLSRYYKHAADFCYKLPDHVSMEEGALLEPLSVGIHACRRGGVTAGDFVLILGAGPIGLVTLLAARAMGASKIVITDILESRLETARALGADHTLLVSRDSNEADLVRALHDLLGAHPDVSVDASGAPATVRLALLATKSGGCAVLVGMGSPEVTLPLAGAMAREVDIRGIFRYVNEYPIALSLVSSGQINLKPLVTHHFSLEETLEAYEVARRGAGIKVMIHVQPRDANNKVGGNVKNLCVGDRVAIEPGVPCRYCEFCKTGRYHLCPDIQFCATPPVHGNLSRYYKHAADFCYKLPDHVSMEEGALLEPLSVGIHACRRGGVTAGDFVLILGAGPIGLVTLLAARAMGASKIVITDILESRLETARALGADHTLLVSRDSNEADLVRALHDLLGAHPDVSVDASGAPATVRLALLATKSGGCAVLVGMGSPEVTLPLAGAMAREVDIRGIFRYVNEYPIALSLVSSGQINLKPLVTHHFSLEETLEAYEVARRGAGIKVMIHVQPRDANNKVKFQ-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: