MonarchBase - Protein-coding gene

DPOGS200075
Transcript	DPOGS200075-TA	1584 bp
Protein	DPOGS200075-PA	527 aa
Genomic position	DPSCF300044 - 333634-346714
RNAseq coverage	1113x (Rank: top 11%)

Annotation
*Heliconius*	HMEL005250	0.0	82.82%
*Bombyx*	BGIBMGA004595-TA	0.0	74.41%
*Drosophila*	Hex-A-PA	8e-79	37.72%
EBI UniRef50	UniRef50_E2C3M9	2e-125	51.43%	Hexokinase-2 n=11 Tax=Arthropoda RepID=E2C3M9_HARSA
NCBI RefSeq	XP_392350.2	1e-129	51.99%	PREDICTED: similar to Hexokinase A CG3001-PA, isoform A [Apis mellifera]
NCBI nr blastp	gi\|383865855	1e-128	53.32%	PREDICTED: hexokinase-1-like [Megachile rotundata]
NCBI nr blastx	gi\|383865855	1e-124	53.32%	PREDICTED: hexokinase-1-like [Megachile rotundata]

Group
Gene Ontology	GO:0005524	6.2e-127	ATP binding
	GO:0016773	6.2e-127	phosphotransferase activity, alcohol group as acceptor
	GO:0005975	6.2e-127	carbohydrate metabolic process
KEGG pathway	isc:IscW_ISCW012387	8e-87
	K00844 (HK)	maps->	Starch and sucrose metabolism
			Galactose metabolism
			Glycolysis / Gluconeogenesis
			Amino sugar and nucleotide sugar metabolism
			Fructose and mannose metabolism
			Type II diabetes mellitus
			Streptomycin biosynthesis
			Insulin signaling pathway
			Butirosin and neomycin biosynthesis
InterPro domain	[114-524] IPR001312	6.2e-127	Hexokinase
	[91-283] IPR022672	4.8e-54	Hexokinase, N-terminal
	[290-521] IPR022673	5.4e-53	Hexokinase, C-terminal
Orthology group	MCL18831		Insect specific

Genotypes for resequenced monarchs and outgroup Danaus species

Nucleotide sequence:

>DPOGS200075-TA
ATGTCATTGCCACTAACTTCACCAATTGTATCAATAAATGTTTATAAAATGAACTCTGGTGATAACCTTAAAATTGGAAAGATATACATCACAATGTCAACGGCTGTTGAGAATCTTAACATGGAGCCGCTGGTGAACGGTCACAATGGCCCACATTTGAATGGCACAAATGGTACAAATGGCACCACAGTTATCACAAACGGCACTAATGGAACCTGGGCCCAGCAATTCCTACCACCACAACTGATTTTGGACGACAGAGTCAGAGCTACCAAGATTGATAATCGTTTGTCCAAAATGATTCTGTGTGGTAACACGCTGAGGCGAGTTGGCGAAGTGTTTGCCAGAGAAATAGAGAACGGATTAAAGGAACGTCCATCCAGTCTGCAGATGGAGAACACGTACGTCCCTGAACTACCCGATGGAACTGAGGAAGGGGTTTTCTTGGCTTTAGATCTCGGAGGTACTAATTTTAGAGTTCTGCTGCTAGAACTTCGTGCTGGTAAACTTGTGAGAGAGGACGTTAAGCATTATCATATCAGTGACGTCTTGCGGCTCGGGCCCGGTGAGGATCTCTTTAATTTCCTTGCGGACAGTGTACTGGACTTTTTGACGTCGGAGAACATGGAAAACGACGTGCTTTCGCTCGGTTTCACGTTTTCGTTTCCGATGAAACAGCACTCGATTTCATCTGGTGAGTTGATAACGTGGACCAAGAGCTTCAACTGCGGTGGGATGCAGGGCGTGGACGTCGCTGCCCTGTTGCAGCGCTGTCTGCGAGACCGTGGACTGAGAGTGACGGTTCAAGTGTTGCTTAATGACACCACGGGTACACTTGTCGCTGGTGCTCACATGGATCCGGATGTTGCCATCGGTGTGATAATGGGCACTGGTTCAAACGGTTGTTATATGGAACAAGCGAAGAGAGTGCAACACTGGGAGGCGAAACACGACCGCGTGCAGGATGTGTGTGTTGACATCGAGTGGGGAGCCTTCGGAGATAACGGGTGCCTGTCCTTCCTGAGGACAGATTTCGACAAAGTCGTGGACGACAATTCTTTGCTCGCTACATCTTTCACTTTCGAAAAGTACATCGGTGGAAAATATATAGGGGACTTATTGTGTGCGGTTTTGAGTGGACTGGCACACGATCGTCTTTTCCCCGCACCACCAGCGCCCGGTTCATTGGCCTCGTCGGATCTTAGCATGTTTGAAGAAGAGAACGTGACAGGTTCGTGGTCTAACACAGCTAACACATTGACTGCGGCCTGCGGTGTGCGAATCTCGCGTGCTGATGCGTTAGTCGCCCAACACGCAGCACGAGTCATATCAAATCGTGCTGCGCAGCTCGTGTCTGTTTGTATAGCGACGCTGTTGCTTCGTATGAATCGCCCGCATGTGGGCGTGGCTGTTGATGGTTCAGTTTTCAAACGACACCCTCGTATCCGTGGACTGATGGAGCGCTACATTGAGTTGCTCGCCCCCCATCACAAGTTCACTCTTCTTGGAGCTGAAGATGGTAGTGGCAAAGGCAGTGCTTTGACGGCAGCTATCGCGGCCAGGGTCGCCGCTCGTTCACCCTAA

Protein sequence:

>DPOGS200075-PA
MSLPLTSPIVSINVYKMNSGDNLKIGKIYITMSTAVENLNMEPLVNGHNGPHLNGTNGTNGTTVITNGTNGTWAQQFLPPQLILDDRVRATKIDNRLSKMILCGNTLRRVGEVFAREIENGLKERPSSLQMENTYVPELPDGTEEGVFLALDLGGTNFRVLLLELRAGKLVREDVKHYHISDVLRLGPGEDLFNFLADSVLDFLTSENMENDVLSLGFTFSFPMKQHSISSGELITWTKSFNCGGMQGVDVAALLQRCLRDRGLRVTVQVLLNDTTGTLVAGAHMDPDVAIGVIMGTGSNGCYMEQAKRVQHWEAKHDRVQDVCVDIEWGAFGDNGCLSFLRTDFDKVVDDNSLLATSFTFEKYIGGKYIGDLLCAVLSGLAHDRLFPAPPAPGSLASSDLSMFEEENVTGSWSNTANTLTAACGVRISRADALVAQHAARVISNRAAQLVSVCIATLLLRMNRPHVGVAVDGSVFKRHPRIRGLMERYIELLAPHHKFTLLGAEDGSGKGSALTAAIAARVAARSP-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: