MonarchBase - Protein-coding gene

DPOGS208514
Transcript	DPOGS208514-TA	1059 bp
Protein	DPOGS208514-PA	352 aa
Genomic position	DPSCF300064 - 263023-268050
RNAseq coverage	238x (Rank: top 43%)

Annotation
*Heliconius*	HMEL002162	0.0	86.97%
*Bombyx*	BGIBMGA008451-TA	1e-160	79.82%
*Drosophila*	IP3K2-PB	4e-139	75.08%
EBI UniRef50	UniRef50_Q5TX95	1e-142	80.34%	AGAP002194-PA n=6 Tax=Anopheles gambiae RepID=Q5TX95_ANOGA
NCBI RefSeq	XP_565625.3	6e-144	78.03%	AGAP002194-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|347967363	4e-142	80.34%	AGAP002194-PA [Anopheles gambiae str. PEST]
NCBI nr blastx	gi\|347967361	2e-138	79.33%	AGAP002194-PB [Anopheles gambiae str. PEST]

Group
Gene Ontology	GO:0008440	3.1e-149	inositol trisphosphate 3-kinase activity
KEGG pathway	aga:AgaP_AGAP002194	2e-143
	K00911 (E2.7.1.127, ITPK)	maps->	Phosphatidylinositol signaling system
			Inositol phosphate metabolism
			Calcium signaling pathway
InterPro domain	[32-345] IPR005522	3.1e-149	Inositol polyphosphate kinase
Orthology group	MCL14747		Multiple-copy universal gene

Genotypes for resequenced monarchs and outgroup Danaus species

Nucleotide sequence:

>DPOGS208514-TA
ATGTACTCCGGTGACATCTGTTTGAACATTAAGGATTTTATGGATGTCGTGTACTGTGCTTATATTTTTAATTCTTCTAAGCAATCAGAACGATGGAGGAAGCTGAGGAATATTGTGCAATGGACACCCTTCTTTCAAACCTACAAGAAGCAGAGGTACCCTTGGGTACAGCTGGCTGGTCACCAAGGGAACTTCAAAGCCGGCCCTGACCAAGGAACCATATTAAAAAAGCTGAGCCCTCAAGAGGAGAGATGCTTTAAGTTGCTGATGAAGGATGTGTTACGACCTTTCGTCCCTGGTTACAAAGGGCAGGTCACATGCGAAGACGGCGAATTATATTTACAACTCCAAGATCTCCTCAGCGATTTTGACTGTCCCTGCGTTATGGATTGCAAGATTGGCGTACGGACTTATCTGGAAGAGGAATTAGCTAAGGCTAAGGAGAAAACCAAGTTAAGAAAAGACATGTACGAGAAAATGATCCAAATAGATCCAAAGGCGCCAACAGAGGAAGAGCACAGAAGCAAAGGAGTTACAAAGCCACGGTACATGATTTGGAGGGAAACAATCAGTTCTACTTCGACATTGGGTTTCAGGATAGAGGGAGTGAAAAAGGCTGATGGAACGAGCACAAAAGACTTCAAGACCACAAAAACGAGAGATCAAATTGTCGAAGCCTTTAAAGATTTCGCTAACACCTCCACTGCCGTGCCAAAATATCTCGAACGGCTGAAGGCTATTCGGACGACTCTTATGGAATCAAACTTCTTCAGAACTCACGAACTTATAGGCAGTTCCTTGCTCTTCGTTCACGACAAAAGAAAAGCCTCTATTTGGATGATAGATTTCGCTAAAACAGTACCTGTGCCAGAGGATATAACTATCGACCACGATTCCGCTTGGAAGGTCGGTAACCATGAAGACGGCTACCTTATCGGCATCAATAACTTAATATCAATCTTCGAATCCCTTATCAAGGACGATAACGGTAACATAGATCAGTGTTATTCGAATTTAAGTTTAGATAAAAACGTAAGAAGAGACAGCTTAGCCACTTGA

Protein sequence:

>DPOGS208514-PA
MYSGDICLNIKDFMDVVYCAYIFNSSKQSERWRKLRNIVQWTPFFQTYKKQRYPWVQLAGHQGNFKAGPDQGTILKKLSPQEERCFKLLMKDVLRPFVPGYKGQVTCEDGELYLQLQDLLSDFDCPCVMDCKIGVRTYLEEELAKAKEKTKLRKDMYEKMIQIDPKAPTEEEHRSKGVTKPRYMIWRETISSTSTLGFRIEGVKKADGTSTKDFKTTKTRDQIVEAFKDFANTSTAVPKYLERLKAIRTTLMESNFFRTHELIGSSLLFVHDKRKASIWMIDFAKTVPVPEDITIDHDSAWKVGNHEDGYLIGINNLISIFESLIKDDNGNIDQCYSNLSLDKNVRRDSLAT-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: