MonarchBase - Protein-coding gene

DPOGS204224
Transcript	DPOGS204224-TA	3045 bp
Protein	DPOGS204224-PA	1014 aa
Genomic position	DPSCF300046 - 719208-732328
RNAseq coverage	931x (Rank: top 14%)

Annotation
*Heliconius*	HMEL015142	0.0	74.77%
*Bombyx*	BGIBMGA007503-TA	2e-114	58.44%
*Drosophila*	Esyt2-PC	0.0	51.53%
EBI UniRef50	UniRef50_Q5TVA9	0.0	57.53%	AGAP003725-PA n=3 Tax=Culicidae RepID=Q5TVA9_ANOGA
NCBI RefSeq	XP_001659792.1	0.0	53.52%	synaptotagmin, putative [Aedes aegypti]
NCBI nr blastp	gi\|157120914	0.0	53.52%	synaptotagmin, putative [Aedes aegypti]
NCBI nr blastx	gi\|195504754	0.0	50.97%	GE23497 [Drosophila yakuba]

Group
Gene Ontology	GO:0005515	4.4e-30	protein binding
KEGG pathway	ptr:457657	5e-15
	K00923 (E2.7.1.154, PIK3C2)	maps->	Phosphatidylinositol signaling system
			Inositol phosphate metabolism
InterPro domain	[883-1011] IPR008973	4.4e-30	C2 calcium/lipid-binding domain, CaLB
	[296-381] IPR000008	1.4e-15	C2 calcium-dependent membrane targeting
Orthology group	MCL11270		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS204224-TA
ATGCCAGTTAACAGCAAGTTCGCTCTTCCTGTGAGCAGTGATGAAAATTTGAGTGTGTTATCAATCATATACAGATTTTTTAAAAAGGTTTCAATAGTGGGAGCGGTGTACCTGGTGGGTTATATGCAATGGAGTGTGGCGTGGCTCCTGGGGCCGGTTGTGTTGTCTGTAATGAGGGACCAGTGGAGACGAGACAGCGAGTACCGTCGCAACCTCGCCAAGACAGCCGCCCTCTCCTCAGAAAAGGACATCGTACTGGCCAAGCTTGATGACCTACCGGCTTGGGTGTTTTTCCCAGACGTCGAAAGAGCGGAATGGTTGAACAGGATATTGCTTCAAGTGTGGCCTAATGTGAACCACTACGCCAGGACTCTTCTGAAGGACACCATTGAGCCTGCGGTGGCGGAGAGCCTCGCCAACTTCAAGCTTAACGGTTTCAAGTTCGAGCGCATGATCCTCGGTACCATTGCGCCGCGTGTTGGAGGCGTCAAGGTCTATGATAAGAACCTCTCGAGGGATGAAATCATCATGGACGTGGACCTATTCTATGCCGGCGACTGTGATATATCATTCGTCCTACAGCGTATACGAGGTGGAATCAAAGATCTACAGATCCATGGCATGGTCCGCGTGGTGATGAAGCCCCTCATCAGTAAGATGCCGCTGGTGGGAGGGTTGCAGGTGTTCTTCCTCAACAACCCCTCCATAGACTTCAACCTGGTGGGCGCGGCCGACGTACTTGACATGCCCGGCTTTAGCGACATCTTACGTCGTTGCATCGTCGAACAAATATCAAGAATGATGGTGTTACCCAACAAGCTGCCCATCAAATTAAGCGATGAGATACCCACGGTCGACTTGAGGATGCCGGAGCCAGAGGGTGTCCTCAGAATTCATTTGGTCCAAGCCCAGAATCTCATGAAGAAGGATGTCTCCATGTTGGGCAAGGGCAAGTCTGATCCGTACGCTATAATAACAGTTGGGGCTCAACAGTGGAAGACAAAGCACATTGACAACAACATCAACCCTAGATGGGAATTCTGGTGCGAGGCGCGAATTATGCAAACACTTGGGCAGGCGTTGGACATTGAAGTGTTTGACAAGGACGAGGGGAACGATGACGACAAACTGGGCAGGTTCTGCTTCACCAATTATATAATTTATGCTATAATAAGCTCGAGAAAGAGCCAGGTGCTGCAGTGCGAGCTGTGGGACTGGGACCCGGGGATGGGCATTCAGAACGATGATTACCTCGGCAGATGTTCCTTAGATATATCTCAAGTTGTCCGTGCTGGACGTTTGGACACGTGGCAAACACTGCAACAGGCTAAGACCGGTAAGGTACATTTGCGTCTATCGTGGCATCGCTTTTCCACTGACTTGTTGGATCTCAGCCATGCTCTAACATCGACTCAACTGGTAAAGAACGCTGAACTGAGTTCGGCAGTTCTATCCGTCTACATCGATTCTTGCAAACATTTGCCTAACGCTCGTGCACAGTCCCGTCCTGATCCATACCTCGTGGTAACGGTTGGCAAGAAGAGTGAGAATACTGGAGTACAAATGAGAACAGACAGCCCCGTCTACGAAATCGGATACTCCTTCTTGGTACAGAACCCTGAGATTGATGTACTGGAAATAAAGGTCCTCGATCAAAAGACAGGAAACCAGCTAGGAATGCTGAGCTACGGCATATCAGCGCTTTTGAAAGAAAAAAATTTTACTATGTTGAATCAACCGATGAACCTACAAAAATCTGGCCCCGAATCTAAAATCATCATTGCGGCTCAATTGAAGATCCTTAAAGAGGCTGTCAAGGAAGAGGACTTTGATGAAGAAACAGTTTCCGTGGCAAGCGAACCATCGGATGACCGCACTGAGGACAAAAAACCGGATCCACCGAGCACGGAAACCACGGCTGTTGCACCAGCTGTTCCATCGAACACGGATCTGAAGAATATGGAAGACACTCCCCCAGCTACCGACACTATCGACAATAACTCCGAAAAATCTATCCCCGTCGAACAAATTATAAAGGAAGTTGATGTACCTCAAGAGAGTCAAGCGCCGTCTGAACGTGATTCACCAAAATTAATTCACAGGACCTCTTCAATAACGACATCAGCTGGCGATGGCCTCCACAGGCTCTTAGTCCTCGATCAAAAGACAGGAAACCAGCTAGGAATGCTGAGCTACGGTATATCAGCGCTTTTGAAAGAAAAAAATTTTACTATGTTGAATCAACCGATGAACCTACAAAAATCTGGCCCCGAATCTAAAATCATTATTGCGGCTCAATTGAAGATCCTTAAAGAGGCTGTCAAGGAAGAGGACTTTGATGAAGAAACAGTTTCCGTGGCAAGCGAACCATCGGATGACCGCACGGAGGACAAAAAACCGGATCCACCGAGCACGGAAACCACGGCTGTTGCAGCAGCTGTACCATCGAATACAGATCTGAAGAATATGGAAGACACTCCCCCAGCTACCGACACTATCGACAATAACTCCGAAAAATCTATCCCCGTCGAACAAATTATAAAGGAAGTTGATGTACCTCAAGAGAGTCAAGCGCCGTCTGAACGTGATTCACCAAAATTAATTCACAGGACCTCTTCAATAACGACATCAGCTGGCGAGGCTGGACTTGGGAGGATTCTGTTATCTCTACGTTACAGCATGCAGAATCAAACATTATATGTTGTTGTACACAAGATAATGAATATACCTCTCAAGGACCCCACCAATGTCCCGGACCCATATGTTAAACTATACCTGCTACCTGGTCGATCTAAGGATTCCAAACGCAAAACTGTGGTTGTGAAAGACAATTGTATGCCGGAGTATGACGAACAGTTTGAGTGGAGCATCCCGCTAGCTGAGCTTCACTCCAGACAGTTGGAGGTGACCGTCGCCACGCACAAAGGATTCCTCGGTGGAAGTCCTGTTATAGGACAGGTAATAGTTCACCTGAACCAGTATGACTTCCGGGAAGCAAAGACCCTTTGGTTTGATCTTCTGCCTGAAACTTCACCGAGAGAGTAG

Protein sequence:

>DPOGS204224-PA
MPVNSKFALPVSSDENLSVLSIIYRFFKKVSIVGAVYLVGYMQWSVAWLLGPVVLSVMRDQWRRDSEYRRNLAKTAALSSEKDIVLAKLDDLPAWVFFPDVERAEWLNRILLQVWPNVNHYARTLLKDTIEPAVAESLANFKLNGFKFERMILGTIAPRVGGVKVYDKNLSRDEIIMDVDLFYAGDCDISFVLQRIRGGIKDLQIHGMVRVVMKPLISKMPLVGGLQVFFLNNPSIDFNLVGAADVLDMPGFSDILRRCIVEQISRMMVLPNKLPIKLSDEIPTVDLRMPEPEGVLRIHLVQAQNLMKKDVSMLGKGKSDPYAIITVGAQQWKTKHIDNNINPRWEFWCEARIMQTLGQALDIEVFDKDEGNDDDKLGRFCFTNYIIYAIISSRKSQVLQCELWDWDPGMGIQNDDYLGRCSLDISQVVRAGRLDTWQTLQQAKTGKVHLRLSWHRFSTDLLDLSHALTSTQLVKNAELSSAVLSVYIDSCKHLPNARAQSRPDPYLVVTVGKKSENTGVQMRTDSPVYEIGYSFLVQNPEIDVLEIKVLDQKTGNQLGMLSYGISALLKEKNFTMLNQPMNLQKSGPESKIIIAAQLKILKEAVKEEDFDEETVSVASEPSDDRTEDKKPDPPSTETTAVAPAVPSNTDLKNMEDTPPATDTIDNNSEKSIPVEQIIKEVDVPQESQAPSERDSPKLIHRTSSITTSAGDGLHRLLVLDQKTGNQLGMLSYGISALLKEKNFTMLNQPMNLQKSGPESKIIIAAQLKILKEAVKEEDFDEETVSVASEPSDDRTEDKKPDPPSTETTAVAAAVPSNTDLKNMEDTPPATDTIDNNSEKSIPVEQIIKEVDVPQESQAPSERDSPKLIHRTSSITTSAGEAGLGRILLSLRYSMQNQTLYVVVHKIMNIPLKDPTNVPDPYVKLYLLPGRSKDSKRKTVVVKDNCMPEYDEQFEWSIPLAELHSRQLEVTVATHKGFLGGSPVIGQVIVHLNQYDFREAKTLWFDLLPETSPRE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: