MonarchBase - Protein-coding gene

DPOGS207444
Transcript	DPOGS207444-TA	1122 bp
Protein	DPOGS207444-PA	373 aa
Genomic position	DPSCF300051 - 724939-737644
RNAseq coverage	1118x (Rank: top 11%)

Annotation
*Heliconius*	HMEL012324	1e-53	79.37%
*Bombyx*	BGIBMGA009914-TA	4e-64	77.16%
*Drosophila*	CG42237-PA	1e-69	44.41%
EBI UniRef50	UniRef50_Q7Q4S0	1e-73	49.66%	AGAP000899-PA n=4 Tax=Culicidae RepID=Q7Q4S0_ANOGA
NCBI RefSeq	XP_316877.4	2e-74	49.66%	AGAP000899-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|347964711	4e-73	49.66%	AGAP000899-PA [Anopheles gambiae str. PEST]
NCBI nr blastx	gi\|347964711	2e-73	49.83%	AGAP000899-PA [Anopheles gambiae str. PEST]

Group
Gene Ontology	GO:0016042	3.9e-102	lipid catabolic process
	GO:0005509	3.9e-102	calcium ion binding
	GO:0004623	3.9e-102	phospholipase A2 activity
KEGG pathway	dme:Dmel_CG3009	1e-21
	K01047 (PLA2G)	maps->	GnRH signaling pathway
			Fc epsilon RI signaling pathway
			MAPK signaling pathway
			Linoleic acid metabolism
			alpha-Linolenic acid metabolism
			Arachidonic acid metabolism
			Vascular smooth muscle contraction
			Glycerophospholipid metabolism
			Long-term depression
			Ether lipid metabolism
			VEGF signaling pathway
InterPro domain	[78-359] IPR001211	3.9e-102	Phospholipase A2, eukaryotic
	[264-363] IPR016090	6.2e-34	Phospholipase A2
Orthology group	MCL16532		Insect specific

Nucleotide sequence:

>DPOGS207444-TA
ATGTCCTTCCGACGACTGCTCAGCGCGGTGCGGTCGGCCCGCGACGCGCTCACGAGGGGCGCGCCCATGGCCGACGGTTTGTTCAAGTCGCTCGTATCATTGGTGGTGATCCTCTGCATCGCCGTGTCGTCCCCGCAGTCGGCGTCCGCGAAGCCCTTCGCCTTCAGCTTTCCGGCGAGCTGGTCCCTGGCTGGGCTGGTGGGAGGTGTGGGCGCTCGCTCCGAGGACCACCGGAGAGAACCCGCGGGAGTGAAGCCCTACACCGAGCGGAGAGTCTCCAACGACACCCTCCGTATGATCTACTTCCACGACCAGACGGTGGCCGTGGTAGAGCTCGGCTTGGACAAGCTGCTCCTCAACTGCGAGCTCATCGAGACATATGATGAGGACGACACGAGCCGCCTCCTGCGCCAGTTGAGCAGCATCAACCGACCTCTGGCCATCAACTTCCCTCAGATGACCAAGTTAATGAGCCAGTGTCAGCAGTTTTTTGAATTATTAGTGCTTAAGCTTTTATTAAAACCTAAGAAGGAAAGCGTAAGTGATGAGGACGACACGAGCCGCCTCCTGCGCCAGCTGAGCAGCATCAACCGACCTCTGGCCATCAACTTCCCTCAGATGACCAAGTTAATGAGCCAGTGTCAGCAGGTCGACGGAGTGGAGGGGTCGGAGGGATGGGCGGCGTCCCGGCGTAGGGCGGACTGGCGAGAACGAGGAGCAGCGAGACTGCGGGCAGGCGGGCAACACGCGGGGCTGCTGGGAGGCAGTCCGCTGTCACTGCTACAGGGGATAATACCCGGCACTAAATGGTGTGGGACGGGCGACATCGCGGCGGACTACCACGACCTGGGCTCCGACCGGCCCCTGGACCGCTGCTGCCGCACGCACGACCTGTGTCCCAGCAAGGTCCGCGCCTTCTCCACTCGCTACAACCTCACCAACAACTCCCTCTACAGCAAGTCGCACTGCACCTGCGACGACATGCTTTTCGAGTGTTTGAAGGCGACCAACACGTCCGCCTCTCACCTCATGGGGCACATCTATTTCAATATAGTCCAAGTGCCCTGCTTCGAGGACCTTCCCTCCGGCCGGCGGTTCAGAGAAGCGAAGCAAGGCTTCTGA

Protein sequence:

>DPOGS207444-PA
MSFRRLLSAVRSARDALTRGAPMADGLFKSLVSLVVILCIAVSSPQSASAKPFAFSFPASWSLAGLVGGVGARSEDHRREPAGVKPYTERRVSNDTLRMIYFHDQTVAVVELGLDKLLLNCELIETYDEDDTSRLLRQLSSINRPLAINFPQMTKLMSQCQQFFELLVLKLLLKPKKESVSDEDDTSRLLRQLSSINRPLAINFPQMTKLMSQCQQVDGVEGSEGWAASRRRADWRERGAARLRAGGQHAGLLGGSPLSLLQGIIPGTKWCGTGDIAADYHDLGSDRPLDRCCRTHDLCPSKVRAFSTRYNLTNNSLYSKSHCTCDDMLFECLKATNTSASHLMGHIYFNIVQVPCFEDLPSGRRFREAKQGF-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: