MonarchBase - Protein-coding gene

DPOGS210832
Transcript	DPOGS210832-TA	1023 bp
Protein	DPOGS210832-PA	340 aa
Genomic position	DPSCF300027 - 110669-113067
RNAseq coverage	600x (Rank: top 21%)

Annotation
*Heliconius*	HMEL021249	4e-143	78.33%
*Bombyx*	BGIBMGA003920-TA	1e-145	68.53%
*Drosophila*	CG18258-PA	1e-29	31.64%
EBI UniRef50	UniRef50_D2SNY8	7e-59	63.74%	Neutral lipase (Fragment) n=1 Tax=Heliothis virescens RepID=D2SNY8_HELVI
NCBI RefSeq	XP_002101470.1	3e-30	31.54%	GE17651 [Drosophila yakuba]
NCBI nr blastp	gi\|260908063	3e-58	63.74%	neutral lipase [Heliothis virescens]
NCBI nr blastx	gi\|260908063	1e-57	63.74%	neutral lipase [Heliothis virescens]

Group
Gene Ontology	GO:0003824	1.1e-45	catalytic activity
	GO:0006629	1.1e-45	lipid metabolic process
KEGG pathway	dme:Dmel_CG5665	2e-24
	K01059 (LPL)	maps->	Glycerolipid metabolism
			Alzheimer's disease
			PPAR signaling pathway
InterPro domain	[138-311] IPR000734	1.1e-45	Lipase
	[84-313] IPR013818	3.1e-37	Lipase, N-terminal
Orthology group	MCL24956		Lepidoptera specific

Nucleotide sequence:

>DPOGS210832-TA
ATGAAGTGTGTTTTGATTTTGTTTTGTTATTTCTCCTACATTAGTGCGTGGGGTCGCGGGGATTTAGAAAAATATGGTCCTTTCCAGTTAGCACTGCATTCGAAATTAATTAAATGCGATCACGACAGAAATCTGAATTTAGACGTCAGCGGCATAGACGTATATTTCTACGATTTTCCAAGAAACGACGTGGAAACTTTTACAATTGACAACGCTGCGAGAGGAATCCTCGACATAAAGGAACTCGATAAAACGAGGAAATTCATTATATTCGTTGCTGGATACAAATCCAATATCAATAAAAGAACCGAGGAAAGAGTTAGGGATACTTTTAGAAATTATCCAAACAGCTACTTGATTATCCTCGACCATTCAGAATACACGAACGATAAGCAAGGAAATATCAAAAGCTATGAAAGATCAGTTAAATACGTATTTTATATTGGAAGGGCATTAGCTCATATGCTAGTACGCTTAGAGGAAGGCGGCATATCTCCCAAAAATATACACTGCATCGGTCATAGTTTGGGTTCCCAGATTTTAGGCAATACTGGAGAAATCTTTTATAATATAACTGGGAAGAAGATTGCAAGGATTACGGCTCTGGACCCAGCCGGGCCTTGTTTTTCTAATAGCCTAATACAAGAACAAGTGAGGTCTGGCGTTGCAGATTATGTTGAAGTATATCACTGTAATGCAGGGGGATTGGGGACAACTAGTGTTCTAGGAGACGTAGATTTCTTCGTAAACAAAAAGGGCCAAAGCCAACCGAAATGCGGGACTCCACTAATACCAGGTGTATTCGACTCCTCGAAGGCAGCGAAATGTAACCACAGAGCCTGCATCGATCTTTGGACAGCGACGGTCGCAAATCCAAATTGGTATTTGGCCTGGAAATGTGATTCGTATAAAATGTTCAAAAATGGTGCGTGTGCTGCTAACGACGTCACCATCGCTGGTTTCTGGAATCCTGGTAATGCGACAGGTGTTTACTACTTCAGCACTAATGGCTATGACTACTAA

Protein sequence:

>DPOGS210832-PA
MKCVLILFCYFSYISAWGRGDLEKYGPFQLALHSKLIKCDHDRNLNLDVSGIDVYFYDFPRNDVETFTIDNAARGILDIKELDKTRKFIIFVAGYKSNINKRTEERVRDTFRNYPNSYLIILDHSEYTNDKQGNIKSYERSVKYVFYIGRALAHMLVRLEEGGISPKNIHCIGHSLGSQILGNTGEIFYNITGKKIARITALDPAGPCFSNSLIQEQVRSGVADYVEVYHCNAGGLGTTSVLGDVDFFVNKKGQSQPKCGTPLIPGVFDSSKAAKCNHRACIDLWTATVANPNWYLAWKCDSYKMFKNGACAANDVTIAGFWNPGNATGVYYFSTNGYDY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: