MonarchBase - Protein-coding gene

DPOGS210841
Transcript	DPOGS210841-TA	1119 bp
Protein	DPOGS210841-PA	372 aa
Genomic position	DPSCF300027 + 98981-102281
RNAseq coverage	426x (Rank: top 29%)

Annotation
*Heliconius*	HMEL020832	2e-123	64.55%
*Bombyx*	BGIBMGA003917-TA	8e-111	60.88%
*Drosophila*	CG18258-PA	3e-28	33.57%
EBI UniRef50	UniRef50_D2SNY6	3e-55	68.39%	Neutral lipase (Fragment) n=1 Tax=Heliothis virescens RepID=D2SNY6_HELVI
NCBI RefSeq	XP_319851.4	1e-27	31.27%	AGAP009101-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|260908058	1e-54	68.39%	neutral lipase [Heliothis virescens]
NCBI nr blastx	gi\|260908058	2e-55	68.39%	neutral lipase [Heliothis virescens]

Group
Gene Ontology	GO:0003824	1.1e-45	catalytic activity
	GO:0006629	1.1e-45	lipid metabolic process
KEGG pathway	ssc:100157809	5e-23
	K01046 (E3.1.1.3)	maps->	Glycerolipid metabolism
InterPro domain	[74-328] IPR000734	1.1e-45	Lipase
	[45-310] IPR013818	2e-43	Lipase, N-terminal
Orthology group	MCL21188		Lepidoptera specific

Nucleotide sequence:

>DPOGS210841-TA
ATGGCTCGCCTATTATGTTTTTTAACTCTTTTTCTGTTTTTCAATGCAGAGGCTAATTGGGTTGCAGAATATGGGCCCTTTAAAACTTTTCTATATTCTGATTGGATAACATGTGATCGTAATACGAGTAAGCAAACCGATCTAGTAGTGGATGATGCACAAGTATTTTTTTATGATTTTCAAAATAATATCAATTATACTCATACAATAAACTACGCTGCGGAGACACTAAATAATGTTTACAACTTAGATGTTACGCGACGGCTTATAGTGTTCATCCCCGGGTATAAGTCGCACATCAATCGGAACGCTCCAGAGCTTATAAAGGCTGCCTTCAAAGATGTACCAAATATTTATCTCATTGTAATAGATCATTCGATTTATACGTCATCTAAAGGGGGACGACTAAAAAGTTATGAGCGTTCCGTAACCTATACATATCCTTTAGGTGTAATTGTTGGAGAATTTTTAGCTAAGTTGAGGAATGTGGGATTTTCGTCCAAAAATATTCACTGTATTGGTCACAGTTTGGGAGGACAAATTTTAGGCTACGCAGGAACGAAATACTTCAAGGTTACGGCAGAAAAAATATGGAGAATTACCGGAATTGACCCAGCGGGACCTTGCTTTTCCAATTCATTAATTGACGAGCAATTAAGATCCGGCGTTGCGGAATATGTTGAAGTTTATCATTGTAATGCGGGAGGCTTGGGAACAACCAGCGTTCTAGCTGACATAGACTTCTTCATTAACAATGGAAAAGTTCAGCCCAACTGTGACGGAAGTTTTCTCTCGTTAGGGGATTCAGATGCGAAGTGCAGTCACAAATCTTGTGTGAAATATTGGACAGAAACAGTTCAACATCCTGGATGGTATTTGGCCTGGAAATGCGATTCATACAAGCTGTTTTCGGAAGGAAAATGTGCTGGTAACGAAGTGACCATCGGTGGATATACAAATCCAGATGCCACAGGAGCGCTTTTCCGTGTTACCGAAGCGCCCCAAAGGATTTTCGAACCCTCAGGAGGGTGCATCGATAAATTAGACGACGGAGAACACCCTGACAACGCAAGGCGTTTTTCGGTGAAAGCGTTTATCCTTCTGGGGCTTAACGAATAA

Protein sequence:

>DPOGS210841-PA
MARLLCFLTLFLFFNAEANWVAEYGPFKTFLYSDWITCDRNTSKQTDLVVDDAQVFFYDFQNNINYTHTINYAAETLNNVYNLDVTRRLIVFIPGYKSHINRNAPELIKAAFKDVPNIYLIVIDHSIYTSSKGGRLKSYERSVTYTYPLGVIVGEFLAKLRNVGFSSKNIHCIGHSLGGQILGYAGTKYFKVTAEKIWRITGIDPAGPCFSNSLIDEQLRSGVAEYVEVYHCNAGGLGTTSVLADIDFFINNGKVQPNCDGSFLSLGDSDAKCSHKSCVKYWTETVQHPGWYLAWKCDSYKLFSEGKCAGNEVTIGGYTNPDATGALFRVTEAPQRIFEPSGGCIDKLDDGEHPDNARRFSVKAFILLGLNE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: