MonarchBase - Protein-coding gene

DPOGS206593
Transcript	DPOGS206593-TA	2721 bp
Protein	DPOGS206593-PA	906 aa
Genomic position	DPSCF300048 - 1709696-1721846
RNAseq coverage	262x (Rank: top 41%)

Annotation
*Heliconius*			%
*Bombyx*	BGIBMGA008324-TA	3e-33	72.84%
*Drosophila*	CG11055-PC	2e-152	52.09%
EBI UniRef50	UniRef50_Q7QCC9	8e-163	53.70%	AGAP002567-PA n=1 Tax=Anopheles gambiae RepID=Q7QCC9_ANOGA
NCBI RefSeq	XP_975636.1	7e-158	56.22%	PREDICTED: similar to hormone-sensitive lipase [Tribolium castaneum]
NCBI nr blastp	gi\|347968094	3e-162	53.70%	AGAP002567-PA [Anopheles gambiae str. PEST]
NCBI nr blastx	gi\|347968094	4e-156	54.08%	AGAP002567-PA [Anopheles gambiae str. PEST]

Group
Gene Ontology	GO:0016042	4.8e-113	lipid catabolic process
	GO:0008203	4.8e-113	cholesterol metabolic process
	GO:0016298	4.8e-113	lipase activity
	GO:0016787	1.5e-30	hydrolase activity
	GO:0008152	1.5e-30	metabolic process
KEGG pathway	xla:100174796	5e-101
	K07188 (E3.1.1.79, LIPE, HSL)	maps->	Insulin signaling pathway
InterPro domain	[26-327] IPR010468	4.8e-113	Hormone-sensitive lipase, N-terminal
	[341-503] IPR013094	1.5e-30	Alpha/beta hydrolase fold-3
Orthology group	MCL14818		Single-copy universal gene

Nucleotide sequence:

>DPOGS206593-TA
ATGGAATTCGCGGAGCCCCCTGCGAAGGCATCATTATGCTGTGAGGATACTCCCGAAGGTTCTCCGCCGACGTATGCAATGTATGAGGCTTTAAAGGAATCGTGTCAGAATAATGCTAGTTATTTTCAACCTGATGACAGTGAGAATGGACAGCGATTGTACCAGGGCTTCATGACACTGATAGATCATATAGATACAGTTTGGCCTCTCGTGGATCACGTTCGAAAGGTGGCTCCGTTGTATGACTTCGATGCCAAATCTCCCGGCAATGGCTACCGTAGCTTCGTGTCCGTCGTGGATTCTTGCGTTTTGAATGGACTGAAATTGAGCCGTCAAGTATGCACCGGACGTGACGCGCTACTTTTTAGAAAAGGTTATTTTGTTAAGGAAGTTGAGTCTAACGGTCAGCTGCTAGCGTCTCTAGGAACTTGTCTCCACCACCTCCAGACCTTACTCTCGTGGGCTCCACCCGGGGAACTCTTCCCTACAGAACCCCATTCGCCCGAAGAACTGTTCTCACAAGCGGATACCATCAATCAGTATTGCTTTTACGGAAGATGTCTCGGATTTCAGTTTCTTCCATCCATGAGGAATATATTAAAGGGCATATCTATATGCATGGCCGGTTTCTCGGAAGCGTATTACAGTCACGGTAACTTGATCAGCTCAATGTGGACCGGGGGACAGTATCTCATAGACCCGGAGATGAGGGCGCGTCGTATCGTCAATATATCACAATCGGCGAGCGTTGAATTCTGCAAAGCTTTTTGGTTCCTCGCTGAGAGTGAAATAATGCGTAGAGTGCCGAGCTTGATGTCGTCGACGGTGGCTGTTAATAAATTAATAACAATACCACCAGAACCGCTGGCGGTGACGACGAAAGACGGGAAACAGCTGACAGTCCTGCCCCCAGAAGTACACATAGGGTTACAGGGATTAAATGTTAGGCTCATCAGTGTTAATAAAAGAATGGGAATGTCTGATGAAAGCTCATCGAATCTACCGCCAGCTGAGGGGGTGGTTTTTCATTGTCACGGAGGCGGTTTCGTCGCGCAGAGTTCGAAATCCCATGAGACGTATCTAAGAGAATGGGCCGCGAAATTGAACATGCCGATACTGTCCGTAGATTACAGCCTGGCCCCGCAGGCGCCGTTCCCGAGGGCTCTGGAGGAAGTGTATTACGCTTATTGCTGGTTGTTAAACAATTTCAAGCTAATCGGCACCACTGGTAAACGTATAGTATTTGCTGGGGATTCAGCCGGTGCGAACCTCATAGCCGGTTGCACCCTCAAGATCCTGTCTTCAGGACTTCGTACCCCCGAGGGTTTGTTCATGGCCTACGCCCCCTTACTAGTGAGCTTCATACCGAGTCCCGCAAGACTGCTGTGTCTCATGGATCCCTTACTTCCCTTCGGGTTTATGATGAGGTGTCTCAAAGCCTACGCAAGCCCCAACACTAAAGGTAAGGATGAAAAGCATCCGAACAAAGTGAACACGCCGTCGAACGCTACAAGCCCTGTCGAGGGCAACGGATTCCTTAGAGTGAGCCCATCCCAAGGTAAACGTATAGTATTTGCTGGGGATTCAGCCGGTGCGAACCTTATAGCCGGTTGCACCCTCAAGATCCTGTCTTCAGGACTCCGTACCCCCGAGGGTTTGTTCATGGCCTACGCCCCCTTACTAGTGAGCTTCATACCGAGTCCCGCAAGACTGCTATGTCTCATGGATCCCTTACTTCCCTTCGGGTTTATGATGAGGTGTCTCAAAGCCTACGCAAGCCCCAACACTAAAGGTAAGGATGAAAAGCATCCGAACAAAGTGAACACGCCGTCGAACGCCACAAGCCCTGTCGAGGGCAACGGATTCCTTAGGGTGAGCCCGTCCCAAGAGGGAATAAGCTCAGGACCGTCATCGTTCGAGGAGGTCTCGCCATCTGACCTCGCAGAACTTCAGGCGCACAAGTCCGGCAGTGAGAGGAGACAGTCTGCCGACACCACCATCAGCGGAGGGTCGCTGCTGAGCGAGCACACCGCCACCGGTATATCACCGACGGAGGACAAATCACAACAGTACGTATCAGACTTCCTCGACAAATACGTGTTCAATAGCGACACGGACTCTGAAGGGCGCAAATTGTCTGTTGTCAAAGCTAATAAGAAGTTACAGAGGGACACCGAATCTGAAAGCACACTCGTCGGTGAGCCTCCCCTCATACAAGACCAGGAACACAGAGATAAGAAAAGGATAAAGGCGCGTATAAGTGAAGCAGCTACCGGTTTAATGGGCGCCATGTCGTCAAGGCTAGCGTACATAACCGGTTCAAATAACATAAGGCCCACCCAAGAGGAGTTGTCAGTCCGTTCGAACCTGGACGCGCTGATAGCCCGCAGTCCGTCCGACGAGTTCATATTCTCTGTGCCACGTGACCCGCTCCTGTCGCCGTACTGGGCGGACGACGATCTACTAAAGAGGTTCCCACCCGTGAGGTTGTTGACTGTACATTTAGATCCTTGCCTTGACGACTGCGTGATGTTTGCTAAAAAACTTAAAGGTTTGGGCAACGAGGTGGGTATCGATGTCTTAGAGGGGCTGCCTCATGGATTCCTTAATTTCTCTCTTATGGCCAAAGAAGCGAACGAAGGTTCAAAACTTTGCGTGGAGCGCATAAAACAGTTGTTGGACTTGGAAAATCCTACGACGCCCGAGAACAATCATTTATGA

Protein sequence:

>DPOGS206593-PA
MEFAEPPAKASLCCEDTPEGSPPTYAMYEALKESCQNNASYFQPDDSENGQRLYQGFMTLIDHIDTVWPLVDHVRKVAPLYDFDAKSPGNGYRSFVSVVDSCVLNGLKLSRQVCTGRDALLFRKGYFVKEVESNGQLLASLGTCLHHLQTLLSWAPPGELFPTEPHSPEELFSQADTINQYCFYGRCLGFQFLPSMRNILKGISICMAGFSEAYYSHGNLISSMWTGGQYLIDPEMRARRIVNISQSASVEFCKAFWFLAESEIMRRVPSLMSSTVAVNKLITIPPEPLAVTTKDGKQLTVLPPEVHIGLQGLNVRLISVNKRMGMSDESSSNLPPAEGVVFHCHGGGFVAQSSKSHETYLREWAAKLNMPILSVDYSLAPQAPFPRALEEVYYAYCWLLNNFKLIGTTGKRIVFAGDSAGANLIAGCTLKILSSGLRTPEGLFMAYAPLLVSFIPSPARLLCLMDPLLPFGFMMRCLKAYASPNTKGKDEKHPNKVNTPSNATSPVEGNGFLRVSPSQGKRIVFAGDSAGANLIAGCTLKILSSGLRTPEGLFMAYAPLLVSFIPSPARLLCLMDPLLPFGFMMRCLKAYASPNTKGKDEKHPNKVNTPSNATSPVEGNGFLRVSPSQEGISSGPSSFEEVSPSDLAELQAHKSGSERRQSADTTISGGSLLSEHTATGISPTEDKSQQYVSDFLDKYVFNSDTDSEGRKLSVVKANKKLQRDTESESTLVGEPPLIQDQEHRDKKRIKARISEAATGLMGAMSSRLAYITGSNNIRPTQEELSVRSNLDALIARSPSDEFIFSVPRDPLLSPYWADDDLLKRFPPVRLLTVHLDPCLDDCVMFAKKLKGLGNEVGIDVLEGLPHGFLNFSLMAKEANEGSKLCVERIKQLLDLENPTTPENNHL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: