MonarchBase - Protein-coding gene

DPOGS208821
Transcript	DPOGS208821-TA	5097 bp
Protein	DPOGS208821-PA	1698 aa
Genomic position	DPSCF300036 + 439445-461219
RNAseq coverage	165x (Rank: top 51%)

Annotation
*Heliconius*	HMEL004916	78.20%
*Bombyx*	BGIBMGA007928-TA	83.36%
*Drosophila*	sws-PA	61.63%
EBI UniRef50	UniRef50_D6W9Q7	61.40%	Putative uncharacterized protein n=1 Tax=Tribolium castaneum RepID=D6W9Q7_TRICA
NCBI RefSeq	XP_001120383.1	62.09%	PREDICTED: similar to swiss cheese CG2212-PA, isoform A [Apis mellifera]
NCBI nr blastp	gi\|328777223	61.09%	PREDICTED: neuropathy target esterase sws [Apis mellifera]
NCBI nr blastx	gi\|380030030	61.60%	PREDICTED: neuropathy target esterase sws-like [Apis florea]

Group
Gene Ontology	GO:0008152	4.1e-47	metabolic process
	GO:0006629	2.3e-20	lipid metabolic process
KEGG pathway
InterPro domain	[1275-1443] IPR016035	4.1e-47	Acyl transferase/acyl hydrolase/lysophospholipase
	[158-304] IPR018490	7.7e-26	Cyclic nucleotide-binding-like
	[152-291] IPR014710	3.1e-24	RmlC-like jelly roll fold
	[1282-1443] IPR002641	2.3e-20	Patatin/Phospholipase A2-related
	[183-277] IPR000595	1.3e-16	Cyclic nucleotide-binding domain
Orthology group	MCL10958		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS208821-TA
ATGGATGTGGTAGGTCTTTTAAATAACATAAATGATAAGACTGATATGTTTGCCGTTAAAACATGGACTTCAGAGTGGACAAATAGTTTTCAAGACAATCAAGTGCTGTGGTCATTCTGTGGCTGTTTGTTGGTTTCAGTTTTAGTCGTTTTTTTCTATTATTACAAAAGATGGAAATCAAAAGAGCCGGCTGGAGGCGCTGGGGCCACGGCTGCCGGGGAACCGGCGAAACGTTTCCGGAAACGCGACAAGATGTTATTTTATGGCAGACGTATGTTACGGAAGGTGAAGTCCATATCCAATTCCGGGCAGGGCAGGAAGCGGCGCGCCGTGATGAGGTTCGCCAGGAAGTTGCTGCAGCTGAAGAAAGAATCAGCTCCTGAACAATTGAAGGTCCTGGAACCCCCAGCGGAATATCTCGAAGAGGACTTGACGAATGATGATCGAGTCCCGCCAGACGCTCTCTACATGCTGCACAGCATACGAGTGTTCGGACACTTCGAGAAGCCAGTCTTCCTCATGCTCTGTAAACATACAGAGATATTGAACCTGCCCGCTGGATCTTTCCTCTTTAAAGTTGGTGATACAGATGAGAACGTGTACGTGGTTCAGAACGGCCGTGTGAACGTTTACATCACCAACCCTGATGGCAGCAGTCTGTCGCTGAAGATCGTCCGCGCCGGTGAGAGCGTCACCTCGCTCCTGAGTTTCACCGACGTGCTCACGGGTCACTCTCAGCCATACAAAACAGTGAATGCGAAGGCCCTAGAAGATTCCCAAGTCATTAAGTTACCAATGAGGGCTTTCCAAGAGGTCTTCAAGGAGTATCCAGACATATTTGTCAGAGTTATACAGATAATTATGGTGCGCCTCCAGAGAGTGACCTTCACAGCTCTCCACCAGTACCTGGGTCTCAGTGCTGAGTTGGTGAATCCCGGTCGTGAGAAACGCCGACCGGCCACAGCTCCTACGTCTTCACCAGCCAAGGTCAGGGTTGACAACACCCTGAACTCGCCGCACCATGAGAAGATCGAATTGGTGGAGGGATCTCAAGTCTCCTCTCCCATCCACATCCCCACCCGGAAGCGACCCGACATGGTACCGGATGTAACATCCAACACGCCCCAAAATACAACGCAGCTTCAACCGGACGTGCAACCAACATCATCGTTCCAAAGATCAAAAGAGGGCTCCTTTAAGAAACCAAATACTGACAATTTGGATGAGCAGGCTCTCATAAAGATTGCATCAGAGGCTTTCGTGAAGGAATTGGGTTTAGACAATGATCAGATACTGAAAGGGAATGTTCAAGTCAGAGATCTCCCGGCTGGGACTTACATCATGAAGGAGGAAAGTCACAAGGATGTAGCGCTAGTGTATCTATTGTCAGGCGCTCTGTTGGTGTCACAACGTGTGGCCGAGGGGGAGGGGGAGGTCCATATGTTCACCGCATATCCAGGTGAAGTGGAAGGCGGCCTGGCGGTGCTGACGGGGGAGCCGAGCTTCTTTTCAATACGAGCAAAGCATTTCTCTCGCATCGGTCTGTTGTCTAAGACAACGGTGTATAGTATTATGAGAGAACGCCCGTCCGTAGTACTTCACATAGCTAACACGGTAGTCAGAAGACTATCGCCTTTCGTTAGACAAGTGGATTTCGCCTTGGACTGGGTGTTCCTGGAATCAGGTCGGGCTGTGTACCGTCAGGACGAGGAATCCGGCTCAACGTTCATAGTACTCAGCGGACGACTTCGATCAGTCATCACGCACCCCAATGGAAAGAAGGAACTTGTTGGGGAATACGGCAAGGGCGATTTAGTTGGCATTGTGTTCCTGGAATCAGGTCGGGCTGTGTACCGTCAGGACGAGGAATCCGGCTCAACGTTCATAGTACTCAGCGGACGACTTCGATCAGTCATCACGCATCCCAATGGAAAGAAGGAACTTGTTGGGGAATATGGCAAGGGCGATTTAGTTGGCATTGTAGAGATGGTGACTCAAACCCGTCGCAGTACGACCGTCATGGCGGTGAGGGACTCCGAGCTCGCTAAACTCCCTGAAGGACTGTTCAACGCTATCAAGCTGCGGTTCCCCGTCGTGGTGACGCGACTGATCAATTTATTGGGTCACAGAATTCTAGGATCCTGGCAGAAGCCCACCCGCGGTCTGGGCACTGCTGCTATCGAGAGTCGCCCATCTCAACACAACTTCTCAACGGTGGCCGTGGTGCCCGTCAGTGACGACGTGCCGCTCACAGCATTCACTTACGAGCTATATCACTCACTGTGCGCTATCGGTCCGACGGTTCGTTTGACGTCTGACGTCATCCGAAAACTTTTGGGTTTGACCATAATGGATCCGAACAACGAGTATCGTCTCAGCTCCTGGCTCGCACAACAAGAGGACAAGCACAAAGTAGCGTTATATCAATGTGACCCAAGTCTCACTCAGTGGACCCAGCGATGCATTCGACAAGCAGATTGTATATTGATAGTAGCTCTTGGAGATAAGCAACCCAGTATCGGCAAAATTGAGAAAGAGATCGAGCGGCTAGCCATCCGTACTCAGAAGGAGCTAGTATTGCTACACCGTGAGGGAGGTCCCAACCCATCGGGGACTGTGCACTGGCTGAACATGAGGTCATGGGTCAGCCAGCACCATCACGTCCGCTGCCCCCACAGAATGTTCACCAGGAAGAGCCAGTATAGAATTAGTGAGCTGTACAGTAAAGTTCTGATGTCGGAGGCCAGCGTGCATTCAGATTTCTCTCGACTTGCTCGCTGGCTGACTGCCACGGCTGTAGGACTAGTGCTGGGAGGGGGCGGAGCCCGGGGCGCCGCACACGTCGGAATGATAAGAGCCATACAGGTGTTCCTGGAATCAGGTCGGGCTGTGTACCGTCAGGACGAGGAATCCGGCTCAACGTTCATAGTACTCAGCGGACGACTTCGATCAGTCATCACGCATCCCAATGGAAAGAAGGAACTTGTTGGGGAATATGGCAAGGGCGATTTAGTTGGCATTGTAGAGATGGTGACTCAAACCCGTCGCAGTACGACCGTCATGGCGGTGAGGGACTCCGAGCTCGCTAAACTCCCTGAAGGACTGTTCAACGCTATCAAGCTGCGGTTCCCCGTCGTGGTGACGCGACTGATCAATTTATTGGGTCACAGAATTCTAGGATCCTGGCAGAAGCCCACCCGCGGTCTGGGCACTGCTGCTATCGAGAGTCGCCCATCTCAACACAACTTCTCAACGGTGGCCGTGGTGCCCGTCAGTGACGACGTGCCGCTCACAGCATTCACTTACGAGCTATATCACTCACTGTGCGCTATCGGTCCGACGGTTCGTTTGACGTCTGACGTCATCCGAAAACTTTTGGGTTTGACCATAATGGATCCGAACAACGAGTATCGTCTCAGCTCCTGGCTCGCACAACAAGAGGACAAGCACAAAGTAGCGTTATATCAATGTGACCCAAGTCTCACTCAGTGGACCCAGCGATGCATTCGACAAGCAGATTGTATATTGATAGTAGCTCTTGGAGATAAGCAACCCAGTATCGGCAAAATTGAGAAAGAGATCGAGCGGCTAGCCATCCGTACTCAGAAGGAGCTAGTATTGCTACACCGTGAGGGAGGTCCCAACCCATCGGGGACTGTGCACTGGCTGAACATGAGGTCATGGGTCAGCCAGCACCATCACGTCCGCTGCCCCCACAGAATGTTCACCAGGAAGAGCCAGTATAGAATTAGCGAGCTGTACAGTAAAGTTCTGATGTCGGAGGCCAGCGTGCATTCAGATTTCTCTCGACTTGCTCGCTGGCTGACTGCCACGGCTGTAGGACTAGTGCTGGGAGGGGGCGGAGCCCGGGGCGCCGCACACGTCGGAATGATAAGAGCCATACAGGAGGCCGGCATTCCCATAGACATGGTGGGTGGAGTCAGCATTGGTGCTTTCATGGGGGCGTTGTGGTGTATGGACAGGAATATAACCACTGTGACACAGAAAGCTAGGGAGTGGTCCACGAAAATGACGCAATGGGGTAAGCAGCTCTTGGACCTGACATACCCGGCGACCTCTATGTTCTCCGGCAAGCAGTTCAACACAACCATAAGGACCACCTTCGGAGAGGTCCACATCGAGGACCTCTGGCTGCCGTACTTCACAGTCACTACAGACATTAGTTCCAGTTGTATGAGGATTCATAGACACGGTTCACTATGGCGTTACATACGCGCCTCGATGTCTTTGAGCGGGTACATGCCCCCACTCTGCGACCCCGTAGACGGCCACCTCCTATTGGACGGCGGTTACGTCAACAACCTCCCAGGGATGTTGTGGAGATATTGCCGCGCGTCTATGAGCATCGCCGGCATCTTCCCGCCGATATGCGACCCCATCGATGGACACTTGCTTCTGGACGGTTGCTATGTTAACAATGTGCCCGCTGATGTGATGAGATCACTCGGCGCCAAACACATTCTGGCTATAGACGTTGGTTCTCAAGATGACACGGATCTCACCAATTACGGTGACGACTTGTCCGGGTGGTGGTTGCTTTGGAAACGGTGGAATCCATTCACGACACCGGAAGTCAAGAAATCCGATTACTGCGAATACATACGCCCGCCAATAGACGCGTACAAGACGCTGCAGTTCGGATCGTTCGATGAGATCCGCGAGGTCGGCTACCGGCATGGATCGGCGTACTTCGAGGGCCAGAGACGTGGCGGCGGAGGCGGCGTCAGTGGTGCTGCTGCTGAGGGCAGGAAACACTCCGCACAGCCGGCCCTGACTGATTACACGTTCACGGATCTGGCGCAAATGGTGTGCTCAGTGAGGACAGCGCGAGACGACAACGACACCAGCTCGGAGTCCGACTACGAGGATCAGAGACACTTCGAGGGATACGCCTCCGAGCCCAGCGGTGGGATACTAGAGATGTCTTCCAGCGTTGAGGACGGCAACGCCTGGATCAGCGACACGGAACTGGAGGGTCTCAGGACCCGCCGTGTTGGAGGATCGCTCTCGTTATCGGAGGACGAAGTGGACTCCGAGGCCGAGATCTACGAGTCGATGAACAAACGGATCAGATGA

Protein sequence:

>DPOGS208821-PA
MDVVGLLNNINDKTDMFAVKTWTSEWTNSFQDNQVLWSFCGCLLVSVLVVFFYYYKRWKSKEPAGGAGATAAGEPAKRFRKRDKMLFYGRRMLRKVKSISNSGQGRKRRAVMRFARKLLQLKKESAPEQLKVLEPPAEYLEEDLTNDDRVPPDALYMLHSIRVFGHFEKPVFLMLCKHTEILNLPAGSFLFKVGDTDENVYVVQNGRVNVYITNPDGSSLSLKIVRAGESVTSLLSFTDVLTGHSQPYKTVNAKALEDSQVIKLPMRAFQEVFKEYPDIFVRVIQIIMVRLQRVTFTALHQYLGLSAELVNPGREKRRPATAPTSSPAKVRVDNTLNSPHHEKIELVEGSQVSSPIHIPTRKRPDMVPDVTSNTPQNTTQLQPDVQPTSSFQRSKEGSFKKPNTDNLDEQALIKIASEAFVKELGLDNDQILKGNVQVRDLPAGTYIMKEESHKDVALVYLLSGALLVSQRVAEGEGEVHMFTAYPGEVEGGLAVLTGEPSFFSIRAKHFSRIGLLSKTTVYSIMRERPSVVLHIANTVVRRLSPFVRQVDFALDWVFLESGRAVYRQDEESGSTFIVLSGRLRSVITHPNGKKELVGEYGKGDLVGIVFLESGRAVYRQDEESGSTFIVLSGRLRSVITHPNGKKELVGEYGKGDLVGIVEMVTQTRRSTTVMAVRDSELAKLPEGLFNAIKLRFPVVVTRLINLLGHRILGSWQKPTRGLGTAAIESRPSQHNFSTVAVVPVSDDVPLTAFTYELYHSLCAIGPTVRLTSDVIRKLLGLTIMDPNNEYRLSSWLAQQEDKHKVALYQCDPSLTQWTQRCIRQADCILIVALGDKQPSIGKIEKEIERLAIRTQKELVLLHREGGPNPSGTVHWLNMRSWVSQHHHVRCPHRMFTRKSQYRISELYSKVLMSEASVHSDFSRLARWLTATAVGLVLGGGGARGAAHVGMIRAIQVFLESGRAVYRQDEESGSTFIVLSGRLRSVITHPNGKKELVGEYGKGDLVGIVEMVTQTRRSTTVMAVRDSELAKLPEGLFNAIKLRFPVVVTRLINLLGHRILGSWQKPTRGLGTAAIESRPSQHNFSTVAVVPVSDDVPLTAFTYELYHSLCAIGPTVRLTSDVIRKLLGLTIMDPNNEYRLSSWLAQQEDKHKVALYQCDPSLTQWTQRCIRQADCILIVALGDKQPSIGKIEKEIERLAIRTQKELVLLHREGGPNPSGTVHWLNMRSWVSQHHHVRCPHRMFTRKSQYRISELYSKVLMSEASVHSDFSRLARWLTATAVGLVLGGGGARGAAHVGMIRAIQEAGIPIDMVGGVSIGAFMGALWCMDRNITTVTQKAREWSTKMTQWGKQLLDLTYPATSMFSGKQFNTTIRTTFGEVHIEDLWLPYFTVTTDISSSCMRIHRHGSLWRYIRASMSLSGYMPPLCDPVDGHLLLDGGYVNNLPGMLWRYCRASMSIAGIFPPICDPIDGHLLLDGCYVNNVPADVMRSLGAKHILAIDVGSQDDTDLTNYGDDLSGWWLLWKRWNPFTTPEVKKSDYCEYIRPPIDAYKTLQFGSFDEIREVGYRHGSAYFEGQRRGGGGGVSGAAAEGRKHSAQPALTDYTFTDLAQMVCSVRTARDDNDTSSESDYEDQRHFEGYASEPSGGILEMSSSVEDGNAWISDTELEGLRTRRVGGSLSLSEDEVDSEAEIYESMNKRIR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: