MonarchBase - Protein-coding gene

DPOGS210608
Transcript	DPOGS210608-TA	1191 bp
Protein	DPOGS210608-PA	396 aa
Genomic position	DPSCF300168 + 21415-23802
RNAseq coverage	1009x (Rank: top 13%)

Annotation
*Heliconius*	HMEL005900	3e-141	72.93%
*Bombyx*	BGIBMGA014413-TA	1e-99	65.22%
*Drosophila*	Hydr1-PC	8e-106	51.75%
EBI UniRef50	UniRef50_A1Z7Q7	1e-103	51.75%	Alpha/beta hydrolase 1, isoform A n=10 Tax=Diptera RepID=A1Z7Q7_DROME
NCBI RefSeq	XP_001647781.1	1e-108	50.26%	hypothetical protein AaeL_AAEL015298 [Aedes aegypti]
NCBI nr blastp	gi\|157126968	2e-107	50.26%	hypothetical protein AaeL_AAEL010695 [Aedes aegypti]
NCBI nr blastx	gi\|312381386	6e-104	51.75%	hypothetical protein AND_06325 [Anopheles darlingi]

Group
Gene Ontology	GO:0004091	1.4e-113	carboxylesterase activity
KEGG pathway
InterPro domain	[1-391] IPR012020	1.4e-113	AB-hydrolase YheT, putative
Orthology group	MCL12128		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS210608-TA
ATGTTAGGAATGTTCTGGTATATATTTGAAGTAAAGAAGGAGTTTCTAGTATGCTTTTCACTGTCTTTGCTGTATATAACCTATTATCTTGTGGAAGTCGTCAAGAAACCGATGCTGATATGTCGTAAGGGGGAATTCCGTCAATTACTAGAGGATAATGTTCCATTGTTGAGTGAGCCTTACTGGCCTACTCCTTGGTGCGTGGAATCTCGATTGCAAACTGTACTGGGCTCTGTTCTTCGGTCACATTTACTTCCACCAGTAGCTTACCGACGCGAGGTGCTGCGGCTGTCGGACGGCGGTCAGGTGGCTCTGGACTGGGCCGAGCTGGCGGATGGCGACAGGGAGAGCCGGCCCGTGCTGCTCGTGCTGCCCGGACTAACGGGCGGGGCGCAGGCGGACTACGTGCGCTGCCTGGTGGCGGCAGCGGCGCGTCTCGGGGCGCACGCGGTCGTCTTCAACAATCGCGGTCTCGGCGGTCTGCCGCTCACCACACCGCGGCTGTACTGCGCCGTGTCGCACGCGGACTTAGCGGAGGTGGTGGAGGCGGTGCGGCCTCGCGGCGCTCCCCTGCTGGCGGTGGGGGTGTCTCTGGGTGGCCTCATCCTCGGACACTATCTCACGGAGCACGCTCAGCGCGCCGCGCATACCTTGCACGCCGCGCTCGTGGTGTCTTCTCCGCTGGACGTCGTGCGGGGTGCGGAGTGTATCGAGCGGCCTCCTCTGAATTCCTTGTTGTCGTGGCACATGGCACGTAACCTCCGCAACACGGTGAACTCTCATTCTCCTCTCCGGAGCGGTCCCGGTGACTGGGCGGCCGTGGAGCGCTGCCGGTCCGTCCGTCAGTTCGACCAGGCCTTTACGACCAAACACTTCGGATTCCCTTCCGTCGACGACTACTACCGCGCGGCGACCCTCTGTGACAAGCTGAGCCGCGTGCGCGTGCCGCTCCTCTGCCTGTGCGCGGCTGACGACCCCTTCCAGCCCCTGGACGTGTTACCGCTGGCGGAGGTGGAAAGCAGTCCTTGCGTGGCGCTGGCGGTGACTGCTCGCGGCGGTCACATCGGCTTCCTGGAAGGTTGGTGGCCGGCACCCCCGTCCCGCTCTCCTCACTCGCAGTACATCGCTCGCCTCGCTCACCAGTACTTCGCGGCGCTGCTGTCGTCCCCGCGTCCCGTCAGCCCCCCCTGA

Protein sequence:

>DPOGS210608-PA
MLGMFWYIFEVKKEFLVCFSLSLLYITYYLVEVVKKPMLICRKGEFRQLLEDNVPLLSEPYWPTPWCVESRLQTVLGSVLRSHLLPPVAYRREVLRLSDGGQVALDWAELADGDRESRPVLLVLPGLTGGAQADYVRCLVAAAARLGAHAVVFNNRGLGGLPLTTPRLYCAVSHADLAEVVEAVRPRGAPLLAVGVSLGGLILGHYLTEHAQRAAHTLHAALVVSSPLDVVRGAECIERPPLNSLLSWHMARNLRNTVNSHSPLRSGPGDWAAVERCRSVRQFDQAFTTKHFGFPSVDDYYRAATLCDKLSRVRVPLLCLCAADDPFQPLDVLPLAEVESSPCVALAVTARGGHIGFLEGWWPAPPSRSPHSQYIARLAHQYFAALLSSPRPVSPP-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: