MonarchBase - Protein-coding gene

DPOGS213008
Transcript	DPOGS213008-TA	1482 bp
Protein	DPOGS213008-PA	493 aa
Genomic position	DPSCF300024 - 110668-114488
RNAseq coverage	218x (Rank: top 45%)

Annotation
*Heliconius*	HMEL008200	7e-154	78.82%
*Bombyx*	BGIBMGA006918-TA	0.0	70.82%
*Drosophila*	CG6294-PA	1e-32	31.88%
EBI UniRef50	UniRef50_E1ZW74	3e-82	48.99%	Putative zinc metalloproteinase YIL108W n=2 Tax=Formicidae RepID=E1ZW74_CAMFO
NCBI RefSeq	XP_001599746.1	5e-83	50.76%	PREDICTED: similar to conserved hypothetical protein [Nasonia vitripennis]
NCBI nr blastp	gi\|350426733	1e-82	51.04%	PREDICTED: putative zinc metalloproteinase YIL108W-like [Bombus impatiens]
NCBI nr blastx	gi\|350426733	5e-89	51.04%	PREDICTED: putative zinc metalloproteinase YIL108W-like [Bombus impatiens]

Group
Gene Ontology	GO:0017089	1.6e-34	glycolipid transporter activity
	GO:0051861	1.6e-34	glycolipid binding
	GO:0046836	1.6e-34	glycolipid transport
	GO:0005737	1.6e-34	cytoplasm
KEGG pathway
InterPro domain	[19-332] IPR021917	2.3e-82	Uncharacterised protein family, zinc metallopeptidase-like
	[332-488] IPR014830	1.6e-34	Glycolipid transfer protein domain
Orthology group	MCL15840		Insect specific

Nucleotide sequence:

>DPOGS213008-TA
ATGGTAATGGACAACCGAATAGATGAAGAAAATAAAAATGAACAAACCTCAGCAATTTTTATTACAAATTTTCAAAATGGGGAAACAATAAATTATTCTCTGGTTCTAATAAAAGGTTTAATAACAGTTGGACCATGTAACAATAACAAAATAAGATGTACAGTTGACAGCAACGGAAACAAAAACAGTTCAGATTGGGATGTTTGCAATAGAGAATTTAAAACGATAGTTTCTCTTAAGCTTGGTGAAAATAGTATTGAATTTGAATATATTGACCAAATAAAAGTAATAAAATTGTCATATGAACCCAGAAGAACTAATCTCAGAGTATGTCCCGTATATATCATATGTCAGGGACACGATGGGTGTTTTCAGAGTCCCCCCGATGTTGATAACAGTATTGAGAGCGCTTGTAAACGTATAGCTATTGGTGCCAAAATAATTCAAAGTCTAACCGCCGAAAAGCTATTCGAAAGTGGAGTAGGAAGAAAAACATTTCAACTTGAACATGAGGTTAATCAAAAAAGGGAAAGCTGTATTATATTTAAAAGCAACCTTAATGTAAACAAAGCCAGAAAAATGAGGCAAGGAGAACTATGGACCCATTTTGGCAGGGAACTAATGCTTTCAGATTTAGGAAGTAATGACAGAAAATTTTTAGGCTTTATTTCATGTACAAGATTCAAAGGAACGGATGTTGATAAGCCAATGACACATGAAGAAATTGTATTTCTCACAGAAGCTTATGCAGCATTGGGCGGTGGTGGACTGGCTTTATTTGGAACGGCTTGTATGTATACTTGGCCCAGTTCAGTAGAAGAAATCATTCCTAGATTCCTGGATCCCACGCCAGTTAATTCAAAACGGTTTATGGATGACAGTGGCTATAGGGGAACTTTGGGAGCATGTTTTGCAACAACTCTAGGTTCTGTTTTTCATGAATTAGGCCATACGTTTGATCTTGGTCATACAAAAGACGGTATAATGGGAAGAGACCGTCTTGGAAAAGTTTTTGCACCTGTAAAATATGATATGCAAGGAAATGTTGATAAAATAAAAAATCATTATGAATACAATGAGGATACTTGTTTGTTAGAATTAATGTTAGATGAATATTCTAAAGGAAAGAACACAGCGGCTGAAGGAGTCCTATGGTTAAATAGGGCACTGCTGTTTTTTGAATTGCTGTTCCAAGAGATGTTAGTAAGTCTTCAGGCAAAAGATTATGAAGTGAGCATGAAAAAAATATTTACAGTAGCTTATGAAGGTTCTGTAAAAAAGTATCATAGTTGGATCACACAACAACTTTTTAATTTTATGTGTAAAATGTCACCTACATTTATACAAATCCTGAAATCATTTGAGGTTGAGAATGATCTTAAAGGCTTTGAAATGCAACTAGCAAATTTTAATGCAACTTTACATGGAGTAAGAAGCAAAATTGATGAATTTTTTGAAAGGAATCCTGTTTGTGATCTATAA

Protein sequence:

>DPOGS213008-PA
MVMDNRIDEENKNEQTSAIFITNFQNGETINYSLVLIKGLITVGPCNNNKIRCTVDSNGNKNSSDWDVCNREFKTIVSLKLGENSIEFEYIDQIKVIKLSYEPRRTNLRVCPVYIICQGHDGCFQSPPDVDNSIESACKRIAIGAKIIQSLTAEKLFESGVGRKTFQLEHEVNQKRESCIIFKSNLNVNKARKMRQGELWTHFGRELMLSDLGSNDRKFLGFISCTRFKGTDVDKPMTHEEIVFLTEAYAALGGGGLALFGTACMYTWPSSVEEIIPRFLDPTPVNSKRFMDDSGYRGTLGACFATTLGSVFHELGHTFDLGHTKDGIMGRDRLGKVFAPVKYDMQGNVDKIKNHYEYNEDTCLLELMLDEYSKGKNTAAEGVLWLNRALLFFELLFQEMLVSLQAKDYEVSMKKIFTVAYEGSVKKYHSWITQQLFNFMCKMSPTFIQILKSFEVENDLKGFEMQLANFNATLHGVRSKIDEFFERNPVCDL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: