MonarchBase - Protein-coding gene

DPOGS210777
Transcript	DPOGS210777-TA	1725 bp
Protein	DPOGS210777-PA	574 aa
Genomic position	DPSCF300386 - 54209-84162
RNAseq coverage	1058x (Rank: top 12%)

Annotation
*Heliconius*	HMEL016544	3e-150	66.59%
*Bombyx*	BGIBMGA004215-TA	2e-76	87.18%
*Drosophila*	CG2991-PB	4e-105	38.77%
EBI UniRef50	UniRef50_Q7PVU7	5e-126	44.73%	AGAP009181-PA n=2 Tax=Pancrustacea RepID=Q7PVU7_ANOGA
NCBI RefSeq	XP_001602313.1	4e-143	45.97%	PREDICTED: similar to conserved hypothetical protein, partial [Nasonia vitripennis]
NCBI nr blastp	gi\|195030800	1e-126	44.06%	GH10682 [Drosophila grimshawi]
NCBI nr blastx	gi\|270009888	2e-114	41.91%	hypothetical protein TcasGA2_TC009208 [Tribolium castaneum]

Group
Gene Ontology	GO:0008270	3.2e-20	zinc ion binding
KEGG pathway	tca:657278	8e-114
	K03871 (VHL)	maps->	Pathways in cancer
			Ubiquitin mediated proteolysis
			Renal cell carcinoma
InterPro domain	[397-448] IPR011016	3.2e-20	Zinc finger, RING-CH-type
	[395-453] IPR013083	3.8e-15	Zinc finger, RING/FYVE/PHD-type
Orthology group	MCL15770		Insect specific

Nucleotide sequence:

>DPOGS210777-TA
ATGCGTTCTCTGTTAGCGTATTACGCTGATGCAGTGATGTTGGCTGCGAGGGGCACAGGCTGTGCTCTCGGCTGCAGCGGCCGCGGGGATTGCATGAACGGTACCTGCCTCTGTGAGATAAGATACTCGGGAGATGAATGCGCCGGTCCCAACTTGCCTTACCACGCCTGTATCGGTGGAGTTTTCCTCATGGTGGCGTTCGTGTGTGCCGTTCAGCTGACTGTGTGCGTGGTGACGGAGTATAAACGTCTGAAAGCCCCAACTATCCTCAGGGCATGTAAGGTCACCACACAGAAGATGCTCTACTTCGTAGCGTTCCTCGCGTCATTCATCCGCGGAGCATACTTTGTGTCACCCTCTGCCTTCCAAGAGGGTTGGGCAACCAGTCTTCTGTCAGCGTACTACCCTCTCATGATATCTGGGTCTTCGCTCATAGTCTGCTTCTGGGCTGAGGTGAGTCTAGACTTAATAACACTTCTTCGCGGAGAATTTCTCAAAGAGACTAAAGTCTGCACGATCATACTACCAAGACCCGGCCCATCTACGGCCGCTGAGGGTGACGACGTTCAAGATACGCTGGTCGCTAAGCAGGGTGTCCAGACAGATTTATCTGATGGCGATGGCAGTATAGACCCTCGATCAGTAAATCTGTCCCAGCTTCATCAGTCGCGGCTGGGGCTGGTCAGTCAGGCTCTCATGTTGATACTCATAGCTGGTTTCCTCGCATCGGAAACTCTCAGCGAATTCTGGAAGACGAAAGTGCCAGTAGTGTCACGTAATTGGCACGACCTGGTGTTCCGTTTGGCGGAGATTGGTGTAGCGCTATGGTTCCCGTGTGTGCTCTGGAACTGTATGGCTCCCGAACGTCTTTGGTTGTTGAACCCGCGCCGGTTGTTGGCGCGCCAGTTGGACGATGCCAGCTTGGCGGATCTATTGGCTAACAAGCGACCGGCTGATGCCAAGCCGGATATGACAGCCGATCTGAATTCCCAGAGCTTAGCCGAGTTTTCTCAACTGTCGTGGCGCGATAAGGCGCTATATGTCTGTCGGCTGGTCCAACATTGGCGATGGTGTCTTTGGACAGTTTTTCTCACCATGTTCGTTTATTCGAAACGCGTGAAATCTATCGCTGGGGCCGCTCCGAATGTCGAGACGGACTCTCTGGTTGGCAGCGTGGGTTCCCACCGCGACTGCTGGATCTGTTACGACAGCTCGCGCCAGGAGCCTCTCATCACGCCTTGCAGGTGTACAGGGGATGTCGCGGCTGTTCATCACGACTGCCTGAGTCGATGGCTCGTGGAGAGCGCTGCGACTCCGGACGGTCTCAAGTGTAAAGTATGCAACACGCCGTACATAGTTCAAGAGACGAACAGGGTTGAATGGGAGCGAGGGTTTACAGCTACACACTGGGTCCGCACAGGTCTTTGTGTGATGGCGATGTGTGGTGCTGGAGGTGCCGCCTGGGTCCTCGTCCAGCTGTTCCCTGCGCCTGTTCCTAGAGTTCTGGCAGCTGGAGCCGCCCTCCTCATATGCTATGTGGCCATCAGGTTTCTCAGCGTGAATACTGTGACAGCGTACCAGCGGGCGAAGGTCTCTTCCCTGCGCATCCTGACTGAACCCGTGGACGCATCAGACACACAACTATCGACTATCAGCAAGACGGTCACAGTTGATATACCGTCCAAGGCGGTACTGGAGCAGGCCTTGAAGGGAGACGTAAAGTAA

Protein sequence:

>DPOGS210777-PA
MRSLLAYYADAVMLAARGTGCALGCSGRGDCMNGTCLCEIRYSGDECAGPNLPYHACIGGVFLMVAFVCAVQLTVCVVTEYKRLKAPTILRACKVTTQKMLYFVAFLASFIRGAYFVSPSAFQEGWATSLLSAYYPLMISGSSLIVCFWAEVSLDLITLLRGEFLKETKVCTIILPRPGPSTAAEGDDVQDTLVAKQGVQTDLSDGDGSIDPRSVNLSQLHQSRLGLVSQALMLILIAGFLASETLSEFWKTKVPVVSRNWHDLVFRLAEIGVALWFPCVLWNCMAPERLWLLNPRRLLARQLDDASLADLLANKRPADAKPDMTADLNSQSLAEFSQLSWRDKALYVCRLVQHWRWCLWTVFLTMFVYSKRVKSIAGAAPNVETDSLVGSVGSHRDCWICYDSSRQEPLITPCRCTGDVAAVHHDCLSRWLVESAATPDGLKCKVCNTPYIVQETNRVEWERGFTATHWVRTGLCVMAMCGAGGAAWVLVQLFPAPVPRVLAAGAALLICYVAIRFLSVNTVTAYQRAKVSSLRILTEPVDASDTQLSTISKTVTVDIPSKAVLEQALKGDVK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: