MonarchBase - Protein-coding gene

DPOGS204817
Transcript	DPOGS204817-TA	1422 bp
Protein	DPOGS204817-PA	473 aa
Genomic position	DPSCF300221 - 983-7438
RNAseq coverage	207x (Rank: top 46%)

Annotation
*Heliconius*	HMEL007427	0.0	83.20%
*Bombyx*	BGIBMGA001417-TA	0.0	82.79%
*Drosophila*	ari-1-PC	2e-171	63.39%
EBI UniRef50	UniRef50_Q9Y4X5	8e-173	65.91%	E3 ubiquitin-protein ligase ARIH1 n=104 Tax=Metazoa RepID=ARI1_HUMAN
NCBI RefSeq	XP_971560.1	0.0	75.56%	PREDICTED: similar to ariadne ubiquitin-conjugating enzyme E2 binding protein [Tribolium castaneum]
NCBI nr blastp	gi\|270014562	0.0	75.77%	hypothetical protein TcasGA2_TC004596 [Tribolium castaneum]
NCBI nr blastx	gi\|270014562	0.0	75.31%	hypothetical protein TcasGA2_TC004596 [Tribolium castaneum]

Group
Gene Ontology	GO:0008270	2.5e-22	zinc ion binding
KEGG pathway
InterPro domain	[204-265] IPR002867	2.5e-22	Zinc finger, C6HC-type
Orthology group	MCL11058		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS204817-TA
ATGGACTCTGAAGATGACACAAAAGACGATGTCGATTCTGGTAATGAGTCCAGCGGAGACGATGTCGACTTTGTCATGGACGAGACTCACAGTACAAGGGAACGACAAACGGAACTCGAAGAATATCCGTACGAGGTGTTATCTACAGAGGAAATCGTTCAACATATGGTAGATTGCATAAAAGAAGTGAATACAGTAGTTGAGAGAATGCAGTGGGCCCTTACCCATCGAAACTGGAGTGAAGAAGACTTCAAAAGAGTTCTATGGACAGATGAGTCCAAATTTGAAGTGCTTGGGAGCAAAAGACGTGTTTTTGTTCGGCGGAGTGCCAAGGAAAAGATGATGCCAGACTGTATCCTGCCCACAGTGAAGCATGGCGGTGGTTCCATTATGGTTTGGGGTTGTTTCTCGAGCCGTGGAACTGGAGATTTGATTATGACCGGTCTGGAATGTGGTCACAGATTCTGTACACAGTGCTGGTGTGAATATTTAACTACTAAAATAATGGAAGAAGGCCTGGGTCAGACGATAGCGTGTGCGGCACACGCGTGCGACATTCTCGTGGATGACGCGACTGTGATGCGTCTCGTCAGAGATCCGAGGGTCAAACTCAAGTACCAGCACATCATCACCAACAGTTTCGTAGAGTGTAACCGCCTCCTCCGCTGGTGTCCATCCCCCGACTGCAGCAATGCCATCAAAGTGGCCTATGTTGAGGCAGCGGCAGTAACCTGCCGATGTGGTCACACGTTCTGTTTCGCCTGCGGTGAGAACTGGCACGATCCCGTCAGGTGCTGTCTGCTGAGGAAGTGGATAAAGCTTGAAACATCGAACTGGATAGCGGCCAATACTAAGGAGTGTCCCAAATGTAACGTGACCATAGAGAAGGACGGCGGCTGTAACCACATGGTGTGTAAGAATCAGAACTGTAAGGCCGACTTCTGCTGGGTGTGCCTCGGACCCTGGGAGCCTCACGGCAGCAGCTGGTACAACTGCAACCGGTATGACGTGGACGAGGCCAAAGCGGCCCGCGACTCCCAGGAGCGCTCGCGTGCAGCGCTGCAGCGCTATTTGTTCTACTGCAACCGCTATATGAACCACATGCAATCGCTGCGCTTCGAGTCCAAATTGTACGCATCCGTGAAGGAAAAGATGGAAGAGATGCAACAGCATAACATGAGCTGGATTGAGGTGCAATTCTTAAAGCGAGCTGTGGACATCCTCTGCCAGTGCCGTCAGACCCTCATGTACACTTATGTGTTCGCGTACTACTTGAGGAAGAACAATCAGTCTGTCATCTTCGAGGATAACCAACGCGACCTGGAATCGGCCACCGAGACTCTATCGGAATACCTGGAAAGAGACATCACTAGCGAGAATTTGGCTGACATCAAGCAGAAAGTGCAGGATAAGTACAGGTAA

Protein sequence:

>DPOGS204817-PA
MDSEDDTKDDVDSGNESSGDDVDFVMDETHSTRERQTELEEYPYEVLSTEEIVQHMVDCIKEVNTVVERMQWALTHRNWSEEDFKRVLWTDESKFEVLGSKRRVFVRRSAKEKMMPDCILPTVKHGGGSIMVWGCFSSRGTGDLIMTGLECGHRFCTQCWCEYLTTKIMEEGLGQTIACAAHACDILVDDATVMRLVRDPRVKLKYQHIITNSFVECNRLLRWCPSPDCSNAIKVAYVEAAAVTCRCGHTFCFACGENWHDPVRCCLLRKWIKLETSNWIAANTKECPKCNVTIEKDGGCNHMVCKNQNCKADFCWVCLGPWEPHGSSWYNCNRYDVDEAKAARDSQERSRAALQRYLFYCNRYMNHMQSLRFESKLYASVKEKMEEMQQHNMSWIEVQFLKRAVDILCQCRQTLMYTYVFAYYLRKNNQSVIFEDNQRDLESATETLSEYLERDITSENLADIKQKVQDKYR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: