MonarchBase - Protein-coding gene

DPOGS208857
Transcript	DPOGS208857-TA	3120 bp
Protein	DPOGS208857-PA	1039 aa
Genomic position	DPSCF300009 - 2001127-2011363
RNAseq coverage	456x (Rank: top 27%)

Annotation
*Heliconius*	HMEL016786	63.24%
*Bombyx*	BGIBMGA012577-TA	82.10%
*Drosophila*	CG9153-PB	44.77%
EBI UniRef50	UniRef50_A7URT7	48.31%	AGAP006994-PB n=4 Tax=Anopheles RepID=A7URT7_ANOGA
NCBI RefSeq	XP_002425127.1	49.62%	hect E3 ubiquitin ligase, putative [Pediculus humanus corporis]
NCBI nr blastp	gi\|270002050	50.28%	hypothetical protein TcasGA2_TC000997 [Tribolium castaneum]
NCBI nr blastx	gi\|270002050	50.81%	hypothetical protein TcasGA2_TC000997 [Tribolium castaneum]

Group
Gene Ontology	GO:0006464	6e-127	protein modification process
	GO:0016881	6e-127	acid-amino acid ligase activity
	GO:0005622	6e-127	intracellular
KEGG pathway	phu:Phum_PHUM175050	0.0
	K10615 (HERC4)	maps->	Ubiquitin mediated proteolysis
InterPro domain	[711-1039] IPR000569	6e-127	HECT
	[1-377] IPR009091	1.5e-100	Regulator of chromosome condensation/beta-lactamase-inhibitor protein II
	[212-261] IPR000408	2.3e-15	Regulator of chromosome condensation, RCC1
Orthology group	MCL10418		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS208857-TA
ATGTTTTGCTGGGGCAATGCAACTCATCATGAACTCTGTATTGAATGTCCCGGCAACCTTGACCTGGTAATAAAGCCAACATTATCAAAATGGAAGGAGAGCAGCCATATTCAACAAATCTCAGCTGGAGAGTTCCATACATTGTATTTATCAAATAATGGTCATTTGTACACATGCGGCAGTAATGAAGTCGGCCAACTCGGCAGACAGACTAATTCAGCGGATGGAACATCTCCAGTTTTAGTAGACACATTTAAGGGTTGCACATTATCAACTATAGCTTGTGGCTTACAACATTCAATGGCACTTGATGAATGGGGGCAACCATTTAGTTGGGGTTCTGACAGTATGGGTCAATTGGGTAGCAACTTAGGTTCACACGCCCAAGATAAACCTAAAATTATAAAAACCCTGGCTACAAAAAATGTGATTCAAGTTGCTTGCGGATCCTACCACACAGTAGTCTTAACAAATAATGGTGATCTTTATGCATGGGGAGCTAACAGTTATGGTCAATGTGGTCTGGGAAATAGATCAAACAAGGAAACCACCCCACAGGCCTTATCATCTATACTCGGAATACCAATAGCTCTGATTGCTTGTGGCAGTAACCACACTTTTGCCTTATCACAGTCGGGTGCTGTTTTTGGATGGGGTAAAAATAGTCATGGACAACTGGGCTTGCAAGATAGAGAAAGTAGGTGCTATCCAACACATTTGAAGACATTAAGAAATGTTAAGGTTTGTCATATATCATGCGGCGAGGATTTTACAGCGTTCTTGACTCTAGACGGAGGTGTCTTCACGTGCGGTGCCGGCGAGTACGGTCAAACCGGACACGGTAATACTAAGGACGAACTGGTACCGAGGAAGGTGATGGAACTGATGGGTAGCACAGTCACTCAGGTCGCGTGCGGCCGTCGACACATGTTATGCCGCGTGGGGGAGCGTATCCTGGCGTGTGGGTACGGAGCCCGGGGTCAATTGGGATGTCCGCACATGGCCTTCGCCCTCGTCCCAACACCAGTGACCTTCACGCCAAATGACGAGTCTCCATTCTCACCAGAGATATTCAGTGGTCCGGTGAAGGTGTTTGCTGGTGGAGATCACAGCTTCCTTATTCTGAACAGTGAGAAATCTCCGGCAGACAGTCGAGTGGCCGATGCCAGTAAACAAATACTGTCACTTAGTAATGCCAAGCTCGTCCCATGTCTGGTGTTCAAGAATAACGATGTCGTTAGTCAGGATTTAATGGCCTATCTGGAGACGGTATTCGGCTCATTGGGTTGTATCAACAGTTCTTTTCTGTTGCCTCAAAATGGACACTTCGGTTGCAACACTAAGGTGCCAGGTGTTGATTTAAAGAAAGCTGAGGAGGCTTTTACATTGATTAGTAGAATTGAGAATTTAACTATACAGGAACTGATATTCAACAATTTAACGGAGAATATTATAAAGAAGGTGAAGGTGTCCCCACCAGATGCAGAGGCCTTGAGAGTTTTCTTATTACTGCCACTATACCATGAGATGAGGAACCCTCGCAGACATCCTGAGCTCCAGGGTCCATTCGCTGAGGCTTTCAACAATTTGTCGACTCACCCTCAGCGTATAGTGCAGTTGTGGTGGGAGGCTCAGTCTACTGATTACTTTGAGATGCTGGTTGACATCTTTAAGAGCGTCATCGTGTACGAGCTCATGCAGCCGGTGGTTAGAACCATTAAGAAAATCTATTTCACCAAGAGCATGGTCCAGATATTAAACACGTTGACGTCATTGAATAAAATAAATTTCACGAATCCAAAGAATCCCAAGATACCAGCTGAGTGTTTCTATATTGAGAACCTTTGTAACTACGTCGACATCGCAGCAGACTATATCAACTGGCTGTCGGATCAAGACTCGTCCCAGCCACATCTGTGTAACTACGCGTTCCTGTTTGATGTCCAATGCAAATCTCTACTATTGAAAATCGATCAGCAAGTGCAAATGCAAATCGCCGTGAATCTGGTGACAACACAAATATTCTCACGTCTCTTTATGGATCCGACTTACGAATATCAAAGGGATCAATTTCTCATATTAACAGTGTCGAGAAATCATTTAGTAAGGGACACGATGCTGCAAATAAGCAATCATGATACATCCCAATTGAAGAAACCTCTAAGAGTAGAATTTGTAGGCGAAGAGGCCGAGGACGCTGGTGGCGTTAAAAAGGAATTCTTTATGTTATTATTAAAAGAAATATTCGATCCAGTGTACGGAATGTTCAAACAGTCGGAGGAGACGAATATGATTTGGTTCTCAAACAACCCCTTCGAGGACGAGGTCATGTACTACTTGATAGGAGCTATATACGGTCTAGCGATATACAATTCAATAATCATCTACGTACCATTCCCACTAGTGCTGTACAAGAAACTGTTAGGTGAATCTGTTATGTTAGACGACCTATCTGATCTGTATCCGACGCTGGCCAGCAATCTGAAACACTTATTGGATTATCCCGACGAGGATGTCGAAGAGGTGTTCAGTTTGTGTTTCGCTGTGAACACTGAGGTCTTCGATCAAATACAAGTTCATCCTCTGAAGAAGAATGGTGAGAACATTTCAGTGACACATGAGAATAAGAACGAGTATGTTGATCTGTACGTTGATTTTCTTCTGAACAAATCTGTGGAAAATCAGTTCAGAGCTTTCAATCAAGGATTTCAAAAGGTATGTGGCGGTAGAATAATAAAGCTCTTCAGATCCCACGAGTTACAGTCCGTGGTGATAGGGAACGAGGAATACGACTGGGAGATGTTTGAGAACAACTGCGAGTACAAGAACGGGTACACGGCTACTGACCCGCAGATAAGATGGTTCTGGGAGGTTTTCCACGAGTTGCCGCTAGAGGATAAAAAGAAATTCCTATTATTCCTTACTGGCAGTGACCGCGTTCCCATTCAAGGAATGAGAGACATAAAGATAAGGATCCAGCCAGTAGCTGACGACAGATTCTTCCCAGTGGCTCACACGTGCTTCAACCTTCTAGACCTCCCTCGATACCAGACCAAAGAAAGACTCAAATATCACTTACTGATGGCGATACAACAGACGCAGGGTTTCTCGCTAGTATAG

Protein sequence:

>DPOGS208857-PA
MFCWGNATHHELCIECPGNLDLVIKPTLSKWKESSHIQQISAGEFHTLYLSNNGHLYTCGSNEVGQLGRQTNSADGTSPVLVDTFKGCTLSTIACGLQHSMALDEWGQPFSWGSDSMGQLGSNLGSHAQDKPKIIKTLATKNVIQVACGSYHTVVLTNNGDLYAWGANSYGQCGLGNRSNKETTPQALSSILGIPIALIACGSNHTFALSQSGAVFGWGKNSHGQLGLQDRESRCYPTHLKTLRNVKVCHISCGEDFTAFLTLDGGVFTCGAGEYGQTGHGNTKDELVPRKVMELMGSTVTQVACGRRHMLCRVGERILACGYGARGQLGCPHMAFALVPTPVTFTPNDESPFSPEIFSGPVKVFAGGDHSFLILNSEKSPADSRVADASKQILSLSNAKLVPCLVFKNNDVVSQDLMAYLETVFGSLGCINSSFLLPQNGHFGCNTKVPGVDLKKAEEAFTLISRIENLTIQELIFNNLTENIIKKVKVSPPDAEALRVFLLLPLYHEMRNPRRHPELQGPFAEAFNNLSTHPQRIVQLWWEAQSTDYFEMLVDIFKSVIVYELMQPVVRTIKKIYFTKSMVQILNTLTSLNKINFTNPKNPKIPAECFYIENLCNYVDIAADYINWLSDQDSSQPHLCNYAFLFDVQCKSLLLKIDQQVQMQIAVNLVTTQIFSRLFMDPTYEYQRDQFLILTVSRNHLVRDTMLQISNHDTSQLKKPLRVEFVGEEAEDAGGVKKEFFMLLLKEIFDPVYGMFKQSEETNMIWFSNNPFEDEVMYYLIGAIYGLAIYNSIIIYVPFPLVLYKKLLGESVMLDDLSDLYPTLASNLKHLLDYPDEDVEEVFSLCFAVNTEVFDQIQVHPLKKNGENISVTHENKNEYVDLYVDFLLNKSVENQFRAFNQGFQKVCGGRIIKLFRSHELQSVVIGNEEYDWEMFENNCEYKNGYTATDPQIRWFWEVFHELPLEDKKKFLLFLTGSDRVPIQGMRDIKIRIQPVADDRFFPVAHTCFNLLDLPRYQTKERLKYHLLMAIQQTQGFSLV-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: