MonarchBase - Protein-coding gene

DPOGS201188
Transcript	DPOGS201188-TA	3894 bp
Protein	DPOGS201188-PA	1297 aa
Genomic position	DPSCF300262 + 63303-70683
RNAseq coverage	494x (Rank: top 25%)

Annotation
*Heliconius*	HMEL017137	0.0	72.35%
*Bombyx*	BGIBMGA014233-TA	2e-95	89.56%
*Drosophila*	CG42593-PA	1e-101	40.25%
EBI UniRef50	UniRef50_E1ZZC0	0.0	39.42%	E3 ubiquitin-protein ligase UBR3 n=6 Tax=Formicidae RepID=E1ZZC0_CAMFO
NCBI RefSeq	XP_001605178.1	0.0	41.21%	PREDICTED: similar to CG1531-PB [Nasonia vitripennis]
NCBI nr blastp	gi\|345481823	0.0	41.74%	PREDICTED: E3 ubiquitin-protein ligase UBR3-like [Nasonia vitripennis]
NCBI nr blastx	gi\|345481823	0.0	41.38%	PREDICTED: E3 ubiquitin-protein ligase UBR3-like [Nasonia vitripennis]

Group
KEGG pathway
Orthology group	MCL17055		Insect specific

Nucleotide sequence:

>DPOGS201188-TA
ATGACGTACATCCAGGCCAACTTCTGCAACTCCATGGTAGACATGGACATCTACTGGCTGCAGATCTGCGCCGCTCACCTGCCGGCCGACCAGTTCCTCGACATGTGTATTGATGTTTTCGGTGTCCGCGAGTGGCTGAGCATGACGCCCATGTCAGCGAGTCAGGCCTCCGAGCAGGACGCCATGGTGGAGGGACTGCTGACCTTCCTGGCGATACTGGTGTCCTCGCGGACCAACCTCGGTAACGACGAGCTGACCCAGTCCCGCCTGGAGGTGGCGACGCTCCTGGCCGCCGGCGACAAGACGCACTCGCAGCTGCTGGAGCTGATGCCGGAGAGGTCCGGGAACGCTCACACCAGGAACTTCGAGACCGTTCTCAAAGAGCTGTCAGTGTACCGCGCGCCCCCCAAGTGTTCGGAAAGCCTGGAGCAGGGTCTGTTCGTGCCGCGGGCCGTGGTGTGGACACGCTACTACGACCCGCTCCACGTGCTGAGGAGGGCCGTGCACAGGAGGGACTTCCACGCCTCCATGGACAGATTCACAGCCTTCGTCAGGGAGAAGCAGAAGTCTGAAGGGAGTCCCGGCACCTGCACGGGGACGCTCTGGCCGCCGCTGAGACCCGCCCTGCCCCCGCCCGAGGCCGCTGGGGACCCCAGGGAACTCTGCGCCTCTGGTGTGTTACACGGAGCCCTGCTGGCGGTGCTCCACCGCGGGGTCCGCCGTCGGGCGGCGGAGGGCGCCTCCGAGGCGGAGGGGGGCGCCGGTCCCCCCGCCCCGCCAGCCCCGCCTGACCACGTGCTCGCCCTGGCCGTGTACCTGCTGGCCGTGGCCGCCGACCTCGCCGCTGAGAGGCAGAAGACACATGACCGTGACGTGTGTGTGGCGGCGTGCGGGCGGGGAGCGGGCGGCCGCGTGTCGGGCGTGCCTCTGCTGCGGGCCTTCGCCGGCGGCTCGGTGTGTGACAACGCACGGACCGTGGTGGTCCGCGTGCCCCCCACCCCGGCCGCTGCACCCCCCGCCACCACCCTACATAGGCACACCGCCCCACAACACAATCACCACTCCGACAGTGAGACCGAGTGGGAGGGCGGGTCGGGGTCGGGCGAGGCGGGCCCGGGGTCTCACAAGACGGCCTCGCTCCAGGCCGGGGCCGGCACCGCGCTCGCCGTGCCACAGTCCACACAGATGATGCGCGGCCGGTCCGCGTCCGACGACCAGTCCTCGGACGCCGGAGGAGACACGCCGGAGATAAGAGCGCTGGAGCCGCTGTACCCTCAGACGGCGGGCGGCAGCACGGCTCTGGCGCTGCCCTCGCTCCCCGCCCTGCACGACGTGAACATGGGAGACGCGCTGGCTCTCACCACACATGCCCACGAAGACATCGACCCCGATGTAGACGTGCAGTACGAGCTGGAGGCAGCAGCGTGGCAAGACACGAGGCCGGCCCTGCCCGCGCCGCCCTCGCCCATGGTCAGCACGCCGCCCTCCACTGACACGCAGCTCCAGCTGCACACTCCTACCGACGAGCAGATCCCCGTCAACGAGTCCATCATATCCCTGCTGCTGAAGCTTCACTCGCAGCTGTCGGGGCGACTCGACTCCTTCTCGCTGGAGGAGCCGGCTATAGCCTGCGACGAACCTATCGGTGACGGGCCCCACTTCATCGGTCTCCTGGTGCACAAGCTGGCCGCCCTGGACGCGCGGTGTGCCGCCGCCGTGCAGCAAGTGAGGCGCGCGCTCTGGCCCCATCAGAGAGAGAGACAGGCGGAGCAGAGAGCGAGGGAGAGGAGGGAAAAGGAAGAGCGCTCCAGGAGGGCCAGGGACAGGCAGCAGCAGCTCATGAGGGAGTTCGCCAGGAGACAACAGCAGTTTATGTCGGCGATGGAGAGCATGGAGGGCGCACCCATGGAGTGGGAGGAGGAGGTGCAGAGGGACTACGACTGTGTTATCTGCAACACCACCGCGCCCACCACCCCACACGACCCTATAGGGCTCGTTGTACTGCTGCAGTCGACGTCGGTGCTGGGTCATCGTCGTCGTCGCGGCAGTGGCGGCGCTCGCCTGGCGCTGTGCGAGGCGGAGCGCGCCCGTCTCGCCCAGCAGCAGCACGCCACGGCGGCCGCTCACCACTACCGCCTGCACGACGAGCTCCACCAGCACTTCGACCAGGACTCGTGGGTGCTGTCGGTGTCGGTGGGCTGGGAGGGTGGCGTGGCGGCGCAGTCCTGCGGCCATCACCTCCACCTGCGCTGCCTCCGCTCCTATCTGCGCTCGCTGGCGGCTCCTCAGCGGCCTCACAACCTCCACGTGGAGCGCGGCGAGTTCCTGTGTCCTCTGTGTCGCCAGTTAGCTAACAGCGTGTTGCCACTCGCGCCCCCCGCCGTGCCCAGAAACCCCCCGCCCGCCCCCCTCCACCACCAGCTGGCGGCACAGGTGCTCGACATGTTGGAGAGAGACCACCCGGCCCCGAGTCCGAGTCGCCTGTCGGAGGCGATGGGGAAAGCGATGGAGGACATGACGGCGACGGCGGGCGGCAAGCTGAAGCAGCGCTACGGCTCCTCGCCCGCCGCCATCTTCACGTTCGTGGCGTCCCTGGTGAGGACCAACCTGGAGTGTGAGCTGGTGCAGCGAGGCGGCTCGCTCGTCCATCAACCCGCGCCGCGGTACAAGCCTCGCGACGACTGCATAGTCCCCCTCATCGCGGTGGCGGGTGCTCACGCCGTGGCGCTGTCCGCGGCCGGCGCGCGGCTCGGCGTGTCGGAGACGTGGCGCGCGCTGGTGCCCGCGGCCTGCAGCGGCGGCGATGGCCCAGCTGGGAGCGGCTCACCGGCCACGCTGCACGGCGCAGCCTCCCGCCCGGTACCGCTGCTGCTGAGAGACCCCACCGCACTGCTCATGCACTTCCTGCTGCTCGCCCCTGCCTCTCCGCCTCACATCGATATCCAACACTTCACGTGTATCGTCCGCGTGCTGTACACGCTCACGTACTATCAAGTGGTGAACCAGCTGTGTGCGTGCGGCACACTGAGTGCGGCGCTCCAAACGGCAAGCGGACGGGACGCCGGCAGCGGACTGGCGGAGGCGGCGCGGCTGCTGCTGGGGGCTCTGGACGGACATCACCTGCTGGACGACGAGGGAACCGCCGCAGACACCGCCCACCACCTGGACGCCGTGGAGCTGGAGGTCCAGGAGCTAGTGGTTCCGTTCCTCCGTATAGCGGCGCTCCTCCGTAAGCACATGTACGGGGCGGAGCTGCCTCACATCGCCAGAGAAGAGGACGAGTTCGTGGCGCTGTTGCGGTTCCTGGATCTGGCGGAGGCGGGCCCGGCCGACGCCGCGCTGCCCTCGGACGCGGCGAGCGCGGCGCGCGGCTGGGCGCGGCAGCTGGGTGCGGCCGCCGCCGGCGGGCAGCTGGGCGTGCAGCGCGTGGTGCGGTCCCTGCACGCGGACTGGGCGCCGCCGTCGCTGCTGGCCCTGCCGCGGGACTACGACCGCCTGTTCACGTACTACCACGAGCGCGTGTGCCTGCAGTGCGGCGCCGTGCCCAAGGAGGCGTCCGTGTGTCTGCTGTGCGGGACCCTGGTGTGCCTCAAGCAGCCGTGCTGCCGCCACCGCGCCGTGGCCGAAGCGGTGCAGCACGCGACCGACTGCGGCGGCGGCACCGGCATCTTCCTGGTGGTCACGTCCACGTACATCATAGTGATCCGCGGCCGGCGGGCCTGCCTGTGGGGCTCGCTCTACCTCGACGACTACGACGAGGAGGACCGCGACCTGAAGCGCGGCAAGCCGCTGTACCTGTCGCAGGACCGGCTGGAGCTGCTGCAGGCGCAGTGGCTCGCTCACCGCTTCGACCACACCAAGCGGACCTGGGTGTGGCACCGCGACTCGCTCTGA

Protein sequence:

>DPOGS201188-PA
MTYIQANFCNSMVDMDIYWLQICAAHLPADQFLDMCIDVFGVREWLSMTPMSASQASEQDAMVEGLLTFLAILVSSRTNLGNDELTQSRLEVATLLAAGDKTHSQLLELMPERSGNAHTRNFETVLKELSVYRAPPKCSESLEQGLFVPRAVVWTRYYDPLHVLRRAVHRRDFHASMDRFTAFVREKQKSEGSPGTCTGTLWPPLRPALPPPEAAGDPRELCASGVLHGALLAVLHRGVRRRAAEGASEAEGGAGPPAPPAPPDHVLALAVYLLAVAADLAAERQKTHDRDVCVAACGRGAGGRVSGVPLLRAFAGGSVCDNARTVVVRVPPTPAAAPPATTLHRHTAPQHNHHSDSETEWEGGSGSGEAGPGSHKTASLQAGAGTALAVPQSTQMMRGRSASDDQSSDAGGDTPEIRALEPLYPQTAGGSTALALPSLPALHDVNMGDALALTTHAHEDIDPDVDVQYELEAAAWQDTRPALPAPPSPMVSTPPSTDTQLQLHTPTDEQIPVNESIISLLLKLHSQLSGRLDSFSLEEPAIACDEPIGDGPHFIGLLVHKLAALDARCAAAVQQVRRALWPHQRERQAEQRARERREKEERSRRARDRQQQLMREFARRQQQFMSAMESMEGAPMEWEEEVQRDYDCVICNTTAPTTPHDPIGLVVLLQSTSVLGHRRRRGSGGARLALCEAERARLAQQQHATAAAHHYRLHDELHQHFDQDSWVLSVSVGWEGGVAAQSCGHHLHLRCLRSYLRSLAAPQRPHNLHVERGEFLCPLCRQLANSVLPLAPPAVPRNPPPAPLHHQLAAQVLDMLERDHPAPSPSRLSEAMGKAMEDMTATAGGKLKQRYGSSPAAIFTFVASLVRTNLECELVQRGGSLVHQPAPRYKPRDDCIVPLIAVAGAHAVALSAAGARLGVSETWRALVPAACSGGDGPAGSGSPATLHGAASRPVPLLLRDPTALLMHFLLLAPASPPHIDIQHFTCIVRVLYTLTYYQVVNQLCACGTLSAALQTASGRDAGSGLAEAARLLLGALDGHHLLDDEGTAADTAHHLDAVELEVQELVVPFLRIAALLRKHMYGAELPHIAREEDEFVALLRFLDLAEAGPADAALPSDAASAARGWARQLGAAAAGGQLGVQRVVRSLHADWAPPSLLALPRDYDRLFTYYHERVCLQCGAVPKEASVCLLCGTLVCLKQPCCRHRAVAEAVQHATDCGGGTGIFLVVTSTYIIVIRGRRACLWGSLYLDDYDEEDRDLKRGKPLYLSQDRLELLQAQWLAHRFDHTKRTWVWHRDSL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: