MonarchBase - Protein-coding gene

DPOGS200310
Transcript	DPOGS200310-TA	3879 bp
Protein	DPOGS200310-PA	1292 aa
Genomic position	DPSCF300026 - 71161-87241
RNAseq coverage	849x (Rank: top 15%)

Annotation
*Heliconius*	HMEL006365	0.0	55.62%
*Bombyx*	BGIBMGA005587-TA	0.0	66.13%
*Drosophila*	CG10254-PA	5e-83	41.16%
EBI UniRef50	UniRef50_E0VN24	0.0	44.39%	Ubiquitin-conjugating enzyme E2-230k, putative n=1 Tax=Pediculus humanus corporis RepID=E0VN24_PEDHC
NCBI RefSeq	XP_001120701.1	0.0	48.58%	PREDICTED: similar to CG10254-PA, isoform A [Apis mellifera]
NCBI nr blastp	gi\|350417866	0.0	45.36%	PREDICTED: hypothetical protein LOC100748178 [Bombus impatiens]
NCBI nr blastx	gi\|307184457	0.0	42.24%	Ubiquitin-conjugating enzyme E2 O [Camponotus floridanus]

Group
Gene Ontology	GO:0016881	1.1e-22	acid-amino acid ligase activity
KEGG pathway	ame:724799	0.0
	K10581 (UBE2O)	maps->	Ubiquitin mediated proteolysis
InterPro domain	[1022-1283] IPR016135	6.6e-60	Ubiquitin-conjugating enzyme/RWD-like
	[1053-1199] IPR000608	1.1e-22	Ubiquitin-conjugating enzyme, E2
Orthology group	MCL12463		Single-copy universal gene

Nucleotide sequence:

>DPOGS200310-TA
ATGGCGGGTCAAAATCCAGGTTCGCCTACCGATTTTCAATATTTTTACGAGGATGAAGTGTACAAAATCAATAACCGTGGCCAAGTCGTCTTCGGTCTGGTGTTGGAGAATTATGAAGCAAACTCAAGCGACCAAGAGAGCGACATCGAAACACCCATACAAAAAGGCGAAATTCGTGTTGTCTGGCACCCTTCGGGTACCGAACGTGTTATTTCGGAAAAATCGGTTGGTTTAGCCGATCGCTCGTTGATGCCAGGAGATGTTGTCCGTCGCCTTATAGCCGGGCGGGACACCCAGCGGGGTTATTGCAGGGATATAGTGATGACAGCGGCGCTCCAGATAGTCGGCACCAAGCACGTCATACCCAACGTGGCCAGCGAGAGGCTCCAGCCTTTGGAGGAATTCACTCCAGACCTGGCTGTCTGTCTTGATTCCTGGGTCGGATCGTCAAAGTCGGTTCACAGTAAACTGCGTCTAGTGTCATCGGATGGGTCTCGGTTGGAATATCCAGATCTGGACACGTGTCCATTGGAGGACTACTCGATGAGACGTCGACGTGCAACGCCGTACTCCTCGTCGGAGTTTTACCCGGGGCAGGTGGTGTACGGGCCACTGGGAGCCCTCGACACCGCCAACTGGCTGAACATGACCAAGGAAATGAAGGCAGCCAGGAAACATAAGATGCATGACCATAAGATGTTGCTCTCCCATGGCATGCGACCTTTGGCCCTGGACGAGGGCGGGTGGCTGCGGCCCGTTATGTTCGACCCCAGTTCTCGCATCGCCAGGGACACAGCATGCCAGATGGTGAAGAGTTTATGCGATTCCTACGAAAGGACGAAGGCTGTCCTGATATTATTGACGAGCTTCCTTCCCGAGGTCGGAACTGCCGGAGAGGCGAGCGAACAGTTTCTGCAACTCTATCAGAGTCTGGCGTCCGAGGCTCCTTGGAAACAGTTCCTGGCTTTACGTGGAGTGCTGCAACAGATCGCCGACCTTATGACCAAAGAGATAGATCAACTGCATCGTCTCGAAGAAACCACGCTAACATCCGACCTCGCTCAAGACGGCGGTAATGAGAAATTGGAATCTCTTGATGAAGCTTTAAAAGCTGATTCAAACTGTCCCAGTATTAAAATAGATCCTAGTGGAGATGTCGCGTTACCAGTAGTTAGTAGCATAGATGATACTGTCACTGAAGAGAAAAACGATTCCGGAATAAGTCCAGAGCCTCAAGAGGGGCGAAGGCCTGCTGGTTTGAATGGAGCCCCGCCAGACCAGGACGATGATTCAGATAACTGGGAGAACACCAGCAGCGATGGCAGTGATACAGACAGCGGCGCCACGTGGTCGTCTCGCTGTTCGTCCGCGGCGTCCGGTTCGGTCCGCGGGGCGAGGTCCCCGCAGCTGGCTGTCCGCTTACTACGAGGCAAGAGACTGAAGCGTGCGGTCCGTAGGGCTCCGCCCGCGCCGCCCCCACGACGGACGGATAGGGTCGTCGTGGAGACGCTACACACCACCAGCAGGGCTAACGTCGTTTGGCAGGACGGTACAATTGAAATGGGTATACCCTCAACACAGTTGTATCCTATCCATCACCTGGATGGTCAGGAATGTTTCCCAGGAGACTTCGTCATCAACGGCGCCGCTAGTGTAGAGGAAACTCAACAGCTGAAGCATAGAGAATACGGGGTGGTGCAGCGAGTAGATCATCATGGGCGGACTGCCATTGTACACTGGTATAGGACATACACCAGCGTAGACGAACCAGTGCCACAGATGTTGTTTGAGAGTGAGATGAGTGTATACGATCTCAAGGATCACCCTGATTTCCAATATCGTCCGGGAACTGTGGTCATCAGAGTTGCCAACTTCACTGGCGAAGACGCCAACTGTACCGCGGGACAGGTTATAGACAATTTTCCAACTGGCCGTGTTAAAGTGTGGTGGGTTGATGGACACACCAGTATGTGCTGGCCACAGGATTTATACAAGGTCGGTGAATATGACTCTGAAGACGGCGAGCTGTGGGGCTCCGAGGGCACTGTGTCCGAGGATTCGTGGGAAACACAGAGTTCTGCTCACGAGTTGGACCCACGTACACCTGACGCGCCTGTAGCCGCACCACCGGCCACTGCACCGACCTGGTCCGCACCTGCATCAGGTACAGCGGTGGCAACTCCTAGCGAGGAGGCTGGTCCTTTGCCGAAGCTGTTGGAGCCTCGCGTGGCGGCGCACATCGAGAGAGGACGAGTGGCTATGAGGAAACTAGAAGAGATCTTCGCTAAACAACCAACACTACAGAGCCAGGAGATTATGCGCAAGCTACTGAATCTCTATAAGGACTGCCGGTTCCTTGACAGATTGATGGGCACCACCTTCTTCCATGAAGATCACTTTTTGGGTCTATTGGAGCGGGTCCGCGAGCGTGGGGCGAGCACCCCTCGTGCTGGAGAGCGTCGTGTCCACGAACAGCTAGCTCGTCTGTTCAGCACCGAGCCCGCCGCTGACTTGGAACACGATGAGGATATGAAGATGGAAGACCGCACCCTCAGACCCATCGTAGCAGCTAATGTCACCGTGGAACCCATGGAGACAGAATTCTCATCACCAAAGAAGCCGCTGAATCTGAACATTGAACAGTCAGCGTCTTGTTCTGATACTAACGTCGCTGAAGGTCCCATTGAAAACTCTGCTGAAACAGAAGGCGAAGTTGTGTATAGCGGTTCCCGCAACGTTTGCTACAAGCTGTGCGCTCTCATACACCGACAGCTGGTCAAGGCGCACGCCGAAGTCAACCGGAGAAGGCCGCAAGAGTTGGCCGAATTCCTTAACAGCTTAATGAAAAAGCAAAAAGGGGGCGGGGAGAAGTTACCCTACCACTTTTCAGTTCAATACGAAGCCCTGGTGGTGTCGATGGTCGATCAGGCTGAGAAGGCGGAGGAGAAAGCATCCACTCATGAGGTCAAGGAACCCGTCGCCGACACGCCCAAGATGGAAACTGCTGGTCCGGAAGCGCCTCTAGCGTGTGCTGAAGGGGAGGGGGAGGGCGGTGTAGGGGGCGAGGGGTTCAGCGTGTTGGAGTCAGCACCCGCCGCACACAGATTCAGACTGTCCATGTTACAACCCTCGGAGCCGAGGAGCTTTTACTCCGCTGTGAAGAGAGAGATCAAATTGTTGAAGAGCGATCTACCACCGGGGGTGTGGGTTCGTGGCTACGAGGACCGTATAGACCTTATATCTGTGATGATAGCCGGCCCGGCCCGCACGCCCTACGAGGGCGGCCTGTTTGTGTTCGACGTTCAGCTCGGCGGGGAGTACCCTAGGGCTCCGCCCCTGTGTCACTACCACTCATACTGCTCTGACAGACTCAACCCTAATCTGTATGAGGATGGAAAGGTGTGTGTATCTCTCCTGGGGACCTGGTCGGGTCGCGGAGTCGAGGTCTGGGGGAAAGATAGTTCCTTGCTGCAGGTTATCGTGTCCCTGCAGGGGCTCATACTGAACGCAGAGCCCTACTTTAATGAAGCTGGTTACGAAAAACAGAAAGGCACCCAGCAGGGTGAGGAGAATTCGCGTATGTACAACGAGATGGTGCTGTTAAAGTTGGTGCAGTCTATGACTAAGATGGTTATGAACCCGCCGGAGCCGTTCCGCGAAGAGATCCTGCAGCATCTGCGTGCGTCCGCTGCAAGTCTCTGCCGTCGACTGGAGGGGCTGGTTTCTCTGTCCAACGGCCAGCCGTGCGACCTCCCTCCCCCCGACTACCCCCTCATCCCCGCCTCCCGCGGCTTCTGCCTCACCCTCCGCTCCTCGCTGGAGTCCTTCCGCAACGCGCTCCGTAAGAACGACATCACAGTCCCCCCCACCACGTTATAG

Protein sequence:

>DPOGS200310-PA
MAGQNPGSPTDFQYFYEDEVYKINNRGQVVFGLVLENYEANSSDQESDIETPIQKGEIRVVWHPSGTERVISEKSVGLADRSLMPGDVVRRLIAGRDTQRGYCRDIVMTAALQIVGTKHVIPNVASERLQPLEEFTPDLAVCLDSWVGSSKSVHSKLRLVSSDGSRLEYPDLDTCPLEDYSMRRRRATPYSSSEFYPGQVVYGPLGALDTANWLNMTKEMKAARKHKMHDHKMLLSHGMRPLALDEGGWLRPVMFDPSSRIARDTACQMVKSLCDSYERTKAVLILLTSFLPEVGTAGEASEQFLQLYQSLASEAPWKQFLALRGVLQQIADLMTKEIDQLHRLEETTLTSDLAQDGGNEKLESLDEALKADSNCPSIKIDPSGDVALPVVSSIDDTVTEEKNDSGISPEPQEGRRPAGLNGAPPDQDDDSDNWENTSSDGSDTDSGATWSSRCSSAASGSVRGARSPQLAVRLLRGKRLKRAVRRAPPAPPPRRTDRVVVETLHTTSRANVVWQDGTIEMGIPSTQLYPIHHLDGQECFPGDFVINGAASVEETQQLKHREYGVVQRVDHHGRTAIVHWYRTYTSVDEPVPQMLFESEMSVYDLKDHPDFQYRPGTVVIRVANFTGEDANCTAGQVIDNFPTGRVKVWWVDGHTSMCWPQDLYKVGEYDSEDGELWGSEGTVSEDSWETQSSAHELDPRTPDAPVAAPPATAPTWSAPASGTAVATPSEEAGPLPKLLEPRVAAHIERGRVAMRKLEEIFAKQPTLQSQEIMRKLLNLYKDCRFLDRLMGTTFFHEDHFLGLLERVRERGASTPRAGERRVHEQLARLFSTEPAADLEHDEDMKMEDRTLRPIVAANVTVEPMETEFSSPKKPLNLNIEQSASCSDTNVAEGPIENSAETEGEVVYSGSRNVCYKLCALIHRQLVKAHAEVNRRRPQELAEFLNSLMKKQKGGGEKLPYHFSVQYEALVVSMVDQAEKAEEKASTHEVKEPVADTPKMETAGPEAPLACAEGEGEGGVGGEGFSVLESAPAAHRFRLSMLQPSEPRSFYSAVKREIKLLKSDLPPGVWVRGYEDRIDLISVMIAGPARTPYEGGLFVFDVQLGGEYPRAPPLCHYHSYCSDRLNPNLYEDGKVCVSLLGTWSGRGVEVWGKDSSLLQVIVSLQGLILNAEPYFNEAGYEKQKGTQQGEENSRMYNEMVLLKLVQSMTKMVMNPPEPFREEILQHLRASAASLCRRLEGLVSLSNGQPCDLPPPDYPLIPASRGFCLTLRSSLESFRNALRKNDITVPPTTL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: