MonarchBase - Protein-coding gene

DPOGS214809
Transcript	DPOGS214809-TA	1821 bp
Protein	DPOGS214809-PA	606 aa
Genomic position	DPSCF300059 + 394437-398110
RNAseq coverage	699x (Rank: top 18%)

Annotation
*Heliconius*	HMEL017289	84.26%
*Bombyx*	BGIBMGA012116-TA	86.70%
*Drosophila*	Uba2-PA	52.77%
EBI UniRef50	UniRef50_Q7Q8G9	58.70%	AGAP008637-PA n=11 Tax=Endopterygota RepID=Q7Q8G9_ANOGA
NCBI RefSeq	XP_001660971.1	62.52%	ubiquitin-activating enzyme E1 [Aedes aegypti]
NCBI nr blastp	gi\|157126839	62.52%	ubiquitin-activating enzyme E1 [Aedes aegypti]
NCBI nr blastx	gi\|345479249	61.69%	PREDICTED: SUMO-activating enzyme subunit 2-like [Nasonia vitripennis]

Group
Gene Ontology	GO:0005488	1.5e-73	binding
	GO:0003824	1.7e-39	catalytic activity
	GO:0008641	6.3e-25	small protein activating enzyme activity
	GO:0006464	6.3e-25	protein modification process
	GO:0005524	6.3e-25	ATP binding
KEGG pathway	aag:AaeL_AAEL010641	0.0
	K10685 (UBLE1B, SAE2, UBA2)	maps->	Ubiquitin mediated proteolysis
InterPro domain	[4-523] IPR009036	9.9e-100	Molybdenum cofactor biosynthesis, MoeB
	[377-439] IPR016040	1.5e-73	NAD(P)-binding domain
	[170-375] IPR023280	1.6e-64	Ubiquitin-like 1 activating enzyme, catalytic cysteine domain
	[19-150] IPR000594	1.7e-39	UBA/THIF-type NAD/FAD binding fold
	[337-401] IPR000127	6.3e-25	Ubiquitin-activating enzyme repeat
	[156-200] IPR019572	5.3e-23	Ubiquitin-activating enzyme
Orthology group	MCL14102		Single-copy universal gene

Nucleotide sequence:

>DPOGS214809-TA
ATGGTTGCGAGAGTAGCTGGTGTGTTTGACGAAAAGCTTACTGAAGCCATTGCAAATTCTAAAATCTTAGTAGTCGGTGCCGGCGGTATAGGTTGTGAAATATTAAAGAATCTCGTTTTGACAGGATTCCCTCAAATTGAAATCATCGACCTTGATACAATCGACGTAAGCAATCTAAATAGACAATTTTTGTTTCACAAAGAGCATGTGGGGAAATCAAAGGCACAGGTGGCCAAAGACAGTGCACTCAGTTTCAATCCCAACGTAAATATAGTTGCACATCATGACAGTGTTATTAGTAATGACTATGGGGTGAGTTATTTCAAGCAGTTCAATATTGTCCTGAATGCCTTGGATAACCGTGTTGCCAGAAATCATGTCAACAGAATGTGTCTTGCTGCAAACGTTCCTCTTATTGAAACGGGAACAGCTGGTTACGCTGGACAGGTGGAGCTTATAAAGAAGGGTGTGACACAGTGTTACGAATGCCAACCGAAGGCTCCACAAAAATCCTTCCCAGGTTGCACTATAAGGAACACCCCGTCTGAACCGATCCACTGCATTGTATGGGCCAAGCATCTTTTCAATCAACTGTTTGGTGAAGAGGACCCTGACCAGGATGTCAGTCCCGATACAGCTGACCCAGAAGCTGCGGGGGATGCAGGTTCAACTGCTCTAACATCAGAGAGCAGCTCAGGAAACGTTGAGAGGAAAAGTACAAGAACATGGGCCGCGGAAACCAATTATGATCCAGAAAAGTTATTTGCTAAGTTATTTGGTGATGATATCCGGTACCTGCTGTCAATGGAGAATCTGTGGAAGAAACGCAGGCCACCCACACCGTTATCCTGGGATAGCTTACCAGGGAAAGATAATATAGAAATACAACATTCAGGGTTGCCAGATCAAAGAGTGTGGTCTGTGTATGAATGTGCTCAGGTATTTGCTGCCAGTTGCAAAGCTCTTCAAACAGATCTTAAAAGTCGTCCTGAAGGTGATCATCTGGTTTGGGATAAAGATGAAAAGAGTGCTATGGACTTTGTCACTGCCTGTGCTAATATCAGATCACATATTTTCAATATTCCACTCAAATCACGATTTGAAATTAAATCTATGGCTGGTAATATAATACCAGCAATTGCCACAGCTAATGCAATCGTGGCGGGTTTGGCAGTATTACGCGCGCAGGCGTTACTAAAAGGAGAGCTTGAAACTTGTACTAGTGTTTATCTAAGACCTAAAGTCAACCACCGCGGACAACTATTTGTACCCGAAAAAACTTTAACACCACCAAATCCTAAATGTTATGTGTGTTCTCCGAAACCGGAAGTAGCATTAGCCTGTAACCTGAAACATCTTACACTTAAAGACCTCAATACGGCGTTCAAAGAAGGTCTTAACATGCAGGCTCCTGACGCTACAGTGGAAGGCAAAGGTCTTGTTGTACTCTCATCTGAGCCGGGCGAAACTGATCACAACAACGAAAAGACTTTAGAAGAAATCGGTCTAAACGACGGCTGTGCCTTACTGGTCGACGATTTCCTGCAAAACTACGAAGTACGAGTGCGCCTGCAGCAGGAGGACGAGGAAAAAACATGGCGCTTAGTTACAGACGCAGATTCGCCAATGCTCGGCCCGAAAGAGGAAAAGACCGCCAACGGTTCGAGCGGTTCCGAACCGAAACCCGGCCCGTCACGCTCCAAGGAAGACAGCGATAGTGACATGGAAATTATCGAGGAGGACGATGACGGTGAACCGAAACCGAAACCGCCAAAACGTAGGCGAACCGAAATGACCGATGAAGTAGTCGAACTCTGCTAG

Protein sequence:

>DPOGS214809-PA
MVARVAGVFDEKLTEAIANSKILVVGAGGIGCEILKNLVLTGFPQIEIIDLDTIDVSNLNRQFLFHKEHVGKSKAQVAKDSALSFNPNVNIVAHHDSVISNDYGVSYFKQFNIVLNALDNRVARNHVNRMCLAANVPLIETGTAGYAGQVELIKKGVTQCYECQPKAPQKSFPGCTIRNTPSEPIHCIVWAKHLFNQLFGEEDPDQDVSPDTADPEAAGDAGSTALTSESSSGNVERKSTRTWAAETNYDPEKLFAKLFGDDIRYLLSMENLWKKRRPPTPLSWDSLPGKDNIEIQHSGLPDQRVWSVYECAQVFAASCKALQTDLKSRPEGDHLVWDKDEKSAMDFVTACANIRSHIFNIPLKSRFEIKSMAGNIIPAIATANAIVAGLAVLRAQALLKGELETCTSVYLRPKVNHRGQLFVPEKTLTPPNPKCYVCSPKPEVALACNLKHLTLKDLNTAFKEGLNMQAPDATVEGKGLVVLSSEPGETDHNNEKTLEEIGLNDGCALLVDDFLQNYEVRVRLQQEDEEKTWRLVTDADSPMLGPKEEKTANGSSGSEPKPGPSRSKEDSDSDMEIIEEDDDGEPKPKPPKRRRTEMTDEVVELC-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: