MonarchBase - Protein-coding gene

DPOGS210473
Transcript	DPOGS210473-TA	1347 bp
Protein	DPOGS210473-PA	448 aa
Genomic position	DPSCF300062 + 423322-425409
RNAseq coverage	231x (Rank: top 44%)

Annotation
*Heliconius*	HMEL021571	3e-170	89.91%
*Bombyx*	BGIBMGA002755-TA	3e-147	79.50%
*Drosophila*	Aos1-PA	3e-70	47.37%
EBI UniRef50	UniRef50_Q1HPK7	6e-145	79.50%	SUMO-1 activating enzyme n=146 Tax=Obtectomera RepID=Q1HPK7_BOMMO
NCBI RefSeq	NP_001040485.1	1e-145	79.50%	SUMO-1 activating enzyme [Bombyx mori]
NCBI nr blastp	gi\|298402207	9e-145	90.11%	SUMO-1 activating enzyme [Heliconius melpomene melpomene]
NCBI nr blastx	gi\|114052607	2e-145	79.50%	SUMO-1 activating enzyme [Bombyx mori]

Group
Gene Ontology	GO:0005488	1.3e-57	binding
	GO:0003824	2.9e-18	catalytic activity
	GO:0008641	6.8e-11	small protein activating enzyme activity
	GO:0006464	6.8e-11	protein modification process
KEGG pathway	phu:Phum_PHUM428030	5e-85
	K10684 (UBLE1A, SAE1)	maps->	Ubiquitin mediated proteolysis
InterPro domain	[10-311] IPR009036	1.3e-62	Molybdenum cofactor biosynthesis, MoeB
	[5-311] IPR016040	1.3e-57	NAD(P)-binding domain
	[33-162] IPR000594	2.9e-18	UBA/THIF-type NAD/FAD binding fold
	[38-62] IPR000011	6.8e-11	Ubiquitin/SUMO-activating enzyme E1
Orthology group	MCL14341		Single-copy universal gene

Nucleotide sequence:

>DPOGS210473-TA
ATGGTTGAAAATAATGAAGTCGAACTCTCAGAGGCAGAGGCTGAACAATATGATAGACAAATCCGTCTATGGGGCTTGGAATCCCAAAAGAGGTTACGCGCTTCTAAAGTTTTGATCATCGGCATGTCTGGCCTAGGAGCCGAAATAGCCAAAAATATTATACTATCAGGTGTGAAGAGTGTTTGTTTATTGGACAGTGAGAAACTCAAAGAAACAGATCTTTACTCACAGTTTTTGGCTCCTCCGGACAAAATAGGTGAAAACAGAGCCGAGACATCTTTACAGCGTGCAAGGGCTTTGAACCCAATGGTTGACGTCACTGCAGAGACGAAGGCTGTGGATGATCTTCCGGACAGCTACTTTGCGACTTTCGATATAATCTGCGCTACCGGTTTGAAGCAAGAGCAACTGGAACGAGTTAATAACATATGTCGCGACAACAACAAGAAATTTCTGTGTGGCGACGTCTGGGGCACGTTTGGATACATGTTTGCTGATTTAATTGACCATGAATATTCCGAGGAAATAGTTCAACACAAAGCTGTTAAACGTGGACCCGATGATAATGAAGCGAATGCTAGAGAAACTGTTAGTATCACTGTAAAGCGAAGAGCTATTTACGTTCCCTTACAAAACGCCTTATCTGTTGACTGGACCAAACCTGAATTACGATCTAGATTACGTAGAGGGGACCCATCATACTTTGTCATGAAGATTCTTTCAAGATTTAGAGATGAATACAACAGAAACCCTGATCCAGCGCAACGAAAAACGGAGACTGAAATATTGCTGCGTATGAGAGATGAACTTGTCAAGGAGCTGTCTCTTCCTGCTGGATTTATAAAGGATGCCTTACTGACAGATGTGTTTGGAATAGTATCTGGTGCTGCAGCGGTTGTGGGCGGAGTTATTGCCCAGGAAGTTGTGAAGGCTTCTATAGCACGATTTCCAGAAGCTGAAGATAAGATAAGGGTTGAAATGAATGTGGTGTCTGAAGTTGGCGATACAAGATACAGACTAGCAGCGGAAACAGCTGAAAAAGCTCAATTACTCACAGCTTTATTACCCGCTGCGCAGGACGCTGCGTCATATGATTTGAAAGAAATGTTACAAAGGTACAAAGATGTCATCTTATTAAATGAAGAGTTACTTGCGGGGTGCCACGTACGTAGGGCGACGCAGGAACAAACTCTGACGTCACTAAAGAACTTGCACACTATACTGCAACAAGCAGCTAGGTTGCGAGTTGGAAAATACAGCAAAATGGTTGTGAACGCATGCAGAAAAGCCGTCAGCGACAACAACACTGAGGCTCTCGTTAAAATACTACAAGCTGGGGATACTTAA

Protein sequence:

>DPOGS210473-PA
MVENNEVELSEAEAEQYDRQIRLWGLESQKRLRASKVLIIGMSGLGAEIAKNIILSGVKSVCLLDSEKLKETDLYSQFLAPPDKIGENRAETSLQRARALNPMVDVTAETKAVDDLPDSYFATFDIICATGLKQEQLERVNNICRDNNKKFLCGDVWGTFGYMFADLIDHEYSEEIVQHKAVKRGPDDNEANARETVSITVKRRAIYVPLQNALSVDWTKPELRSRLRRGDPSYFVMKILSRFRDEYNRNPDPAQRKTETEILLRMRDELVKELSLPAGFIKDALLTDVFGIVSGAAAVVGGVIAQEVVKASIARFPEAEDKIRVEMNVVSEVGDTRYRLAAETAEKAQLLTALLPAAQDAASYDLKEMLQRYKDVILLNEELLAGCHVRRATQEQTLTSLKNLHTILQQAARLRVGKYSKMVVNACRKAVSDNNTEALVKILQAGDT-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: