MonarchBase - Protein-coding gene

DPOGS210128
Transcript	DPOGS210128-TA	2487 bp
Protein	DPOGS210128-PA	828 aa
Genomic position	DPSCF300017 + 1703687-1720512
RNAseq coverage	180x (Rank: top 49%)

Annotation
*Heliconius*	HMEL021144	2e-141	70.99%
*Bombyx*	BGIBMGA000234-TA	0.0	80.42%
*Drosophila*	Papss-PD	4e-170	63.86%
EBI UniRef50	UniRef50_O43252	4e-172	63.68%	Bifunctional 3'-phosphoadenosine 5'-phosphosulfate synthase 1 n=238 Tax=cellular organisms RepID=PAPS1_HUMAN
NCBI RefSeq	XP_321893.4	0.0	66.89%	AGAP001256-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|158302328	0.0	66.89%	AGAP001256-PA [Anopheles gambiae str. PEST]
NCBI nr blastx	gi\|347965594	2e-178	66.89%	AGAP001256-PC [Anopheles gambiae str. PEST]

Group
Gene Ontology	GO:0000103	2.8e-106	sulfate assimilation
	GO:0004781	2.8e-106	sulfate adenylyltransferase (ATP) activity
	GO:0005524	1.3e-72	ATP binding
	GO:0016301	1.3e-72	kinase activity
	GO:0016772	1.3e-72	transferase activity, transferring phosphorus-containing groups
KEGG pathway	aga:AgaP_AGAP001256	0.0
	K13811 (PAPSS)	maps->	Purine metabolism
			Selenoamino acid metabolism
			Sulfur metabolism
InterPro domain	[443-816] IPR002650	2.8e-106	Sulphate adenylyltransferase
	[606-824] IPR014729	2.5e-81	Rossmann-like alpha/beta/alpha sandwich fold
	[59-213] IPR002891	1.3e-72	Adenylylsulphate kinase, C-terminal
	[420-591] IPR015947	7.8e-46	PUA-like domain
Orthology group	MCL11023		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS210128-TA
ATGAGTTTGGAGTTGAGAAATAAAAAAATTGCAGAGACATTTGAGAAATTCAAAATTGCGCAATGGGGACACAACAATAACATCGCGTGTGCCCAAGTCGCTACAAATGTAGTTGAACAGAAGCATCAGGTGTCGAGAGCTAAGAGGAGCAAAGCTCTTGGAAGCCGTGCCTTTAGAGGCAGCACGATTTGGTTTACTGGACTCAGCGGCGCCGGCAAGACTAGTATAGCGTTTGCACTTGAAGCCTATCTCGTTTCTAAAGGTATACCAGCTTACGGTCTAGACGGAGACAACATCAGGACTGGTCTCAACAAGAACCTCGGCTTTTCTAAGGAAGACAGAGAAGAGAATATTCGTAGAGTCGCAGAAGTAGCTAAACTCTTCGCTGACAGCGGCGTCGTTTGCTTGTGCAGTTTTGTCTCGCCCTTTGCTGAGGACAGGGAGGTAGCTCGTCGCATTCACACTGACTCCGAGTTGCCGTTCTTCGAAGTGTTCATAGACACGCCGCTGGAAGTATGCGAACAGAGAGATACCAAGGGCCTCTACAAGAAGGCTAGGGAGGGACAGATTAAGGGCTTCACTGGCATAACTCAGGAGTATGAACGTCCTGAGGCTCCAGAGCTTGTCATTCAGACAGTTGGACGCTCCATCGAAGAGTCCACCATAGAAGTGGTGCGACTCCTCGAATCACAGGGTATTATACCACGCTACAATGAAAATGACTCAGGTGTTGAAGAGCTCTTCATTTACGGAAACAGACTTAGCAGTGCTAAGGAAGAGGCGGCCAGGTTGCCGCAAATAGAACTCTCATTTTTGGACTTGCAATGGGTTCAGGTGTTATCTGAAGGTTGGGCCTACCCTCTTAAAGGCTTTATGAGGGAATCCGAATATCTGCAAGCGCTACATTCCAACTGCTTTACACTACCAGATGGGACCTTGGTAAACCAATCTGTACCAATCGTGTTGCCAGTGGCCACGACCACTAAGGAGCGCCTCACTGGTTCCACGGCCATCGCATTGGTCCACGATGGCCGAACCATCGCCATTATGAGAAACCCCGAGTTCTACCCTCATAGGAAACAGGAGAGGTGCTGTCGGCAGTTCGGAATATATAACACAGGACATCCCTATATCAAAGGCTTCACTGGCATAACTCAGGAGTATGAACGTCCTGAGGCTCCAGAGCTTGTCATTCAGACAGTTGGACGCTCCATCGAAGAGTCCACCATAGAAGTGGTGCGACTCCTCGAATCACAGGGTATTATACCACGCTACAATGAAAATGACTCAGGTGTTGAAGAGCTCTTCATTTACGGAAACAGACTTAGCAGTGCTAAGGAAGAGGCGGCCAGGTTGCCGCAAATAGAACTCTCATTTTTGGACTTGCAATGGGTTCAGGTGTTATCTGAAGGTTGGGCCTACCCTCTTAAAGGTTTTATGAGGGAATCCGAATATTTGCAAGCGCTACATTCCAACTGCTTTACACTACCAGATGGGACCTTGGTAAACCAATCTGTACCAATCGTGTTGCCAGTGGCCACGACCACTAAGGAGCGCCTCACTGGTTCCACGGCCATCGCATTGGTCCACGATGGCCGAACCATCGCCATTATGAGAAACCCCGAGTTCTACCCTCATAGGAAACAGGAGAGGTGCTGTCGGCAGTTCGGAATATATAACACAGGACATCCCTATATCAAAATGATCGAGGAGTCTGGGGACTGGCTGGTGGGCGGTAACCTGGAAGTGTTCGAACGTATTCAGTGGAATGACGGCCTAGACTCTTACAGACTGACGCCCAACGAACTGAGGCAGAGGTTCAAGGACATGGATGCTGATGCTGTGTTTGCATTCCAGCTTCGTAACCCTATCCACAACGGCCACGCCCTCCTGATGCAAGACACTCAAAAACAACTCATCGAGAGAGGATACAAGAAACCAGTACTGCTATTACACCCCCTTGGCGGCTGGACTAAAGACGATGATGTTCCCCTGTCGGTGCGCGTGATACAACACAAGGCGGTCTTGAATGAACGAGTGCTGGACCCTGAACATACCGTGCTGGCGATCTTTCCATCTCCAATGATGTACGCCGGACCCACGGAGGTCCAATGGCATGCTAAGTGCCGTATGAACGCTGGCGCTAACCACTATATAGTGGGTCGTGACCCCGCTGGATTGCCGCACCCTAACGGCGGCGGTGACCTCTACGACCCCCGACACGGTGCTATCGTACTGGCAGCCGCACCCGGACTGGATGATCTTGAGATCATACCATTCCGAGTAGCAGCGTATGATTCATCCGTCGGGAAGATGGCATTCTTTGATCCCACTCGTAAGGAAGACTTCGACTTCATATCCGGCACCAGGATGAGGGGTCTTGCTAAAGCTGGAAAGGAGCCACCGAAAGGTTTCATGGCTCCCAGCGCCTGGAAGGTCCTCTCAGAATACTACCAGTCGCTTAAATCTAAAATGGAAACCAATTAA

Protein sequence:

>DPOGS210128-PA
MSLELRNKKIAETFEKFKIAQWGHNNNIACAQVATNVVEQKHQVSRAKRSKALGSRAFRGSTIWFTGLSGAGKTSIAFALEAYLVSKGIPAYGLDGDNIRTGLNKNLGFSKEDREENIRRVAEVAKLFADSGVVCLCSFVSPFAEDREVARRIHTDSELPFFEVFIDTPLEVCEQRDTKGLYKKAREGQIKGFTGITQEYERPEAPELVIQTVGRSIEESTIEVVRLLESQGIIPRYNENDSGVEELFIYGNRLSSAKEEAARLPQIELSFLDLQWVQVLSEGWAYPLKGFMRESEYLQALHSNCFTLPDGTLVNQSVPIVLPVATTTKERLTGSTAIALVHDGRTIAIMRNPEFYPHRKQERCCRQFGIYNTGHPYIKGFTGITQEYERPEAPELVIQTVGRSIEESTIEVVRLLESQGIIPRYNENDSGVEELFIYGNRLSSAKEEAARLPQIELSFLDLQWVQVLSEGWAYPLKGFMRESEYLQALHSNCFTLPDGTLVNQSVPIVLPVATTTKERLTGSTAIALVHDGRTIAIMRNPEFYPHRKQERCCRQFGIYNTGHPYIKMIEESGDWLVGGNLEVFERIQWNDGLDSYRLTPNELRQRFKDMDADAVFAFQLRNPIHNGHALLMQDTQKQLIERGYKKPVLLLHPLGGWTKDDDVPLSVRVIQHKAVLNERVLDPEHTVLAIFPSPMMYAGPTEVQWHAKCRMNAGANHYIVGRDPAGLPHPNGGGDLYDPRHGAIVLAAAPGLDDLEIIPFRVAAYDSSVGKMAFFDPTRKEDFDFISGTRMRGLAKAGKEPPKGFMAPSAWKVLSEYYQSLKSKMETN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: