MonarchBase - Protein-coding gene

DPOGS210804
Transcript	DPOGS210804-TA	1350 bp
Protein	DPOGS210804-PA	449 aa
Genomic position	DPSCF300027 - 850294-852032
RNAseq coverage	532x (Rank: top 24%)

Annotation
*Heliconius*	HMEL005025	0.0	91.76%
*Bombyx*	BGIBMGA007119-TA	0.0	89.72%
*Drosophila*	CG3590-PA	0.0	74.48%
EBI UniRef50	UniRef50_P30566	3e-176	68.97%	Adenylosuccinate lyase n=260 Tax=cellular organisms RepID=PUR8_HUMAN
NCBI RefSeq	XP_002048667.1	0.0	74.71%	GJ14098 [Drosophila virilis]
NCBI nr blastp	gi\|183979262	0.0	90.39%	similar to CG3590-PA [Papilio xuthus]
NCBI nr blastx	gi\|183979262	0.0	90.39%	similar to CG3590-PA [Papilio xuthus]

Group
Gene Ontology	GO:0004018	2.7e-107	N6-(1,2-dicarboxyethyl)AMP AMP-lyase (fumarate-forming) activity
	GO:0009152	2.7e-107	purine ribonucleotide biosynthetic process
	GO:0003824	1.2e-94	catalytic activity
KEGG pathway	dvi:Dvir_GJ14098	0.0
	K01756 (E4.3.2.2, purB)	maps->	Alanine, aspartate and glutamate metabolism
			Purine metabolism
InterPro domain	[18-422] IPR004769	2.7e-107	Adenylosuccinate lyase
	[1-424] IPR008948	1.2e-94	L-Aspartase-like
	[68-267] IPR022761	6.4e-22	Lyase 1, N-terminal
	[12-71] IPR024083	3.7e-14	L-Aspartase-like, N-terminal
	[340-423] IPR019468	1.3e-13	Adenylosuccinate lyase C-terminal metazoa/fungi
	[113-131] IPR000362	5.3e-12	Fumarate lyase
Orthology group	MCL12229		Single-copy universal gene

Nucleotide sequence:

>DPOGS210804-TA
ATGTTGCATTACACGCGTATACGAGTATATGAGAACCAAGATCTCGGCTTAGACATCACCGATGAACAGATCAAGGAACTGGAGTCGGCAATCCACGACATAGATTTCCCATCAGCCGCAGAACATGAGAAGAAGGTCCGTCATGACGTCATGGCGCACGTCCATACCCTCGCTGAACGCTGTCCGTTAGCGGCTCCTATCATACACCTAGGAGCTACTTCATGCTACGTTGGCGATAATACCGATCTGATTGTATTGAAACACGGCTTGGACTTACTCCTGCCCCGGCTCGCTGCTGTTATAAGCCAACTGTCGAAATTCTCCGATGAATACAAATCGCTTCCGATTTTGGGATTCACCCATTTACAACCAGCTCAGTTAACAACAGTTGGAAAGAGAGCTTCGTTGTGGCTTAGCGACCTTCTTATGGACGAGCGTGCATTGTCCCGGGCAAGAGAAGATTTAAGGTTCAGGGGAGTCAAAGGCACTACAGGAACTCAAGCTTCGTTCTTACAACTGTTTAAAGGTGACACTAGTAAGGTTAGGGCTCTGGATAAGAGGGTCGCAGAGCTTGCTGGATTTGATAAACGTTATCTTGTCACCGGTCAGACGTACTCAAGGAAGGTAGATTTAGAAGTTATAGCGGCGTTATCTGGGTTAGGAGCTACTGTCCATAAAATGTGCTCTGACATCCGTATTCTCGCTTCTCGTAAAGAATTGGAGGAACCGTTTGAGACTTCTCAAATAGGATCCAGCGCGATGCCCTACAAAAGAAATCCTATGAGGTCTGAACGTTGCTGTGCCCTGGCTCGGCATTTGATAACGCTTCATGCGAATGCTGCCAACACCCACGCCGTCCAATGGATGGAACGTACTTTAGATGACTCTGCTAACCGACGCATCACTTTAGCTGAAGCATTTTTGACTGCCGACGCGACTTTGCTTACTCTCCTTAATATTTGTCAAGGGCTGGTGGTGTACCCAAAAGTAATTGCTCGTTATATTGCACAGGAGCTCCCGTTCATGGCAACGGAAAATATTATAATGGCAATGGTACAATCTGGTGGTGATCGGCAGGTTTGTCATGAAAAAATACGAGTTTTGTCCCACGAAGCCGGAGCGGTAGTCAAACAGGAAGGAAAAGATAATGATTTAATAGATCGCATCAAAAATGATAAATATTTTGCTCCTATCATACCACAGCTTGACAAAATATTAGACGCGTCTACTTTTATTGGTCGAGCTCCTGAGCAAGTCACGGAATTTTTGGAAGAAGAAGTATATCCAGTTCTTGCAAAGTACAAGAACTCATTACTTGAAGTCGAGAAACCAGTTACTCTAAATATATAA

Protein sequence:

>DPOGS210804-PA
MLHYTRIRVYENQDLGLDITDEQIKELESAIHDIDFPSAAEHEKKVRHDVMAHVHTLAERCPLAAPIIHLGATSCYVGDNTDLIVLKHGLDLLLPRLAAVISQLSKFSDEYKSLPILGFTHLQPAQLTTVGKRASLWLSDLLMDERALSRAREDLRFRGVKGTTGTQASFLQLFKGDTSKVRALDKRVAELAGFDKRYLVTGQTYSRKVDLEVIAALSGLGATVHKMCSDIRILASRKELEEPFETSQIGSSAMPYKRNPMRSERCCALARHLITLHANAANTHAVQWMERTLDDSANRRITLAEAFLTADATLLTLLNICQGLVVYPKVIARYIAQELPFMATENIIMAMVQSGGDRQVCHEKIRVLSHEAGAVVKQEGKDNDLIDRIKNDKYFAPIIPQLDKILDASTFIGRAPEQVTEFLEEEVYPVLAKYKNSLLEVEKPVTLNI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: