MonarchBase - Protein-coding gene

DPOGS204410
Transcript	DPOGS204410-TA	1281 bp
Protein	DPOGS204410-PA	426 aa
Genomic position	DPSCF300002 - 679189-683883
RNAseq coverage	249x (Rank: top 42%)

Annotation
*Heliconius*	HMEL006272	8e-136	72.84%
*Bombyx*	BGIBMGA007716-TA	4e-155	81.48%
*Drosophila*	arg-PA	5e-67	42.36%
EBI UniRef50	UniRef50_Q2F6C6	1e-149	80.25%	Arginase n=3 Tax=Bombyx mori RepID=Q2F6C6_BOMMO
NCBI RefSeq	NP_001040105.1	2e-150	80.25%	arginase [Bombyx mori]
NCBI nr blastp	gi\|222143556	3e-152	81.48%	arginase [Bombyx mori]
NCBI nr blastx	gi\|222143556	1e-151	81.48%	arginase [Bombyx mori]

Group
Gene Ontology	GO:0006525	1.7e-122	arginine metabolic process
	GO:0046872	1.7e-122	metal ion binding
	GO:0004053	1.7e-122	arginase activity
	GO:0016813	1.7e-122	hydrolase activity, acting on carbon-nitrogen (but not peptide) bonds, in linear amidines
KEGG pathway	tca:655366	6e-105
	K01476 (E3.5.3.1, rocF, arg)	maps->	Amoebiasis
			Arginine and proline metabolism
InterPro domain	[1-328] IPR014033	1.7e-122	Arginase, subgroup
	[1-328] IPR006035	1.7e-122	Ureohydrolase
	[11-313] IPR023696	4.5e-84	Ureohydrolase domain
Orthology group	MCL15078		Single-copy universal gene

Nucleotide sequence:

>DPOGS204410-TA
ATGAGTCAACAAACAAAATGTCAACCCTTAAAAAGGGTGGGGTTGATCGGTGTTCCGTTTGAGAAAGGCCAAAAAAAGTATGGAGTCAGTATAGCACCCGCCGCTCTAAGATCAGCTGGGTTGATTGAACGCTTAAAGGACATCGATGGTTTAGATGTGAAAGACTATGGAGACATCGAGGTCCCGTCGTCCGAAAGGCCTGTAGATGTGGACAATATGGCTCACCTTCCACTTGTGTCAGCCTGCAACAAAAACCTATCAGACAAAGTATCACAAGTTCTAAAAGACGGTAGAGTTGCTGTTACCATAGGTGGAGATCATTCTATTGGAGTTGGAACGGTCGACGGGCATTATAAAGTAAACGAGAACATGATCCTTATTTGGGTAGACGCTCATGCTGACATCAACACTAACAAGACTTCCGAATCGGGTTCCGTCCATGGCATGCCAGTAGCTTTACTTGTTAAAGAATTATCTGACTACTGGCCTTATCTCCCAACCATGGACTGGCAAGTCCCAAAATTTTCGATAAAGAATCTCGGATACATTGGCCTTAGATCAGTAGACAAGTACGAAAGGCTGGCAATAGAAAAATACGACGTGCCTGCGTTCGCAATGGAAGACATAGAGGATTACGGAATTCATAAATCCATAGACCACGTTCTGCAGAGGCTAGACCCCAAAGGAAATAAACCGATCCACGTCAGTTTCGACATCGATTCATTGGATTCTTTAGAGGCTCCCAGTACGGGCACCCCTGTTCGAGGAGGTCTTACACTTCGGGAAGCTATCAAATTGATGGAGATTATTCACGCAACTGGCCGTCTCCGGGCATTTGACCTTGTTGAGATTAACCCAGCTCTTGGTAATGACTCTGATAGGAAGAGAACTATCGAAGCTGGCATGAGCGTGATGATGGCAGCCTTAGGATTCTCGCGACGTGGGATGACACCGCGTGGGATTTTAGCCCTAAATTGCATATTCTGTGAAACGGATCCTAAACAAAATGACATGATTGATGTAGAAAAAGTATTCGAAGAATATTTCTCAAAATTACCGAATAACCAAAGTAAATACGTTATAAACGAAGGGATATCGAAAATGATTTCAAGATATTTTGATGGAAAAGTGAACGCGTTCCCATTGTTTAAAGTAAGTATTAACATCGACCGTAAGCCCGTCAAGATACCCTGGACTTTGGACAAAGCAGATAAATTAAATGAAACCAAATTAAAAAAGAGGTACCAGTACGTTAAGATGGAAACAACTAAAAATGAATAA

Protein sequence:

>DPOGS204410-PA
MSQQTKCQPLKRVGLIGVPFEKGQKKYGVSIAPAALRSAGLIERLKDIDGLDVKDYGDIEVPSSERPVDVDNMAHLPLVSACNKNLSDKVSQVLKDGRVAVTIGGDHSIGVGTVDGHYKVNENMILIWVDAHADINTNKTSESGSVHGMPVALLVKELSDYWPYLPTMDWQVPKFSIKNLGYIGLRSVDKYERLAIEKYDVPAFAMEDIEDYGIHKSIDHVLQRLDPKGNKPIHVSFDIDSLDSLEAPSTGTPVRGGLTLREAIKLMEIIHATGRLRAFDLVEINPALGNDSDRKRTIEAGMSVMMAALGFSRRGMTPRGILALNCIFCETDPKQNDMIDVEKVFEEYFSKLPNNQSKYVINEGISKMISRYFDGKVNAFPLFKVSINIDRKPVKIPWTLDKADKLNETKLKKRYQYVKMETTKNE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: