MonarchBase - Protein-coding gene

DPOGS204354
Transcript	DPOGS204354-TA	1917 bp
Protein	DPOGS204354-PA	638 aa
Genomic position	DPSCF300040 - 951124-954542
RNAseq coverage	159x (Rank: top 52%)

Annotation
*Heliconius*	HMEL011818	0.0	57.06%
*Bombyx*	BGIBMGA005885-TA	1e-151	45.10%
*Drosophila*	Parg-PC	8e-128	47.07%
EBI UniRef50	UniRef50_B0WST7	1e-128	43.08%	Poly(Adp-ribose) glycohydrolase n=2 Tax=Culicinae RepID=B0WST7_CULQU
NCBI RefSeq	XP_001853435.1	3e-129	43.08%	poly(adp-ribose) glycohydrolase [Culex quinquefasciatus]
NCBI nr blastp	gi\|170048618	5e-128	43.08%	poly(adp-ribose) glycohydrolase [Culex quinquefasciatus]
NCBI nr blastx	gi\|157119028	8e-128	46.89%	poly(adp-ribose) glycohydrolase [Aedes aegypti]

Group
Gene Ontology	GO:0004649	8.3e-144	poly(ADP-ribose) glycohydrolase activity
	GO:0005975	8.3e-144	carbohydrate metabolic process
KEGG pathway
InterPro domain	[48-493] IPR007724	8.3e-144	Poly(ADP-ribose) glycohydrolase
Orthology group	MCL11552		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS204354-TA
ATGTGTAGTAGTTGGAAGGGTGTACCTATTTCCTACATTGTTGGCTCGCAATCGCCGTGGGGTGCACCGGAGTTTCCCTTAGTACAGCCGTCGTATAACCACACAGTGTTGTACCACATACCAGATGATGCTCAACTAGACAGACCTCCAAAACCACAGATTGGTCATGAAAAATGGGATCAGGAACATGTGAGGTTGCCATTCTCTACACAAAGCCTGTATCCTGTTGAAAACAGTGCAGGTGAAACTAAACTTAAAAACCGATGGGACATGGTTCAGAATGCTTTAAACAGGCCAATACGTAACAGTAAGGAGCTCGCTAAAGCTATATTGAGTTATAACACTCAGTTCAAAAATAGATGGAAATTTACGGCTTTACATTACTTGTTTGAGGAGTATTTAGAAGAAGAGGAGTCTCAGTACTTTTTTGATGTCACATTACAAGAAATTGCTAAGCTCGCTTTGTCAATAACAAAATTAATACAAGCTCCAATACCTTTGTTGAAACAAAACAAGAACCGATCTATATCTTTGTCGCAGCAGCAAATATCATGTTTATTAGCGAATGCATTCTTCTGTACATTTCCACGACGGAACACTACTAAGAAAAATTCTGAATATGCCTCATACCCCTATATTAACTTTAATGTTTTGTATGAATGTGAGCCATCTAACCATGTGGTGGAGAAATTGAAATGCATCTGTCACTACTTCAGGAGAGTTTGCACAAAAGTTCCAGTTGGAGTGGTTACAGTGTCTCGTCGTTCTGTTCCTGTAAAGGAGTTACCGGATTGGAAGAGCTCCGAGAGAATCATCTCCGAACTGCCTGTTCATTGCGACTCGGAGAACACTATAGAAGAAGCACATGGCTTGATACAAGTGGATTTTGCTAATAAGTACTTAGGCGGCGGTGTATTGAGTTACGGCTCGGTCCAAGAGGAGATAAGATTCATGATATGCCCCGAGCTGATGATATCAATGTTGTTTACCGAGGAACTGAAGCCCAATGAAGCTTTGATGGTTATAGGTTGTGAACAGTACAGCACATACTCTGGCTATGGTCACAGTTTCTCGTGGGGCTCCAACTATAATGACATAACACCGAGGGACTCCTCTGGCAGGAAACGGACCGCAGTCCTGGCTATAGACGCCCTGCCTGTGAGGAGTCGTCTACACGAGATGAATGCTAACACCGTCACTAGGGATATCAATAAGACTATGGCCTTGACTGAGGCTGGCCGGCCGTTGGCCTACTACACCTTCGACGATAAAGAGTTGAGAGACGACATTATCGGATGCTACGAGTTGCTCGTCAGACATCAGGTTACCGTCGGTCAATTGTATAATATTATAATGAACTACTGTGACTCGAATCAACACAGCGGCGGTATTTACACATATCTGGAACACGCTCTGGATAATAGAAAACCGGTTAATAATAAGAATGACACGGGAAAAAACCTAAAATCCGATACAAATGACAGCGGTAATGTCTGTGATGATCTGATTCTTGCTAGAGCGTTGGATTTTTCACCGGACATATTCTTACAAGACGAAGATATGAGTGAATATTCGATGGACTTGAAAGTTAACACGGAAGATACGGCCGTTATAGATCTAGACACGAGTACGAGCGACGGCAATAAATGTGTTGATAGTAGAGTGACCGCCGAAGAACAGGAAGTTCAGGAAAATACTAAAACAAACCAAACGTCCAGATTATTCGACGAGATGGAGAAGTTAGATCAAGACAGCGGGAAATTGAATCTCAAGAGTCAGCAGAAAACATTCTTTGGACAGAAAAATAATGATTTGTCCATGGACGCTGGGGAGAAGTTACATACAGATATTTCGCCGGATGTCAAAAAGAAATTAACCAAAAAAATTACAGATTATTTCTCCAAGAGACCTATATGA

Protein sequence:

>DPOGS204354-PA
MCSSWKGVPISYIVGSQSPWGAPEFPLVQPSYNHTVLYHIPDDAQLDRPPKPQIGHEKWDQEHVRLPFSTQSLYPVENSAGETKLKNRWDMVQNALNRPIRNSKELAKAILSYNTQFKNRWKFTALHYLFEEYLEEEESQYFFDVTLQEIAKLALSITKLIQAPIPLLKQNKNRSISLSQQQISCLLANAFFCTFPRRNTTKKNSEYASYPYINFNVLYECEPSNHVVEKLKCICHYFRRVCTKVPVGVVTVSRRSVPVKELPDWKSSERIISELPVHCDSENTIEEAHGLIQVDFANKYLGGGVLSYGSVQEEIRFMICPELMISMLFTEELKPNEALMVIGCEQYSTYSGYGHSFSWGSNYNDITPRDSSGRKRTAVLAIDALPVRSRLHEMNANTVTRDINKTMALTEAGRPLAYYTFDDKELRDDIIGCYELLVRHQVTVGQLYNIIMNYCDSNQHSGGIYTYLEHALDNRKPVNNKNDTGKNLKSDTNDSGNVCDDLILARALDFSPDIFLQDEDMSEYSMDLKVNTEDTAVIDLDTSTSDGNKCVDSRVTAEEQEVQENTKTNQTSRLFDEMEKLDQDSGKLNLKSQQKTFFGQKNNDLSMDAGEKLHTDISPDVKKKLTKKITDYFSKRPI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: