MonarchBase - Protein-coding gene

DPOGS205534
Transcript	DPOGS205534-TA	1848 bp
Protein	DPOGS205534-PA	615 aa
Genomic position	DPSCF300056 + 431752-440111
RNAseq coverage	734x (Rank: top 18%)

Annotation
*Heliconius*	HMEL011287	85.96%
*Bombyx*	BGIBMGA000084-TA	82.10%
*Drosophila*	hrg-PA	62.96%
EBI UniRef50	UniRef50_Q17AA5	66.30%	Poly a polymerase n=7 Tax=Coelomata RepID=Q17AA5_AEDAE
NCBI RefSeq	XP_001650777.1	66.30%	poly a polymerase [Aedes aegypti]
NCBI nr blastp	gi\|383862407	71.05%	PREDICTED: poly(A) polymerase gamma [Megachile rotundata]
NCBI nr blastx	gi\|307201288	69.30%	Poly(A) polymerase gamma [Harpegnathos saltator]

Group
Gene Ontology	GO:0005634	2.6e-304	nucleus
	GO:0004652	2.6e-304	polynucleotide adenylyltransferase activity
	GO:0043631	2.6e-304	RNA polyadenylation
	GO:0006351	3.1e-106	transcription, DNA-dependent
	GO:0031123	6.4e-40	RNA 3'-end processing
	GO:0003723	6.4e-40	RNA binding
	GO:0016779	6.4e-40	nucleotidyltransferase activity
KEGG pathway	aag:AaeL_AAEL005356	0.0
	K00970 (E2.7.7.19, pcnB)	maps->	RNA degradation
InterPro domain	[10-616] IPR014492	2.6e-304	Poly(A) polymerase
	[29-375] IPR007012	3.1e-106	Poly(A) polymerase, central domain
	[376-535] IPR011068	6.4e-40	Nucleotidyltransferase, class I, C-terminal-like
	[377-534] IPR007010	1.9e-39	Poly(A) polymerase, RNA-binding domain
	[107-184] IPR002934	1.6e-08	Nucleotidyl transferase domain
Orthology group	MCL10471		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS205534-TA
ATGTGGCCGGCATCTCAATATTCGCATACAAATCACCAGGCCAACGCCTCCAAGTCCAATGAACACCAAAATCAACAGAACCTGAAGACGCTCGGCATGACTTCAGCTATTTCTATGGCAGGTCCGAAACCCATCGACATTGAAAAGACAAATGAGCTCAAGGAATCCCTGGTGCCGTTTGGTGTGTTTGAATCCGAGGCTGAGATGCATCACAGGATGGAGGTGCTCGGATCCTTACATCGGCTGGTCAGGCAGTGGATAAGAGACGAATCCTTGAGGAAGAACATGCCACCCAGCGTAGCTGACACAGTCGGAGGCAATATATATACATTCGGATCATACAGGCTCGGGGTGCACCACCGAGGCGCGGATATTGACGCCTTGTGCGTGGCTCCAAGACATATCGACCGGTCGGACTACTTCCAGTCATTCTACGAACTGCTCAAGGAACAACCTCAAGTGAAAGATCTCCGAGCTGTGGAGGACGCGTTCGTGCCCGTCATTAAGATGAACTTCGACGGTATCGAAATAGATCTGTTGTTTGCCAGACTAGCTCTCAAGGAAATACCAGATTCCTTCGACCTCCGAGACGACATGCTCCTCAAGAACCTGGACCAGAAGTGCGTGAGGTCGCTGAACGGGTGTAGAGTCACCGATGAAATACTGAGATTGGTCCCCGATATAAATACCTTTAGACTCACCTTGAGGGCTATCAAGCTGTGGGCCAAACGGCATGGGATATATTCTAATACCCTGGGCTACCTCGGCGGAGTGTCCTGGGCCATGCTAGTGGCGCGAACCTGTCAGTTGTATCCCAATGCGTTACCAGCTACATTACTACACAAGTTCTTCCTCGTCTTCAGCCAGTGGAAGTGGCCGCAGCCAGTACTCCTCAAACCACCGGACTCAGTCAATCTGGGATTCCCCGTTTGGGATCCGAGGGTTAACATGTCGGATCGCTACCACCTGATGCCCATCATAACACCGGCTTACCCACAACAGAACTCCACGTTCAATGTGTCGTCATCCACGAGGACGGTCATCATGGAGGAGTTCAGGCTGGGTCTTGCTATAACTGATGAGATAATGCTCGGAAAGTGTGGCTGGGAACGGTTGTTTGAAGCTGCAAATTTCTTCTCCCGCTACAAACACTTCATAGTACTGCTTGCATCATCGGCTAACACCCTGGATCAGCTGCCCTGGTGCGGGCTGGTCGAGAGCAAGATACGACACCTCATCACCACACTGGAACGAAACCAGCATATAACAATTGCTCATGTGAACCCGGAGTGTTACAACTCCGTGCCTCTCAATACTAACAACGGACATCCGCTCGCCTTACCTCCAGGTACACCAGTACAAACAGAGGAACACGGCGCCGCTGAAGTTAAAAATGATAAGGGCGAGATAGTGGCAAACGTCTGCTCAATGTGGTTCATAGGTCTGGTGTTTGACAAGACCAATGTCAATGTTGACCTCACATATGATATATCGTCATTCACAAAGGCCGTACACTACCAGGCCGAGAACACTAATGTACTTAGAGAGGGAATGACTATAGAGGCTCGTCATGTTCGTCGTAAGCAACTTCATCAATACCTGTCTCCGTCACTACTAAGGAGAGAAAAAGTTAACAAGAGAAAGAATGAAACACTCGCTGTTCATACAAAGAAGGCTAAGAGGGTATCGGAAAGCAGTGCGGATGAGGTGAGCGTGCTATCGTACACCGAGGACTCGAACTCGTCTAACATGTATGAAGTGAACGTACAGAACGGCGCGCATCAAGAACAGAAGACGAGCGAGAAGGTCGACAGGGGGTCCAGCTCGAGCGGCATAGCGTGCACGTAG

Protein sequence:

>DPOGS205534-PA
MWPASQYSHTNHQANASKSNEHQNQQNLKTLGMTSAISMAGPKPIDIEKTNELKESLVPFGVFESEAEMHHRMEVLGSLHRLVRQWIRDESLRKNMPPSVADTVGGNIYTFGSYRLGVHHRGADIDALCVAPRHIDRSDYFQSFYELLKEQPQVKDLRAVEDAFVPVIKMNFDGIEIDLLFARLALKEIPDSFDLRDDMLLKNLDQKCVRSLNGCRVTDEILRLVPDINTFRLTLRAIKLWAKRHGIYSNTLGYLGGVSWAMLVARTCQLYPNALPATLLHKFFLVFSQWKWPQPVLLKPPDSVNLGFPVWDPRVNMSDRYHLMPIITPAYPQQNSTFNVSSSTRTVIMEEFRLGLAITDEIMLGKCGWERLFEAANFFSRYKHFIVLLASSANTLDQLPWCGLVESKIRHLITTLERNQHITIAHVNPECYNSVPLNTNNGHPLALPPGTPVQTEEHGAAEVKNDKGEIVANVCSMWFIGLVFDKTNVNVDLTYDISSFTKAVHYQAENTNVLREGMTIEARHVRRKQLHQYLSPSLLRREKVNKRKNETLAVHTKKAKRVSESSADEVSVLSYTEDSNSSNMYEVNVQNGAHQEQKTSEKVDRGSSSSGIACT-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: