MonarchBase - Protein-coding gene

DPOGS210492
Transcript	DPOGS210492-TA	1158 bp
Protein	DPOGS210492-PA	385 aa
Genomic position	DPSCF300186 - 237038-241297
RNAseq coverage	166x (Rank: top 51%)

Annotation
*Heliconius*	HMEL016338	1e-47	47.62%
*Bombyx*	BGIBMGA012583-TA	6e-114	69.93%
*Drosophila*	Cpsf73-PA	2e-119	58.13%
EBI UniRef50	UniRef50_Q9VE51	2e-117	58.13%	Cleavage and polyadenylation specificity factor 73 n=31 Tax=Eumetazoa RepID=Q9VE51_DROME
NCBI RefSeq	XP_001605081.1	4e-140	65.38%	PREDICTED: similar to cleavage and polyadenylation specificity factor [Nasonia vitripennis]
NCBI nr blastp	gi\|307177772	8e-140	65.29%	Cleavage and polyadenylation specificity factor subunit 3 [Camponotus floridanus]
NCBI nr blastx	gi\|307177772	6e-133	65.29%	Cleavage and polyadenylation specificity factor subunit 3 [Camponotus floridanus]

Group
KEGG pathway
InterPro domain	[184-380] IPR021718	2.2e-38	Pre-mRNA 3'-end-processing endonuclease polyadenylation factor C-term
	[27-75] IPR022712	6.7e-15	Beta-Casp domain
	[89-129] IPR011108	4.9e-13	RNA-metabolising metallo-beta-lactamase
Orthology group	MCL30943		Lepidoptera specific

Nucleotide sequence:

>DPOGS210492-TA
ATGAGGTGTCGCTGTGATTCCAAATACAGTACTCTTCATTTGAGATCCCACCAGGCACCGGGCATCGATCACTTCGAGGACATAGGTCCGTGTGTGATCATGGCTTCCCCGGGTATGATGCAGTCGGGCCTCTCCCGGGAACTGTTCGAGTCGTGGTGCACGGATCCCAAGAACGGCGTCATCATAGCAGGTTACTGCGTGGAAGGCACCCTGGCCAAAACTATACTGTCGGAGCCGGAAGAGATCACGACTATGTCAGGACAGAAACTTCCGCTGAAGATGTCCGTGGATTACATATCGTTCTCCGCGCACACGGACTACCAACAGACCTCAGAGTTTATCAACATTCTGAAGCCTCCTCATGTGGTGTTAGTTCACGGGGAACAGAACGAGATGTCTCGTCTGAAGGCGGCCCTGCAGCGCGAACACCGCGGCCGCCTCGCCATACACACGCCCAGGAACACGCAACAGCTGGCCCTCACCTTCAGAGGCGACAAGACCGCTAAGGTAATGGGGTCCCTGGCCATGGAGGCGCCGGTGCCGGGCGCACAGCTCCAGGGTGTTCTGGTCAAGAGGAACTTTAACTATCACATCCTGGCGCCCTCCGACTTGAACAAGTACACGGACCTGTCCCAGTCGTCGGTGTCTCAGCGCGTGTCAGTGTGGTGCGGAGCTCCGGTGGGTCTGGTCCGACACGCCGTGATGCGCCTGGCGGGGCCCGTGGTGTTCCTGAGCGACACTCGCTGGAGGCTCTACGGCTGCATCGACCTCACGCTGGACCTGCCGCTCGTCACGCTGGAGTGGCAGGCGGCGCCGGTGTCTGACATGTTCGCGGACGCGGTGGTGGCGGCGCTGCTGGCGGCCCCGGCCTCCGCCCCCGGGCCCGCGCCCAACGCGCCCCTCGCACACAAACTGGACAAGATGCATTTCAAGGAGTGTGTGATCGAGATGTTGTCGGAGATGTTCGGCGAGGCGGCCGTGGCCAAGATGTTCCGCGGAGAGCGACTCACGGTCACGCTCAACGAGCGCCAGGCGCACCTAGACCTCGCCACCATGGAGGTGAAGTGTCCCGAGGACGAGTCTCTGGAGCGCACAATCCAGTCCGCCATCAGCAAGCTGCACGCCGCCCTCTCGCCCGTCCGGCCTCCCGCACCCTGA

Protein sequence:

>DPOGS210492-PA
MRCRCDSKYSTLHLRSHQAPGIDHFEDIGPCVIMASPGMMQSGLSRELFESWCTDPKNGVIIAGYCVEGTLAKTILSEPEEITTMSGQKLPLKMSVDYISFSAHTDYQQTSEFINILKPPHVVLVHGEQNEMSRLKAALQREHRGRLAIHTPRNTQQLALTFRGDKTAKVMGSLAMEAPVPGAQLQGVLVKRNFNYHILAPSDLNKYTDLSQSSVSQRVSVWCGAPVGLVRHAVMRLAGPVVFLSDTRWRLYGCIDLTLDLPLVTLEWQAAPVSDMFADAVVAALLAAPASAPGPAPNAPLAHKLDKMHFKECVIEMLSEMFGEAAVAKMFRGERLTVTLNERQAHLDLATMEVKCPEDESLERTIQSAISKLHAALSPVRPPAP-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: