MonarchBase - Protein-coding gene

DPOGS210363
Transcript	DPOGS210363-TA	1233 bp
Protein	DPOGS210363-PA	410 aa
Genomic position	DPSCF300025 + 462194-465737
RNAseq coverage	187x (Rank: top 49%)

Annotation
*Heliconius*	HMEL013828	1e-158	93.19%
*Bombyx*	BGIBMGA011920-TA	0.0	83.29%
*Drosophila*	Clp-PA	4e-101	60.27%
EBI UniRef50	UniRef50_D6WBZ0	3e-98	65.45%	Putative uncharacterized protein n=1 Tax=Tribolium castaneum RepID=D6WBZ0_TRICA
NCBI RefSeq	NP_001040511.1	9e-151	89.89%	cleavage and polyadenylation specific factor 4 [Bombyx mori]
NCBI nr blastp	gi\|114052376	2e-149	89.89%	cleavage and polyadenylation specific factor 4 [Bombyx mori]
NCBI nr blastx	gi\|114052376	6e-158	88.97%	cleavage and polyadenylation specific factor 4 [Bombyx mori]

Group
Gene Ontology	GO:0003723	1.7e-26	RNA binding
	GO:0005730	1.7e-26	nucleolus
	GO:0008270	1.1e-07	zinc ion binding
	GO:0003676	1.1e-07	nucleic acid binding
KEGG pathway	cqu:CpipJ_CPIJ005818	2e-58
	K12845 (SNU13, NHP2L)	maps->	Spliceosome
InterPro domain	[290-303] IPR002415	1.7e-26	H/ACA ribonucleoprotein complex, subunit Nhp2, eukaryote
	[303-393] IPR004038	4.6e-26	Ribosomal protein L7Ae/L30e/S12e/Gadd45
	[317-331] IPR018492	6e-20	Ribosomal protein L7Ae/L8/Nhp2 family
	[63-89] IPR000571	1.1e-07	Zinc finger, CCCH-type
	[244-265] IPR013084	4.7e-06	Zinc finger, CCHC retroviral-type
Orthology group	MCL12264		Single-copy universal gene

Nucleotide sequence:

>DPOGS210363-TA
ATGGAAGTTATAGTGGCAAACGTGGATCATATAAAATTTGACATCGATTATGCTTTAGAGCAGCAGTATGGAGCCCTGCCTTTGCCCTTTCCTGGAATGGATAAATCTACTGCAGCAGTCTGCGAATTCTACAGCCAACCCGGGGGATGTGGTAATGGACCTCAGTGCCCTTATCGTCATGTGAGGGGAGACCGAACAGTAGTATGTAAGCATTGGCTGAGAGGTCTCTGCAAGAAAGGCGACCAGTGTGAATTTCTACACGAATATGACATGACCAAAATGCCTGAGTGCTATTTTTATGCTAGATTCAACGCTTGCCACAATAAGGAGTGTCCATTTCTTCATATAGATCCAGAAAGCAAAATTAAAGATTGTCCATGGTATGATCGTGGGTTTTGTAGACATGGTCCACATTGTAGACATCGCCATGTCAGAAGAGTTCTCTGTATAAATTACTTGGCAGGCTTCTGCCCTGATGGTGCAAACTGCAAGTACATGCACCCACGGTTTGAATTACCAGCTCCTCCAGAACAGACAAAGGATGCTAAAAGACTTCCCGTCTGCCACTACTGTTCAGAAGTAGGACATAAGGCTTCCACTTGTCATAAGATTCCTCCTGATCAAAGAGAAGTCGCCCAAAAACAGGAGGAGGCACGTTATAGAGCCTTGGGCTATGTCAAGCCTGCTGTAGATGGTGAAGAACTGAGATTACAAAGACTGATCCACAAACCTTTAGAGGAAGTGACTTGTTTCAAGTGCGGTACAAAGGGACATTATGCCAACAAGTGCCCCAAAGGTCACCTGGCCTTCCTATCAAATCAACCCCCTCCCGGCAACCCAAATGCTGAATCCGAAGCGTCTGTTAATCCCAAAGCCTATCCTTTAGCTGACACGGCTCTAACAGCTAAAATTTTAAACCTCGTGCAGCAAGCGGCTAACTACAAACAGTTGCGTAAAGGTGCCAATGAAGCCACCAAGACCTTGAACAGAGGACTGTCCGAGTTCGTCATTATGGCGGCGGACGCCGAACCACTGGAAATCGTTCTGCACATTCCAATTCTTTGCGAAGATAAGAATGTGCCTTATGTGTTTGTCAGATCCAAACAAGCTTTGGGTCGAGCCTGTGGAGTGTCCCGGCCGATAGTGGCGTGTTCCATCACTATCAATGAGGGATCACAACTGAAGCCGCAGATCCAAAGTATTCAGCAAGAGATAGAGAGACTCTTAGTGTGA

Protein sequence:

>DPOGS210363-PA
MEVIVANVDHIKFDIDYALEQQYGALPLPFPGMDKSTAAVCEFYSQPGGCGNGPQCPYRHVRGDRTVVCKHWLRGLCKKGDQCEFLHEYDMTKMPECYFYARFNACHNKECPFLHIDPESKIKDCPWYDRGFCRHGPHCRHRHVRRVLCINYLAGFCPDGANCKYMHPRFELPAPPEQTKDAKRLPVCHYCSEVGHKASTCHKIPPDQREVAQKQEEARYRALGYVKPAVDGEELRLQRLIHKPLEEVTCFKCGTKGHYANKCPKGHLAFLSNQPPPGNPNAESEASVNPKAYPLADTALTAKILNLVQQAANYKQLRKGANEATKTLNRGLSEFVIMAADAEPLEIVLHIPILCEDKNVPYVFVRSKQALGRACGVSRPIVACSITINEGSQLKPQIQSIQQEIERLLV-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: