MonarchBase - Protein-coding gene

DPOGS204924
Transcript	DPOGS204924-TA	1515 bp
Protein	DPOGS204924-PA	504 aa
Genomic position	DPSCF300160 - 713861-718640
RNAseq coverage	140x (Rank: top 55%)

Annotation
*Heliconius*	HMEL007192	3e-163	54.44%
*Bombyx*	BGIBMGA011417-TA	2e-35	68.75%
*Drosophila*	CG3045-PA	1e-104	47.09%
EBI UniRef50	UniRef50_B0XGH8	2e-107	49.00%	Pseudouridine synthase n=4 Tax=Culicidae RepID=B0XGH8_CULQU
NCBI RefSeq	XP_001602396.1	3e-113	54.30%	PREDICTED: similar to pseudouridylate synthase [Nasonia vitripennis]
NCBI nr blastp	gi\|156537085	6e-112	54.30%	PREDICTED: tRNA pseudouridine synthase 3-like [Nasonia vitripennis]
NCBI nr blastx	gi\|156537085	2e-108	54.30%	PREDICTED: tRNA pseudouridine synthase 3-like [Nasonia vitripennis]

Group
Gene Ontology	GO:0003723	1.3e-93	RNA binding
	GO:0009451	1.3e-93	RNA modification
	GO:0009982	1.3e-93	pseudouridine synthase activity
	GO:0001522	1.3e-93	pseudouridine synthesis
KEGG pathway
InterPro domain	[47-371] IPR001406	1.3e-93	Pseudouridine synthase I, TruA
	[73-347] IPR020103	2.8e-58	Pseudouridine synthase, catalytic domain
	[75-195] IPR020094	1.5e-25	Pseudouridine synthase I, TruA, N-terminal
	[198-325] IPR020095	1.1e-23	Pseudouridine synthase I, TruA, C-terminal
	[217-330] IPR020097	3e-20	Pseudouridine synthase I, TruA, alpha/beta domain
Orthology group	MCL14032		Single-copy universal gene

Nucleotide sequence:

>DPOGS204924-TA
ATGTCGAAACAAATTAATAAATTACCACCAAAACAGAGAAAAACTAAAGGCTTATCTAGAGAGGAGCTTATGAATATGGATAAAAATGAATTAGTTGATAGAATAATACAGTTGGAAGCTCACACTACGCAACTTAAAAATATAATAAGCAAAAGTGAACCAGTTACAGAGAATATACAGGGTTACAATAATCAAAGAAAATTTGATTTCACGAAGTGTACCTTCCGACGGGTTCTGCTACATATAATATACTTCGGCTGGGATTACCACGGGCTGGCCGTCCAGGAGGATTCAACGCACACAATTGAGCATTACCTCTTCAATGCCCTCGTCAAGTCATGTCTCATTGAGAGTAGAGAACAGTCACAGTACCATCGATGTGGAAGGACAGATAAAGGCGTCAGTGCCTTCGGACAGATAATATCTATATCATTACGGAGCAAACTGGAACCGTCTTCAACCGACTACTCATCCGAGATCCAATACTGCAAGATCCTTAACAGATTGTTTCCGAGGGATATTAAAGCGGTAGCCTGGATGCCCATCCCTGATGATAGACCAGATTTCAGTGCAAGATTCGACTGTAAGGGCCGGCAGTACAAGTACTATTTCCCGAAATCTAATCTCAATATAACCGCTATGAGGGAGGCCTGTCGCCAGCTCATCGGTTCACACGACTTCCGCCACCTCTGCAAGATGGACGTGGGGAACGGCGTCACTGAGTTCACAAGGCGTGTCGTATCAGCTGACATTATAGCTCTGGATAAGGATTGCGAACAGACAACATCGATGTACGCATTAGTGATAGAAGGTAATGCATTTCTGTGGCATCAGATCAGGTGTATAATGGGCGTGTTGTTGCTCGTGGGCCAAGGACACGAGAGCCCGGGTATCATAGCCGAATTACTGGACGTCGAAGCAAATCCACGCAAACCTCAATACAATATGGCTCTGGATTTGCCGTTGAACCTGTTCTGCTGCAGATATGATGTGAAGAGCCGCTGGGTTTATGACGACGAGGAGCTCAAATACATCATCACCAACTTACAGGCGGACTGGACCTTGTATAATGTCAAATCCACCATGATAAAAGATGCTCTGGAACATCTGGAAGGTGTCCTATATGACTTGAGCAAGGAGGGGAAAAAGTGTGACAGAGACGGAGAATATAACGACGTGGGAAGGAGAGAGATGCAAGATAAGGAAGATGTAGCGTTAGAGGGAGACCAAGATAAAATATGTGACATAGACAGAAATTTAGAAGAGTTGGGAGAGAAAGAGAAAGAAGATGATAACAATAAGTGCGAGAGAGACAGGGGATTAAAAGAGTTGGAAGGGAAAGAGACGGGAGATAGAATAATATCGCACGCAGAATGCCTGCTACAAGGAGTCAAACCAAAAATATACACACCGCTGTTGAAAAGACAAACCTGCTCGAGTCTGCAGGAACGATTGCAATACTACAGGAAGAAAAGGAAAGTGGAGAGCGGTTCTGATGATGAAGAAATAAAATAA

Protein sequence:

>DPOGS204924-PA
MSKQINKLPPKQRKTKGLSREELMNMDKNELVDRIIQLEAHTTQLKNIISKSEPVTENIQGYNNQRKFDFTKCTFRRVLLHIIYFGWDYHGLAVQEDSTHTIEHYLFNALVKSCLIESREQSQYHRCGRTDKGVSAFGQIISISLRSKLEPSSTDYSSEIQYCKILNRLFPRDIKAVAWMPIPDDRPDFSARFDCKGRQYKYYFPKSNLNITAMREACRQLIGSHDFRHLCKMDVGNGVTEFTRRVVSADIIALDKDCEQTTSMYALVIEGNAFLWHQIRCIMGVLLLVGQGHESPGIIAELLDVEANPRKPQYNMALDLPLNLFCCRYDVKSRWVYDDEELKYIITNLQADWTLYNVKSTMIKDALEHLEGVLYDLSKEGKKCDRDGEYNDVGRREMQDKEDVALEGDQDKICDIDRNLEELGEKEKEDDNNKCERDRGLKELEGKETGDRIISHAECLLQGVKPKIYTPLLKRQTCSSLQERLQYYRKKRKVESGSDDEEIK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: