MonarchBase - Protein-coding gene

DPOGS211835
Transcript	DPOGS211835-TA	1647 bp
Protein	DPOGS211835-PA	548 aa
Genomic position	DPSCF300031 + 881401-895251
RNAseq coverage	398x (Rank: top 30%)

Annotation
*Heliconius*	HMEL003310	85.71%
*Bombyx*	BGIBMGA006020-TA	79.71%
*Drosophila*	RluA-1-PB	62.81%
EBI UniRef50	UniRef50_B4LVB5	63.36%	GJ13872 n=10 Tax=Neoptera RepID=B4LVB5_DROVI
NCBI RefSeq	XP_553504.3	65.50%	AGAP009693-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|158298572	65.50%	AGAP009693-PA [Anopheles gambiae str. PEST]
NCBI nr blastx	gi\|157116527	66.18%	ribosomal pseudouridine synthase [Aedes aegypti]

Group
Gene Ontology	GO:0003723	1.8e-68	RNA binding
	GO:0009451	1.8e-68	RNA modification
	GO:0009982	1.8e-68	pseudouridine synthase activity
	GO:0001522	1.8e-68	pseudouridine synthesis
KEGG pathway	dme:Dmel_CG6187	6e-166
	K01718 (E4.2.1.70)	maps->	Pyrimidine metabolism
InterPro domain	[86-333] IPR006225	1.8e-68	Pseudouridine synthase, RluC/RluD
	[153-537] IPR020103	9.2e-52	Pseudouridine synthase, catalytic domain
	[171-318] IPR006145	4.8e-33	Pseudouridine synthase, RsuA and RluB/C/D/E/F
Orthology group	MCL11180		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS211835-TA
ATGGCTGTTAACTTCACGTCTCGAGGGGGTGAGAAAGACAACGCCAAAAACTGCATACTATCCTGCGAGAAGCGAAAAGCAGACGATTCGGACGTCAACAAAGATTTGAAAAAGGCTAAACTCGAAACAAAAGCTCTGAAGGCAAAAAGACCTGGGTTCACGGATGACAGATACAACGAAACTTCTTATTATATAGAAAATGGACTTAGAAAAGTTTACCCCTACTATTTTACGTTCACAACCTTCACTAAAGGGAGATGGGTAGGTGAGAAGATACTCGACGTTTTCGCGAGGGAGTTTAGAGCTCATCCCGCTGCGGAGTACGAGAGATGCATCAGGGCTGGCACATTAACGGTCAACTATGAACGTGTCGATCCAGATTATAGGCTGAAACACAACGATCTGTTAGCGAACGTCGTCCACAGGGCTTTTAATAATGTTCTGTGGTGGGCCAGGCACGAGACGCCAGTGCTCGCTAGTACCTTGCGCATCATACACGCGGATGAGGAGATTCTCGTGCTAGACAAGCCCTGTTCGTTGCCGGTACACCCATGCGGGCGGTATCGACACAACACAGTTGTTTTCATACTCGCCAAGGAATATAACCTCAAAAACCTTAGAACCATTCATAGACTCGACAGGCTAACTTCCGGTCTCCTATTATTCGGGAGGAGTCCAAAGAAAGCCAGGCAAATGGAACATCAGATAAGGAACAGACAGGTGCAGAAGGAATATGTTTGTCGAGTCGATGGAGAGTTTCCTGACGAGGAGATCGAATGTACGGAACCAATAGAGGTAGTGAGTTATAAAATCGGCGTTTGTAAAGTGTCACAAAAAGGGAAAGACTGTTCCACTACTTTCAAGCGATTAGGATACAATACGAAAAGCAACACCAGCGTTGTGCTCTGTCGACCAAAAACAGGCAGGATGCATCAGATCAGGGTTCATTTACAATACCTAGGTTACCCGGTCGTGAACGATCCATTGTATAATCATCCTGTATTCGGACCCCTTCGTGGTAAGGGTGGTGATACAGGTGGTAAGACTGACGAACAGCTAGTGAGAGACCTGATCGCTATACACAACGCCGAGAACTGGTTAGGTGTTGACGCCGGTGACGATGATATGCTGTTCTCCAAACCGGTAGCTGGTGACAAAGTTGAGGATGAATGTGAGGCTGGGATGGCGTCGAGGGAGTCGTCTCCGAGGTTGGAGTCACCAGCCCCCGGGCTCACACCGGCCACTGTAATGACTGCAATACTGGCGAGTCCATCGAGTGGATCGGAGGCCCCGGTAGAGGTCAGGTCCCCCGCACACTCACCCTCACTTAACGAGGACTCGAATGACGCCAAGTCAGACAAAGTGACAGTAGCGACACAGACCGGGTGCACACCGGCGCATGTCGTACCAAACGTGTCCACTGGTGTTTCGACAAGTGTTTCCAATGTCACGGGCGTGTACACCACCAGCCAGGAACTGACGGTGGACCCGCACTGTTACGAGTGTCGCGTGAGGTACAGAGACCCACGGCCTAGAGACCTTGTTATGTTCCTGCACGCTTGGAAATACAAGGGGCCGGGTTGGGAATACGAAACGGAACTTCCACAGTGGGCCGACATAGACTGGGAAGAATCGGAGAGCTCGTAG

Protein sequence:

>DPOGS211835-PA
MAVNFTSRGGEKDNAKNCILSCEKRKADDSDVNKDLKKAKLETKALKAKRPGFTDDRYNETSYYIENGLRKVYPYYFTFTTFTKGRWVGEKILDVFAREFRAHPAAEYERCIRAGTLTVNYERVDPDYRLKHNDLLANVVHRAFNNVLWWARHETPVLASTLRIIHADEEILVLDKPCSLPVHPCGRYRHNTVVFILAKEYNLKNLRTIHRLDRLTSGLLLFGRSPKKARQMEHQIRNRQVQKEYVCRVDGEFPDEEIECTEPIEVVSYKIGVCKVSQKGKDCSTTFKRLGYNTKSNTSVVLCRPKTGRMHQIRVHLQYLGYPVVNDPLYNHPVFGPLRGKGGDTGGKTDEQLVRDLIAIHNAENWLGVDAGDDDMLFSKPVAGDKVEDECEAGMASRESSPRLESPAPGLTPATVMTAILASPSSGSEAPVEVRSPAHSPSLNEDSNDAKSDKVTVATQTGCTPAHVVPNVSTGVSTSVSNVTGVYTTSQELTVDPHCYECRVRYRDPRPRDLVMFLHAWKYKGPGWEYETELPQWADIDWEESESS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: