MonarchBase - Protein-coding gene

DPOGS200138
Transcript	DPOGS200138-TA	2217 bp
Protein	DPOGS200138-PA	738 aa
Genomic position	DPSCF300128 - 387940-391567
RNAseq coverage	218x (Rank: top 45%)

Annotation
*Heliconius*	HMEL007558	3e-99	61.20%
*Bombyx*	BGIBMGA002783-TA	2e-152	68.27%
*Drosophila*	CG42358-PA	1e-68	41.77%
EBI UniRef50	UniRef50_E2A4B7	3e-117	40.56%	Putative methyltransferase NSUN5 n=1 Tax=Camponotus floridanus RepID=E2A4B7_CAMFO
NCBI RefSeq	XP_968918.2	9e-127	41.62%	PREDICTED: similar to williams-beuren syndrome critical region protein [Tribolium castaneum]
NCBI nr blastp	gi\|189241014	2e-125	41.62%	PREDICTED: similar to williams-beuren syndrome critical region protein [Tribolium castaneum]
NCBI nr blastx	gi\|189241014	5e-134	36.76%	PREDICTED: similar to williams-beuren syndrome critical region protein [Tribolium castaneum]

Group
KEGG pathway
InterPro domain	[304-520] IPR001678	3.5e-24	Bacterial Fmu (Sun)/eukaryotic nucleolar NOL1/Nop2p
	[332-342] IPR023267	1.8e-14	RNA (C5-cytosine) methyltransferase
	[145-205] IPR019013	1.1e-11	Vacuolar ATPase assembly integral membrane protein VMA21-like domain
Orthology group	MCL13247		Single-copy universal gene

Nucleotide sequence:

>DPOGS200138-TA
ATGTTTGAACATTCTGTAAAAGTTCCAAGACATTATAAAGTAGCTGCAAATATTTTTAAAAAGGTTGCCACAGAAGGCGGTAGTGTCAAAAATTTGCTGTACGACGATAAATTAAAGCATTTCAGAACTAATGTGCTTTACGCACTTATAACAGAGACAATTAAACATGCGACTGATATTGATAAAATATTTGAAAATTGTGGTATTTTGGCGAAAGAGCAGCGGCTAGATCCTTGGCTTGCTAAGATTCTTACCGCAGAGTTGCTTTTTGGCAAAAAGGCTCTGCCTGGGAAAAGCAAACCTGAACTGACAATATTATCATATAAAGAACAGTTTGAGAACTTTAGGAGTGAAAATCCAGATGAAGTGAAATCTAAAGAGACTGATAAAGGTCCCCTCATACCGAAACAAACGAAGTTGGCAGCGCTCGCATTAGCCAATTTATTTTTATATAGCGTGGCAATGTTTACATTACCATTCATAGCATTTTTTGGTGTACGTCATGTTCTGACAGACTATTACCCAGTTGATCAATTCACGAGGAATGTTTGGTCGGTTGTATCAGCCGTTGTTGTTGTCAATGTCATAATCGCTATGTACGTGTACAAAGCTTATCATGAGAAAGAATATGATGAACATGGAAATGAAATCGACCAGCATTCATATGGTCCCCATGAAACAAGCAAAAAACCGCGGTACGTCAGGATAAACACGAACCTTTTAACCACATCGGATGCTATAAGAGCATTCCAAGACGAAGGCTACAAGTTCATAAGATGTACATCAGGGTCCTATGATGATTACTTGAAGCAGATCCAGGGTTTGACGGAGTACGACTTCACTCAGGACTACCATGTGAAAACCATGTTTGTGTTTGCACCGGGAACCAAGTTTCACGACCATGATCTGTACTTGAATAATCAAATTATTTTGCAAGATAAGGCTACAGCCCTAGCCGTACACCTGCTCGCCCCGCCATCTGGCAGCACTGTATTAGATATGTGTGCTGCTCCAGGTATGAAGACCACACAAGTTGCTGCATATCTTCGAAACCAGGGTAAGGTATACGCTGTTGAGAGGAACGATCAGAGATATCAAACACTGTGTCAATTAGTCGAGAGCACTTCATCAAAATGTGTTGAGACCATACATAAGGATGTACTGGAGATTAAGAGAGGTGATTTAGATGATGTGGAATACGTCCTGCTGGATCCCAGCTGTTCAGGATCTGGTATGGATTTTTCTGTCCACAACTACATCGAAGACACGAGGCTGGCCAAACTGACCTCGTTGCAAGAGAAATTTCTGAAACACGCAATGAACGCGTTCCCGAATGCAAAGCGCATAGTCTACAGTACGTGCTCGATATTTCCCGAGGAAAATGAACGGGTTGTGACAAACGTTGTGAAGACTTCAAGGGCTAAGTGGAGGGTGCAGGATGTTAAGGAGCTGTTGAAAAACCAGTGGAACAACTACGGTTCAGGAATGTATGGCAGTATGGGTACCAGGTGTCTATATTCTAGACCGGATACCGATATGACAACTGGATTCTTCCTAGCCGTCTTGGACAGAGACCAAAAAGCCCGTGACGATGAGGGGAAAAATCTTAATATTGACGATAATAAAGTCAAAAGTATGAGTAAAGACATCCCTAATGGCAAAGCAGTTCATGAAGCTGAATATGCATCAACCTTAGATGAGGTCAGTGACGTCATAGTGAAGAAAAAAAAGAAAAAAGAGAGAATACGTTCAGAAAATGAGAGCGATATCAAAAATAATGTTACTGAAATAGAATCTGACTTAACGAAAGGTGACGTCGAAACTAAAATGAAGAAAAAGCACAAAAAGAGCAAATCCAAGGACGACGGTAATGATCAAGAGTTCAAACAAAGTGTTACAGAAGAAGTGATTGCAGAATATCATCAGGATATAACAGAAGTAGACCGTTCAGATAGAACAGACAATATTGAAACCAAGAAGAAGAAAAGAAAGAAGAGTAAAACTTTAGAGCATGATACGGGCGAAGATGACAACTCGAAACAAAATCACGAACCAGAAGACGACGGCCTAGAAGAACCTTCAAAGAAGAAAAAAAAGAAAAAAAAAAGTGAAGAAGAATCTACAGCAAATGATAGTTCTGTTTCCAATCACTTAGATTTTACAGAAGATAATGTAAAAGAGAAGAAAAAGAAGAAAAAGAAAAATCATTTGGATTAA

Protein sequence:

>DPOGS200138-PA
MFEHSVKVPRHYKVAANIFKKVATEGGSVKNLLYDDKLKHFRTNVLYALITETIKHATDIDKIFENCGILAKEQRLDPWLAKILTAELLFGKKALPGKSKPELTILSYKEQFENFRSENPDEVKSKETDKGPLIPKQTKLAALALANLFLYSVAMFTLPFIAFFGVRHVLTDYYPVDQFTRNVWSVVSAVVVVNVIIAMYVYKAYHEKEYDEHGNEIDQHSYGPHETSKKPRYVRINTNLLTTSDAIRAFQDEGYKFIRCTSGSYDDYLKQIQGLTEYDFTQDYHVKTMFVFAPGTKFHDHDLYLNNQIILQDKATALAVHLLAPPSGSTVLDMCAAPGMKTTQVAAYLRNQGKVYAVERNDQRYQTLCQLVESTSSKCVETIHKDVLEIKRGDLDDVEYVLLDPSCSGSGMDFSVHNYIEDTRLAKLTSLQEKFLKHAMNAFPNAKRIVYSTCSIFPEENERVVTNVVKTSRAKWRVQDVKELLKNQWNNYGSGMYGSMGTRCLYSRPDTDMTTGFFLAVLDRDQKARDDEGKNLNIDDNKVKSMSKDIPNGKAVHEAEYASTLDEVSDVIVKKKKKKERIRSENESDIKNNVTEIESDLTKGDVETKMKKKHKKSKSKDDGNDQEFKQSVTEEVIAEYHQDITEVDRSDRTDNIETKKKKRKKSKTLEHDTGEDDNSKQNHEPEDDGLEEPSKKKKKKKKSEEESTANDSSVSNHLDFTEDNVKEKKKKKKKNHLD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: