MonarchBase - Protein-coding gene

DPOGS202835
Transcript	DPOGS202835-TA	4074 bp
Protein	DPOGS202835-PA	1357 aa
Genomic position	DPSCF300018 + 888067-894218
RNAseq coverage	113x (Rank: top 59%)

Annotation
*Heliconius*	HMEL006293	0.0	42.41%
*Bombyx*	BGIBMGA010508-TA	6e-76	46.26%
*Drosophila*	CG18596-PA	2e-31	49.24%
EBI UniRef50	UniRef50_UPI00022C9DF4	1e-45	22.68%	UPI00022C9DF4 related cluster n=1 Tax=unknown RepID=UPI00022C9DF4
NCBI RefSeq	XP_001664217.1	7e-39	33.52%	hypothetical protein AaeL_AAEL013974 [Aedes aegypti]
NCBI nr blastp	gi\|350415073	5e-45	22.68%	PREDICTED: hypothetical protein LOC100745300 [Bombus impatiens]
NCBI nr blastx	gi\|348507284	4e-41	25.13%	PREDICTED: probable methyltransferase TARBP1-like [Oreochromis niloticus]

Group
Gene Ontology	GO:0006396	7.6e-18	RNA processing
	GO:0003723	7.6e-18	RNA binding
	GO:0008173	7.6e-18	RNA methyltransferase activity
KEGG pathway
InterPro domain	[1227-1348] IPR001537	7.6e-18	tRNA/rRNA methyltransferase, SpoU
Orthology group	MCL17535		Insect specific

Nucleotide sequence:

>DPOGS202835-TA
ATGTATAAAGAAGGAGAGTTATTATCTTTCTTGGATTTGCTAGATTTAGATGAAGAGGTTATAGACAGAAGAGCAAAAAGTATCATGCAACGAAGTACTTTAAGCAGTCAGCACTTAGAACATTTTATTTACCTTCTGCAATACAAGCATTTGATCAACATCAGAGAGAATAGTGAATGCGAAAATGAGGAGGAATTCAACTTTCTTAGTAAACTAATTGTCGACGCAGACAATGAGAATGCGAACGCAACATGTACACTTGTAAATTTAGTATTAACATTAAATCCTTCCACCATAATAAATAAATCCGAGCATCTCTTGCAACAAATATTATCAACATTAAATTTCCCTCCTATTAAGAGGAGCATCATTGAAGATGGTGGTTCAACAAGTAGAGAGACAGAAGACACACTAGTTAAACTAAGGATTTGTGGTAGTGTATTAGATGCTGTGAAGAAAGTTGGAGCTAGGCTAGAGCAAATTATTTGCACTGAAAATAAACAACTACAAGGATTCTTCCTTATGAACACTGTTCCCAAATTTTTTGAGACCGTTGATGATTGTAATATTCTTGATAGAATTTGGAGTTTCGTAAAACAACTAAATGATAGTGCAAATGCTTTAAAAGTTTTATGTAGCCTTTCAAACTATTATTTACCAGTAATTGAAGATGAATCTGAAAATATTTCAATCGAATCTACTATCATAATGGATTCCGAGTTTTGGAATTTTATTCTGAGTGGATTGCTCTGTGAAGCTCAATGTTTATCTTTAAGAAAGCAGGCCATATACCTCGCTAAGAGAGCCATAGACTATGCTGCATATAGGAAAAAAGATATTAAAATCACCTCACACAGCACATTCATATGGTCTAAAGAAAATGAAAAAACATTAAGAAAAATGTGGGAAAACTATTTTATATTAATAGATAGTTTACAAGAGAAACAAAGCAATATTGTTCTACCGTCATTAAAACTTTTTAATAGCATCAACGACATAGGCCACTGTTGGTTGGCGGCCGCTTTTAATATTGGCCTGAAACATGATAATTTCCAAGTGAGACAAAAATGCTTGATCTATAGGTTTCAGTATAGAATAAGTAATCAAATGGAGGCTGTAGGTGTTCTAGAAGCTCTTAACGACCCAGCAATATTTGATAATAGAATTAGACATACCTCAGTTATTACACTACTGAAGGAAGCCCTAACAAATGTTCGAACACTTATAAATTTTCTCCAGGGAATGGCGGATGTCAAGTTGTCACCAGTGCCACTGTTCTCTTTGACATCCTGCTTAGCTGATCTCCATATATTGCTTAGCGATTCTGATCAGAAAACTTTATTAAAAACTATACACAAGATATTAAACACTCCATGCAATAACACAGTGCTAAGAAAGGCCATATGTGTTAACATGTCACACTTTATTGCAAATTGCTGTAAGAATTTACATTGGAAGGAGTATTTATTGTTGTATCCATTACTGGCTGTTGAATGCAACCAGGAATTTATGAATCCATTTGTTAGTTTCATACAGAATGATATGGATGTACCTGAGGATGAGATGGTGCAGTTCATAAATAGTGGAAAGAAATCGCATCTTAATATACAATATGCCCTAATTTACTTCCGAGGTCAAGATAAGCCCTTGTTTCTGGAGATGATCGATGATATGATACATCAAGTCAAGGACACCAGCAGTAGACAGTATTCAAACAAGTTAGACTGTTTAGACGAGGCCATCTTCATCTCACATTTGTATAATTGTCGAGACAATAACACAATAACTCATATATATTACAATTCTGAAGCATTCCAAGCTATAATGCAATATATTGGTAGTTTATTGTCAGATGAAATTAATTTGGATTTTGATAAAATGAATTTACTCTTAGAAGGTTTCGATTATGCATTAAGAGCTGTGAATATTATTAATTATAAGGAAAACTTAATACAGTTATATAAATCAGCTGAGTTTCTCCTAAAAGATATAAACTCTGATCTGCAGAAAAAACTTCTTGCATTACTCACTCTCAATACACTTATGAAATCGAAATTTCGGGACGTTTGTGACGAAGGTCCGGTTATTGAAGCATTTGTAAACATCATTAAGAATATTAATTATTCTGGACAAAAACGAGAAGATGGCGGCAGATTGAGGAACAGTTTTTATGAAAATATATGTCATTTATTGTGTACAGTGTATACAAGTGGATCTATAAAAGATATTATATATTTTATTGATACAGTAGTGGAATGTGGAGGTCACGGCTGTTTGAAATGGTTATTGAATTTAACTAATAAAATAATAACGGAACTGTTAGAGCAAGATAGTGTCAAATTTGATTTAATACAGTTTCTGAATAGAATGTGGAAAGAGATCGAAGACCTGAAGTCAAACAGCCAATATTCAATTTGTATGGAACACTTTATAAATCTGCTCACCCACGATGCTGTGTTAAAGAGACCAATATATAATAACCTCGTTATCTCATACTGCAATAAGATTATTAACTATGCCACATTAAAGTATTCCCCGCTGTATTTTCTTATAAGACGACTGACTCTGATTGATATCTCGTCTTATGGCCACATGATTTATATTTTATGTGAAATTTTGCTATACGCAAACATTCCGAACAAAGAACAAAGGATAGCTGAAAACTTACAAGTGACAATATTAGAGCGATCAGATTTTTTTGGAATAAATGAAGAATGCGTCCAGTTTAATTGTCACATACAATATTTGGCAGTTTCAGTACTTGTTAAGATAAGGGACAATGAAATTCTTGATACCGTGGTGAGGTCAGTGAGGAGAAGGATTGATGAATTGCTGAAAAATAAGCTTCGGTACCACGAGAATTCCTACCTCGAGAGGTCTATAGAATCTTGTTTACAATGTTTGCTCTTCATAGCTCTTATGACCGAGGAGGTCGATTTGAAGGACAGTGCTGTGTGGTGTATGGAGTTATTGGGAAGGATGCCACACCAACCGTATGTCAAGATATGTCTGGAATGGTTTATTTGCTTATACTATTATTTTGAGGCGGAGTTCGATCACGTCATGGAGTTTTTAACCTCACACAGCATGGGCCCGGTCTACGGCGTGCGGCTGAACGCACAGTATCTGGCCACGAAGATTGTTGACATCAATGACAAACAGAAATACAAATTGGATGACAAACAATTCACATACATTATAAGGGTTATAAGGAATTGTCTGCGTCAAGCCCAGGAGTTGGAAGAGAAGAGTCTCATGAAGTTATCGAACAGCTGTTTCATCAATTCGTTTGACATCGTCCAAAGCTTGAACTTCTTCGACGTGTTCTATAAACTGCCCCTGTCGTTAACACACACCGCCAGACATTTCGATATGACCAATAAATTTCTTCAAACTGTGACCATGGACATTGAAGCGTGTTTGGAAACAGGTTTGAGGGGTGAACTCCTGAGTGGTCGATTCGTCGTTCCAGAGAAGATCCGATGTGAGTTTTTAACAGATGTCATTGATGACGAGGAACCTGAGATTATACAAAAAAAATACGTCCCCTGGAACGGTATGAGCGACGTGGACGCTCACAGCGAACGTCATGTAAGAGTTATTATTCATATTAATCAGATTCAAACAGTTGCATCAACAGCCCTCGTAGTTGTAACAGCACCCGACGATGAAACGGGGGAGGTGTTCGGAGTACACACGTACGTCATGGACAGCCTGAGACATCTACAGAACAGAATGTTCCAGGACCTGAGCGTGTCAGCTGAGCGGTGGCTGAACGTGGAAGAGGTCCGCCCGGGAGAGCCTCTCAAGCGATATCTCATGACGAAGAAGGCCGAGGGACACATCGTCGTAGCTGCGGAACAGACTTCTAATAGCGTCAAACTGCAACATTTCAAATTCCCCAAGAAAACCATCTTGATGCTGGGACACGAGAAGGAGGGCGTCTCGTGTGAGCTGCTGCCTCTGTGCGACGCGTGCGTGGAGGTCCCTCAGCGAGGAGTGGTCCGCTCTCTCAACGTGCACGTCACCGCCGCCCTCTTCGTGTGGGAGTACACGCGCCAGCACCTCCTCTAG

Protein sequence:

>DPOGS202835-PA
MYKEGELLSFLDLLDLDEEVIDRRAKSIMQRSTLSSQHLEHFIYLLQYKHLINIRENSECENEEEFNFLSKLIVDADNENANATCTLVNLVLTLNPSTIINKSEHLLQQILSTLNFPPIKRSIIEDGGSTSRETEDTLVKLRICGSVLDAVKKVGARLEQIICTENKQLQGFFLMNTVPKFFETVDDCNILDRIWSFVKQLNDSANALKVLCSLSNYYLPVIEDESENISIESTIIMDSEFWNFILSGLLCEAQCLSLRKQAIYLAKRAIDYAAYRKKDIKITSHSTFIWSKENEKTLRKMWENYFILIDSLQEKQSNIVLPSLKLFNSINDIGHCWLAAAFNIGLKHDNFQVRQKCLIYRFQYRISNQMEAVGVLEALNDPAIFDNRIRHTSVITLLKEALTNVRTLINFLQGMADVKLSPVPLFSLTSCLADLHILLSDSDQKTLLKTIHKILNTPCNNTVLRKAICVNMSHFIANCCKNLHWKEYLLLYPLLAVECNQEFMNPFVSFIQNDMDVPEDEMVQFINSGKKSHLNIQYALIYFRGQDKPLFLEMIDDMIHQVKDTSSRQYSNKLDCLDEAIFISHLYNCRDNNTITHIYYNSEAFQAIMQYIGSLLSDEINLDFDKMNLLLEGFDYALRAVNIINYKENLIQLYKSAEFLLKDINSDLQKKLLALLTLNTLMKSKFRDVCDEGPVIEAFVNIIKNINYSGQKREDGGRLRNSFYENICHLLCTVYTSGSIKDIIYFIDTVVECGGHGCLKWLLNLTNKIITELLEQDSVKFDLIQFLNRMWKEIEDLKSNSQYSICMEHFINLLTHDAVLKRPIYNNLVISYCNKIINYATLKYSPLYFLIRRLTLIDISSYGHMIYILCEILLYANIPNKEQRIAENLQVTILERSDFFGINEECVQFNCHIQYLAVSVLVKIRDNEILDTVVRSVRRRIDELLKNKLRYHENSYLERSIESCLQCLLFIALMTEEVDLKDSAVWCMELLGRMPHQPYVKICLEWFICLYYYFEAEFDHVMEFLTSHSMGPVYGVRLNAQYLATKIVDINDKQKYKLDDKQFTYIIRVIRNCLRQAQELEEKSLMKLSNSCFINSFDIVQSLNFFDVFYKLPLSLTHTARHFDMTNKFLQTVTMDIEACLETGLRGELLSGRFVVPEKIRCEFLTDVIDDEEPEIIQKKYVPWNGMSDVDAHSERHVRVIIHINQIQTVASTALVVVTAPDDETGEVFGVHTYVMDSLRHLQNRMFQDLSVSAERWLNVEEVRPGEPLKRYLMTKKAEGHIVVAAEQTSNSVKLQHFKFPKKTILMLGHEKEGVSCELLPLCDACVEVPQRGVVRSLNVHVTAALFVWEYTRQHLL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: