MonarchBase - Protein-coding gene

DPOGS208101
Transcript	DPOGS208101-TA	1992 bp
Protein	DPOGS208101-PA	663 aa
Genomic position	DPSCF300395 - 669-5665
RNAseq coverage	2x (Rank: top 91%)

Annotation
*Heliconius*	HMEL004924	4e-40	65.60%
*Bombyx*	BGIBMGA001818-TA	2e-69	58.11%
*Drosophila*	Nup98-PA	5e-71	35.82%
EBI UniRef50	UniRef50_Q9VCH5	7e-69	35.82%	Nup98 n=48 Tax=Drosophila RepID=Q9VCH5_DROME
NCBI RefSeq	XP_001994256.1	3e-74	43.41%	GH10992 [Drosophila grimshawi]
NCBI nr blastp	gi\|195054687	5e-73	43.41%	GH10992 [Drosophila grimshawi]
NCBI nr blastx	gi\|312374010	3e-75	36.53%	hypothetical protein AND_16639 [Anopheles darlingi]

Group
Gene Ontology	GO:0006810	1.1e-53	transport
	GO:0005643	1.1e-53	nuclear pore
KEGG pathway
InterPro domain	[172-330] IPR007230	1.1e-53	Peptidase S59, nucleoporin
Orthology group	MCL10889		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS208101-TA
ATGACGAAGGGTGACGGCCTGTGGTTCCAGAAGTCTCTGTTCGACGGCCTGGAGGAGGGAGACGCCAGTGTGGAGGACAAGCTGACGACACGACCCAGCAGGAAGAGGCTCGTGCTGAGGAACAGGCCGCCAGCCGACAGGTCGCTGGAGGAGAGTCAACAGAACGGCGGCGAGGAGCGCCCGGCGGCGGAACACGACAAGGTCGACGGCGAACACACGCAGAGCGACGCCGCGGCGAATCGGCACGGCAGCTGGCTCGCGTCTCCGAAGAACTCAAACTCCTGGAAGGAAAATGAGAAGCCGGCTGACAGTGAGCCGGCTGCGAGGCTGTACCCCGACCTGGAGAAGGAGCTCCCGCCGCAGGTGCCGGACAGACGGGCCAGCTGGCTGTCGTCTCTGCCCCTGCGCCCTCTGCCGGGGTCTCTGGATGCGGAGAGTTCCGTCAGGGAGCTGGTCCGGGGAGGCAGGGACAAAGTATCCGAGGAGGAGAATATTCCCCCCCGGGAGGTCGCGCCCCACCCGGCCGGGGTCAAGCTGACGAGGCCGGGATACTACACCATACCCAGCCTGGAGGAGATGACTGAGTATCTCCGACCCGATGGTTCCTGCCGCGTGCCTCACCTCACCATCGGCAGGAAGAACTACGGGAACGTGTTCTACGACTGTGAGATCGACGTGGCCGGCCTCGACCTGGACCACCTGGTCCACTTCCTGAACAAGGAGGTGATCATCTACCCCGAGGACGAGGGGAAGCCGCCGGTCGGCTCGGGTCTCAACCGCCGGGCCGTGGTCACGCTCGAGAGGGTCTGGCCCCGCGACAAGACCGAGAGGAGGCCCGTCACGGAACCCGACAGGTTACTGAAGATGGACTACGAGGGCAAGCTGAGGCGGGTGTGTGACAAGCACGACACCAAGTTCATAGAGTACAGGCCGCAGACGGGCAGCTGGGTGTTCAGGGTGGAACACTTCAGCAAGTACGGCCTGACTGACTCGGATGAGGAGGACGACATCACACCCAACATACTCAAGAGACAGCTGGTGGACCAGAACTTGCAGCAATCTGCAGCACCTCCTAAGCCGCCGCCACCGTCTGCCGGCCAGCAGCCAGGTCTAGGAGGTCTCGGAGGTCCGGTCGCTCCGGCTACATCGGGGCCGGGTCTGAGCGGGTCTGGCGCGGGTCCAGCGGGCCCCGGCCTCACGCTCGGCCTGTCAACAACCTCCGTAGGGAGAGACGAGTACATGGAGCAGACATCACTCAACCTGTTGAACGGAACTAATAAAGGCTTCACTATGGACTTCACTGAGGACGGGGACCAGAACAGTCTGTACCAGGACGGAGGTGTGTGTGTGAAGAGCCCCACTAGTGAGCTGGCCCGCCTGGAACACCGCGGCAGCCACCGCCTGCAGCTGATGAAGGCCAGCCTGTACGCCGACGGCGCCGGTACATACCCACATACACACTCACATACACACACACATACACGCATATATTTATACTATAGTATTATCTGTTCCGATCCGTCGCCAGCGGACATGATGGAGGAGGTGTCCTCGTTCTCCGGGGACCAGCTGGTGCCTCACGCGGCGATGACGTCACCACACCCCACCAGCGACACCATCCGGGAGGTGGTGCAGACCGTGGACTCTACACAAGTGCAGCCGGAAGTGTCGGAGGTGATGGCGCGTCCCATAACAGTTCACCCTCACACTGTGGTGCTGAAGTACCACAAGAAGATACCACCCTTCAGGGAGACCATAGCCGGTGAGCTGAGACACACACGCACACAGTCGTATGTCAGCATCTTCCCTGGTGGACCTGTCCGTGTCCCGGGCCCGCCTGTCTCGCTGGTGTGGCCGGCCAGGGGTCATGGTGGTACACTCCACCACAGCCGCAGCCGACCACCTCCCACCAGGTTAGGCCCGCACACACATACTGTGTGGATGACTGTTCTCCTGAACCTCACACACAGAGCACTCATAGGAAACGAATGA

Protein sequence:

>DPOGS208101-PA
MTKGDGLWFQKSLFDGLEEGDASVEDKLTTRPSRKRLVLRNRPPADRSLEESQQNGGEERPAAEHDKVDGEHTQSDAAANRHGSWLASPKNSNSWKENEKPADSEPAARLYPDLEKELPPQVPDRRASWLSSLPLRPLPGSLDAESSVRELVRGGRDKVSEEENIPPREVAPHPAGVKLTRPGYYTIPSLEEMTEYLRPDGSCRVPHLTIGRKNYGNVFYDCEIDVAGLDLDHLVHFLNKEVIIYPEDEGKPPVGSGLNRRAVVTLERVWPRDKTERRPVTEPDRLLKMDYEGKLRRVCDKHDTKFIEYRPQTGSWVFRVEHFSKYGLTDSDEEDDITPNILKRQLVDQNLQQSAAPPKPPPPSAGQQPGLGGLGGPVAPATSGPGLSGSGAGPAGPGLTLGLSTTSVGRDEYMEQTSLNLLNGTNKGFTMDFTEDGDQNSLYQDGGVCVKSPTSELARLEHRGSHRLQLMKASLYADGAGTYPHTHSHTHTHTRIYLYYSIICSDPSPADMMEEVSSFSGDQLVPHAAMTSPHPTSDTIREVVQTVDSTQVQPEVSEVMARPITVHPHTVVLKYHKKIPPFRETIAGELRHTRTQSYVSIFPGGPVRVPGPPVSLVWPARGHGGTLHHSRSRPPPTRLGPHTHTVWMTVLLNLTHRALIGNE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: