MonarchBase - Protein-coding gene

DPOGS206863
Transcript	DPOGS206863-TA	2934 bp
Protein	DPOGS206863-PA	977 aa
Genomic position	DPSCF300001 - 2559218-2565876
RNAseq coverage	260x (Rank: top 41%)

Annotation
*Heliconius*	HMEL014046	0.0	53.49%
*Bombyx*	BGIBMGA012814-TA	4e-176	59.05%
*Drosophila*	su(w[a])-PA	1e-75	36.32%
EBI UniRef50	UniRef50_UPI0002064551	5e-98	41.51%	UPI0002064551 related cluster n=3 Tax=unknown RepID=UPI0002064551
NCBI RefSeq	XP_001603801.1	5e-85	54.63%	PREDICTED: similar to GA15714-PA [Nasonia vitripennis]
NCBI nr blastp	gi\|350413632	3e-98	42.77%	PREDICTED: hypothetical protein LOC100749326 [Bombus impatiens]
NCBI nr blastx	gi\|350413632	2e-107	32.06%	PREDICTED: hypothetical protein LOC100749326 [Bombus impatiens]

Group
Gene Ontology	GO:0006396	4.3e-16	RNA processing
	GO:0003723	4.3e-16	RNA binding
KEGG pathway
InterPro domain	[27-143] IPR019147	4.1e-30	Splicing factor, suppressor of white apricot
	[182-235] IPR000061	4.3e-16	SWAP/Surp
Orthology group	MCL17043		Insect specific

Nucleotide sequence:

>DPOGS206863-TA
ATGTCTCTGAAATGGACTGGAAATCACAATGAAACTGGTATACTAAGAAAGAGTGATGCAAGCAGAGAGAAGAAAGAAGAGTTATTCGTGTTCGGGTATTCGTGCAAACTGTTCAGGGATGATGATAAAGCTCTGCACATTGACCAAGGAAAGCATCTCATTCCGTGGATGGGGGATGAAACTTTGAAAATCGACAGGTATGACGCAAGAGGGGCCCTCCATGATTTGGTGTCCTTAGAAGCTCCACCTGGTGGCTTCGACTGGCGTGTGGAGCTTTCCAGATCTGAACAGGATGTGGAACAGCTCTGTGATGAGGAGAGATACCGGGCCCTACATACTGATGAAGATGAGGAAGAAATGTATAAGGAGGAAGAGCTTAAACGGCTCCATGCAGCAGGTTATGGTCAAGTCGGCTTCAACTATGACGCTCCAGCTGAAACACCTCCTGAACCTCCAGTAGAAATTGAAGAGCCCTTTGAACCTACAGCTTCATTTAAAGAACTGCTGCCTTCAAATACAGAATTTCCTCCAACACAGAAGCAAAATGCAATTATTGAAAAGACAGCCAAGTTTATAGCACATCAAGGTACCCAAATGGAAATTCTTATTAAGGCCAAACAGGGTGACAATCCCCAATTTCAATTTCTCAACAAAGATTCATCACTACATCCCTACTACACGACCCTTATAGCATTGGTCAAAGCTGGAAAGTGGCCGGAGAAGGCAGAGGTTGTTGAAGAAAAACATGAAACAAATGAGGAGTACCTTCATCCAAGCTTAGCATCAACTGTTATAGAATCGGCTCCTTCAATACCGAGCATTCACTACAAGCCATCTGCAGATTGTGACTATACTTTACTGATATCAAAAATGAGGGGCGAGACATTGGATGAGTACTCCGACCTGGCGCCTGGCGAGGTGGCTCCCCCGGGAACTGAACCTGTGCTACCAAGGGCTGATATCATGAAGGCACCGGTCATGTACAATAGAGGAGAACCAGTTCCACCGATTCCTCAAACTGTGCAACATCATCAGTATGCAGCGTACTACACACAGTATATGGCTCATCTAACACAAGCACAGACACAAGCACACACGCCACAGACGACAGTTGAAAAACCAGCACCGACCATATCTCCAACGGAATCCACCGGTTTAAGTCTTATGAAGAACTACAACACGGACAGTGAAAGCGAAGAATCAGAATTAGAAGAGAGTTCTAAGCAAGGAAGCAAAGACAATGTGTTAGTTCCACCGAACGATATTCATGTGGTCATAGACAAGATGGCGGCATACGTAGCGCGGAACGGTGACGAGTTCGAAAAAATTGTTCGGTCTAAAAACGATCCGAGATTCACATTCTTAGATGACAGTAATATATATCATCCATACTACAAGAAATTGATGCTTGAGAAAAGAGGTGTCCCAAATGGAAAGGATAAAAACGAAATTGATAAAGCAATCCCCGTGTCGTTTTCAATAAAGAAACATAAAGAACCGGAACCGATTCTCCCGAAGCCAGCACTTCCATACGAGTCGAGCACAGATGGTGAGGAAGAAAATAAAGAAGCCGATAAACGTGAAGCACCTAAGGAAGTGCCAGTCACTAATATACCGCAGACACATCTCACTAACAACAGTAACAGTATTCCGCCTATTGTTGTATACAAAATGGAAGCTGTACAGGCCAACAATCTGCCTTTAGTGAAAACATATGAACCTTGCAACATTGGCAAAGCAGTTACTGAAGTCAGTGAGAATCCTAAGGAAGCGGTTGTTCCTCAAGTAGTTGAAAAAATTACAGAAAATGTCTTACAGCCCCCTGCTGAAATTAAAAAGGAGAATTCGCCGGAAAAAAAAGTTGTCGAACGGGCCAAAGACAAAGATAAGAGTCCCAGGGATAAGAGTCCTAAAGAAAGGAGTCCTAAAGAAAGGAGTCCTAAAGAAAAGAGTCCTAAAGATAAGAGCCCTAAAGATAAGAGTCCTAGGGATAAAAGTCCTAGAGACAGGAGCCCTAGAGATAAAAGGAAATCTAGAGATCGAAAAAAGGATTATAGATCAAGAAATGATAGGGAATCGAGAAGATCCGATCGGAGAAATGATGACAGAGACAAAGAACGCGAGAGAAAGAGAGACAGAGAGAGTGACAGGGATGGAAAAAGAAAGAAATATAAAGACGCCATAGAAACAGAAATTATATCATTAGAAGATAATTCTGATGAAATGATTGATTTGACCGGCGAGCAATCCGATTCCAGAGGCGAAGAGACGGAGGCGGATCGTTGCAAGCAGCAGCAGCGTCGTCGCCGTGCGGCGGAGTTCCTCCGACGTGTGTCCTCCTCCCGCACGAGGACTAGCCACGGGACCGACCGCAACCCTCGCCCACCGACCGCTACTCTACCGCACTCCTCACTAGCCAGCGCCATGGTTGACACATTAGAATCATTGTACAAAAAGAAAAACGAGGAAGACGAAAAGAAGAAGCGAAGAGAGAAACGACGGCAACGAGATAAAAGAGATTATGAAGAAGAATCCGACAGATACAAGAAAAACAAAAGAAGGAAGAATAGGTCTTCAGAAGAGGAAGACTCAGATGGACCGGGTTCCAAAAAGAAGAAGAGAAGGAAAGAGAAAAGCCATTCCTCTAAAAGCCAGAAAAAACCGAGAGACACAGAGATAGGTGAAAAGCCACAGCAAATTAACATCGATATAACGAACACGCTCAAGGAGCTAAGGAACTCATCCCCCACAAAAGAACTAAGATTAAGAGAGGAGAAGCTTTTAATAAAAGATAATTCCGATGGAGAGAAAAGTATGAAGAGCATAAAGAGAGATAGAGAGTACAGCGAGGGAGAGTGGTCCAGCGATAGTAATAATGACTCCGGCTTAAGTGACAACAATGCGGAACAAACCGTAGCTGGGAAATCAAATTAA

Protein sequence:

>DPOGS206863-PA
MSLKWTGNHNETGILRKSDASREKKEELFVFGYSCKLFRDDDKALHIDQGKHLIPWMGDETLKIDRYDARGALHDLVSLEAPPGGFDWRVELSRSEQDVEQLCDEERYRALHTDEDEEEMYKEEELKRLHAAGYGQVGFNYDAPAETPPEPPVEIEEPFEPTASFKELLPSNTEFPPTQKQNAIIEKTAKFIAHQGTQMEILIKAKQGDNPQFQFLNKDSSLHPYYTTLIALVKAGKWPEKAEVVEEKHETNEEYLHPSLASTVIESAPSIPSIHYKPSADCDYTLLISKMRGETLDEYSDLAPGEVAPPGTEPVLPRADIMKAPVMYNRGEPVPPIPQTVQHHQYAAYYTQYMAHLTQAQTQAHTPQTTVEKPAPTISPTESTGLSLMKNYNTDSESEESELEESSKQGSKDNVLVPPNDIHVVIDKMAAYVARNGDEFEKIVRSKNDPRFTFLDDSNIYHPYYKKLMLEKRGVPNGKDKNEIDKAIPVSFSIKKHKEPEPILPKPALPYESSTDGEEENKEADKREAPKEVPVTNIPQTHLTNNSNSIPPIVVYKMEAVQANNLPLVKTYEPCNIGKAVTEVSENPKEAVVPQVVEKITENVLQPPAEIKKENSPEKKVVERAKDKDKSPRDKSPKERSPKERSPKEKSPKDKSPKDKSPRDKSPRDRSPRDKRKSRDRKKDYRSRNDRESRRSDRRNDDRDKERERKRDRESDRDGKRKKYKDAIETEIISLEDNSDEMIDLTGEQSDSRGEETEADRCKQQQRRRRAAEFLRRVSSSRTRTSHGTDRNPRPPTATLPHSSLASAMVDTLESLYKKKNEEDEKKKRREKRRQRDKRDYEEESDRYKKNKRRKNRSSEEEDSDGPGSKKKKRRKEKSHSSKSQKKPRDTEIGEKPQQINIDITNTLKELRNSSPTKELRLREEKLLIKDNSDGEKSMKSIKRDREYSEGEWSSDSNNDSGLSDNNAEQTVAGKSN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: