MonarchBase - Protein-coding gene

DPOGS208689
Transcript	DPOGS208689-TA	4017 bp
Protein	DPOGS208689-PA	1338 aa
Genomic position	DPSCF300043 - 524264-528280
RNAseq coverage	130x (Rank: top 56%)

Annotation
*Heliconius*			%
*Bombyx*	BGIBMGA007799-TA	9e-46	53.12%
*Drosophila*	Fancd2-PA	2e-68	22.95%
EBI UniRef50	UniRef50_F5HPU9	0.0	45.45%	Fanconi anemia, complementation group D2 n=2 Tax=Obtectomera RepID=F5HPU9_BOMMO
NCBI RefSeq	XP_001810863.1	3e-111	25.80%	PREDICTED: similar to Fanconi anemia D2 protein [Tribolium castaneum]
NCBI nr blastp	gi\|350536779	0.0	45.45%	Fanconi anemia, complementation group D2 [Bombyx mori]
NCBI nr blastx	gi\|350536779	0.0	45.47%	Fanconi anemia, complementation group D2 [Bombyx mori]

Group
KEGG pathway
Orthology group	MCL12864		Single-copy universal gene

Nucleotide sequence:

>DPOGS208689-TA
ATGTCTCCAAAACGGAGAAAAACTATTCACGAAGATTATTTTGAAACTACTTTAAAAGAAAGTGGAATTGATCTAGCCAAACCCCCTGAAAGATGTGTAGCAAAATATGACATAATAGTTATTACGCGAAATTTAAAGAAAATTTTACAAAAGCACTCAGATTATCCCCAAAATTTATCTGAATTCTTCGATAATTTTGTTGAAAGATGTCAAGACTTAGAAATGTTCAAGCATTATTTATTTCCTAATATTGTCAGAAAAACGACAGAAGATCAGTCTATTCAGTGCAAAAACGACAGTATTGTTAGAATTCTTCTCACTATACCATTGTTACAGAATAAATTAATCAACTATATATTCGAAAAAGCTATTGACCTGGCCGCGGATTCAAAATGTGGGCCCTGGATCAAAATGATTTTAAGATCTTTATGCACTTTAGATAATATGATAGATAGTGACAATATAGCTACTAATATAATAAGTTTATTAGATGTTACTTATGAAGAGTTAGTGCAACTTGAAATAATAACTACTATTCCAGATATAATAGGTGACCAAGCACATGACAAAATTGTTATAGAATTAAGTAAAATATTGAAGCAAAAGGATCACAAGCTTATACCCGCTACACTTGACTGCCTTTCTTATTTGTGTCTGTCTAATGATCAATATGAAGAATTGAGGAATGAAACTTTGAACATTCTGAAGACAACAGCAAACTGCAGCTACTTTCCAAATTTTGTCAAATTTCTCCTAATTCCTGGAAAGTCATCTGAGAGTACACACATGGTGGCCGTAAAAGGGTTAAGAAATGCCTTGAGCTGGCCATCATCCATTGCATTACCTGAGGATATTGCATCCAGCCAAATATTAACAGCTCAGGCCATACGTAATACTATGGTATCCTCTGAATCCATAGCAAATGCTTGGATTAAATTAATTTCAAACTGTAATGTTCATTCAGATCACGAAGCATTCAATTTTATTATTATATTAATTCTATTCTCATTATCCGAAGAAAAACAAAAACAGGTGGAGAAGACAATGCGTAAACAAATAAAACTTAATATATTTAAGGAGGATTTATTGGATAAGGCCTTTGAAAAATATAAGCCAATAATCAAAGAATATCTAAAACACATGATATTACTAACAAACTCACTTTTAAAAACACCAGATTCTATGGTTCAATCTTTTGCATCACATATGTATACTCTGATGTTTGACCATCTAGAAGATTCTTGTCAGACAATAGTTGTAGAATTGTTGCAATTTGGATTGAATTGCAAGGATAGTCTTATCAATATATTGGCAATTTTAAACAATGTTGCAGCTAAGAATATGTCTGTATTAAAACAACAAAGTTCACAAATGTTAACACTTTTAGATAGAAAGGATGACATGACCTTGAATGAAATAAGGGCGGTCATGAATTTAGTATGCGGTCTAGCCTACAGCTATGATAACTCAGTAATACGAAGTGATGTTCATATAATAATAAGAAAGTACTTAGGAAGGTCCAACCACACTATTAAATATCATGGAATACTTGCCGGTATTCATGCTGTAAAATATTTAATAGCATTTACTTCTGATGAAGACAGTGATATAAGTTTACCGGAAGATATAAATTATGGCTCCGTGGATTGTCTCCCTGAAGGCAATCTTAGAGAGGCAGCACAGATCATAGAACTTATAAACTGCAGTACCAGGGAGTTTCCTAAAATGATAGCTTTTTTCTATGATGAATTCTGTGAAATAATCAAATCTTCATCCCACATTAACAAACATTTTCTTAAATGGATAACATTGGTTGTGACTAATGATTTGGCACAAAATTATATTGTAAATAATCTACCCCATGAGTCAGTGGGAGAGCTAACTCTGTGCCTGCAGTACTGTCTCAATGCGGAAAGTGAAAAAGATGATGAAATAGCCATTAATATTGCGGGCTTAACATTGGAAGAACAGGAAGATGTAAATATACTAATACTGTCACCTTTGTTCCAATTGGTTCAGACTTTGGATAACTTGGAAGAGAAGGATAATAATTCAACAAACATTTATGCACTAATCGGTTGTCCTGTTGTTATGCCAAAAGTAGACGTAGAAGTCGTGAGGGATGAACTTACTGATAGTTCTATATCAGCTATTCTGGATTGTCTTATTCACTGCGTCAATTGGTTTCGCGAAGTTTTAAACGCATTTTCTGCTGTCCCTGAGCAAAACTTACGAAGTAAGGTTATCAATAGGGTTTTCCATATACAGCAGTTGGAAAGCTTAATTACAGAGATTCTGACAAAGAGTAACCTGACATATCAGCCGCCATCTTGGGCGGGTCATCTAAACACGAGTAATGAGAAAGAGAAACTGGAAAGAACCTTAAAGAAACTGTCAGTTGCTAAACGCAAGAAAAAGAAAGAAGGGGTAACCGACGAATCGATTTTACCAGAAAGTTGTAAGTCGCAAGCTACGCAAAAAAAGACAGCCGGTAATTCCAAAATGGCTTTAACTCACAACATACAATTTAGAGCCCTTGACATAAAGGTCATTGAATTATTAAACGAAGAGTTAACAGAGACTGATTTCGAACAAGCTTTGACAGTCAAAATTGCCACATTTCTTTTAAGTCATATCAATAAAGCCCTTGAAAAGACGTTACACCCGAAGTTGAAAAAAAATATTTTCTCTAACAAACAAGATACCACTGATATTTATGACCCGGTTAAAGCAGAGCAATTTGCTGAATATGTCAACAAAATTATGCCAAAAATTGTTGAACATCTGACATTTGTTACGTCCTGTTTGGAAGCCAGGATGTGCTTCAATGATACCGATCAGGAGAGAGATGAAGACGATGAGCTTATGTATAACGACGAATTATTTGAATACATAAGTCTATTAGAAAACATATTTAATTTTCTAAAAATTTATTTCAAATGGATTGGTTTCAAAAATCGAAACAATCCGCTCTTGCAATCCTCTCTGAAAACATTAGCAAAGTTAGATGATGAAACATCCGTTACGATGCAGGACCTATTGACCAATATTGCGAAAAGTTTACAGAATTACAAAAAGTACTGTGTCTTTCTAAGTACAGCTACATCATTAATTGAACTGTTGAAAACATTACAGGAACATTCTTGCAATCGTTCTATATTGGTTATTTTAAGAGATACAGCAAAATCATTCTTATCAAAACCATGGAAGACTGCAGAGGGCGCAGACGAAAAAGGAGTTCAATTAAATCAAAGTATAGACATATTTGGTAAAGTTTTCTTCGAGAACATTGAAATTGATGACATTAAAGATTGCACTTTGTCAATAATGAATGACGTAGAGGCTCTTAAAAAAGGGCGTTCTCATCTCAATTCTTATAAAAGCATTAATAAAAACAATTTCTCGATATTATTCCGGATCATAGGAAGTTCTTTGCATGATAGAACTAAGCAGAAAGTAAACGAAAATCTAACTAACTCAGAACATTTGGAAGTGTGGGAAAGTGTGTTAGTTACATTGAAGTCTATGGTAGAAATAACAAAAATATTGGAATTCAGAAATATCATGGTGGTATTTTTCAAAAAATCTATCCCTGTTATAAAACTATTTGTGACATACGGAATCCCAATACTGCAAATTGAGTTCAAAAACAATCCGCAAAGAATATTAGGTATATGGAGCGTGTTACAGAAATCAACGAGGTTTCTACAATCCGTATGTTGTCATCTCAAATTGAAGAATGACAAAGTGTTGATGGCTAAAATTCCAACAGTCAAAGAACTGCTGGAGACGCTGATATATAAAGTTAAATCAGTTTTAGCGTCGAATGAGTGTACGGAAGCTTTCGAGATGGGAAACCTTAAAAATAGGAACATCCAAGGGGAAATCATTGCGTCCCAAGAAACTGTGGATGATGTAGAGGTGCAAGACGATTGTGACGACCACTTGCCAGATGACAGCGACTCCGAAGATAATGATCTAGATTTAGGCTTGAAGAGTGCAAGCGAAATGATATAA

Protein sequence:

>DPOGS208689-PA
MSPKRRKTIHEDYFETTLKESGIDLAKPPERCVAKYDIIVITRNLKKILQKHSDYPQNLSEFFDNFVERCQDLEMFKHYLFPNIVRKTTEDQSIQCKNDSIVRILLTIPLLQNKLINYIFEKAIDLAADSKCGPWIKMILRSLCTLDNMIDSDNIATNIISLLDVTYEELVQLEIITTIPDIIGDQAHDKIVIELSKILKQKDHKLIPATLDCLSYLCLSNDQYEELRNETLNILKTTANCSYFPNFVKFLLIPGKSSESTHMVAVKGLRNALSWPSSIALPEDIASSQILTAQAIRNTMVSSESIANAWIKLISNCNVHSDHEAFNFIIILILFSLSEEKQKQVEKTMRKQIKLNIFKEDLLDKAFEKYKPIIKEYLKHMILLTNSLLKTPDSMVQSFASHMYTLMFDHLEDSCQTIVVELLQFGLNCKDSLINILAILNNVAAKNMSVLKQQSSQMLTLLDRKDDMTLNEIRAVMNLVCGLAYSYDNSVIRSDVHIIIRKYLGRSNHTIKYHGILAGIHAVKYLIAFTSDEDSDISLPEDINYGSVDCLPEGNLREAAQIIELINCSTREFPKMIAFFYDEFCEIIKSSSHINKHFLKWITLVVTNDLAQNYIVNNLPHESVGELTLCLQYCLNAESEKDDEIAINIAGLTLEEQEDVNILILSPLFQLVQTLDNLEEKDNNSTNIYALIGCPVVMPKVDVEVVRDELTDSSISAILDCLIHCVNWFREVLNAFSAVPEQNLRSKVINRVFHIQQLESLITEILTKSNLTYQPPSWAGHLNTSNEKEKLERTLKKLSVAKRKKKKEGVTDESILPESCKSQATQKKTAGNSKMALTHNIQFRALDIKVIELLNEELTETDFEQALTVKIATFLLSHINKALEKTLHPKLKKNIFSNKQDTTDIYDPVKAEQFAEYVNKIMPKIVEHLTFVTSCLEARMCFNDTDQERDEDDELMYNDELFEYISLLENIFNFLKIYFKWIGFKNRNNPLLQSSLKTLAKLDDETSVTMQDLLTNIAKSLQNYKKYCVFLSTATSLIELLKTLQEHSCNRSILVILRDTAKSFLSKPWKTAEGADEKGVQLNQSIDIFGKVFFENIEIDDIKDCTLSIMNDVEALKKGRSHLNSYKSINKNNFSILFRIIGSSLHDRTKQKVNENLTNSEHLEVWESVLVTLKSMVEITKILEFRNIMVVFFKKSIPVIKLFVTYGIPILQIEFKNNPQRILGIWSVLQKSTRFLQSVCCHLKLKNDKVLMAKIPTVKELLETLIYKVKSVLASNECTEAFEMGNLKNRNIQGEIIASQETVDDVEVQDDCDDHLPDDSDSEDNDLDLGLKSASEMI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: