MonarchBase - Protein-coding gene

DPOGS215362
Transcript	DPOGS215362-TA	1254 bp
Protein	DPOGS215362-PA	417 aa
Genomic position	DPSCF300351 + 27407-31747
RNAseq coverage	466x (Rank: top 27%)

Annotation
*Heliconius*	HMEL004577	3e-151	85.99%
*Bombyx*	BGIBMGA009565-TA	3e-161	84.56%
*Drosophila*	Ssdp-PC	6e-71	66.80%
EBI UniRef50	UniRef50_Q9BWG4	4e-71	51.55%	Single-stranded DNA-binding protein 4 n=156 Tax=Euteleostomi RepID=SSBP4_HUMAN
NCBI RefSeq	XP_973397.1	7e-122	66.37%	PREDICTED: similar to conserved hypothetical protein [Tribolium castaneum]
NCBI nr blastp	gi\|383848616	1e-124	66.14%	PREDICTED: single-stranded DNA-binding protein 3-like isoform 3 [Megachile rotundata]
NCBI nr blastx	gi\|328787002	1e-162	67.17%	PREDICTED: single-stranded DNA-binding protein 3 isoform 2 [Apis mellifera]

Group
Gene Ontology	GO:0003697	4.4e-155	single-stranded DNA binding
	GO:0005634	1.1e-16	nucleus
	GO:0003677	1.1e-16	DNA binding
KEGG pathway
InterPro domain	[2-392] IPR008116	4.4e-155	Sequence-specific single-strand DNA-binding protein
	[81-364] IPR007591	1.1e-16	Single-stranded DNA-binding protein, SSDP
Orthology group	MCL13888		Single-copy universal gene

Nucleotide sequence:

>DPOGS215362-TA
ATGTATGCCAAGGGCAAAAGCTCTGCGGTACCTTCGGACGCTCAGGCACGGGAGAAGTTGGCCCTTTATGTGTATGAGTACTTACTGCACGTCGGGGCACAGAAAGCGGCGCAGACTTTCCTTTCTGAAATACGATGGGAAAAGAACATAACACTCGGCGAGCCGCCCGGATTCCTGCATTCCTGGTGGTGTGTTTTCTGGGACCTGTACTGCGCCGCGCCTGAAAGGAGGGACACATGCGAACACTCCTCTGAGGCTAAGGCATTCCATGACTATGGATTCGTCAATTCAGGTTATGGTGTTAACGGCATCGGTCACAACGCAGGCCCGGCGCCGCCTAATGACGGTATGGGTGGCGGAGGTATGCCACCAGGTTTCTTCCCCAACTCCTCACTCCGACCATCACCGCCAGCCCCACATCCTGGATCTCAGCCCTCACCGCATGGACCACAGCCACAGTTGATGGGGACAGGCCAGCCGTTCATAGGACCCTGGTACTCGGGAGGACCAAGAACAGCCGTCAGAATGGGCATGGGAAATGATTTTAATGGTCCTCCGGGTCAAGGCATGATGTCGAACTCCTTGGAGCGAGGCAGCGGTATGCTGGGCGGGCCGCGCATGACCCCGCCCCGCCCCGGCATGGGACCCATGAGCCCTGGTGCATATGCAGCCGGCATGCGTGGCCCACCGCCACAAGCCCCAGGTATGCCACCAATGGGTATGGGACCACGTGGCGCTTGGGCCGGCGGAAGTGGCGGCGCTGGTGGGGGATCCGCCCCCCTCAACTACAGCGGAGGCTCGCCCGGCGCGTACGGGGCGCCTCCCGGGTCCAATGGACCCCCAGGACCTCCGACTCCCATCATGCCAAGCCCACAGGACTCATCCAATTCGGGCGGTGACAACATGTACACATTGATGAAGCCGGTGGGCGCAGCCCTAGGGGCAGAGTTCCCGCTCGCCGGCGAGCACGGGCCCTCGTCGCAGCACCTACCTCAGCCTCCCACTTCCGAAGGGCTAGGCGGGGTGGACGGTATGAAGGCGTCCCCGGGCGGTGTCGGGGGCGGAGGCCCGGGGACTCCGAGAGAGGACTCCGGCTCTGGAATGGGGGATTACAATTTAAGTTTCGGCGGACCGGGCGGCGATCAGAACGACCAGACGGAGTCGGCGGCCATTCTCAAGATAAAGGAGAGCATGCAAGAGGAGGCGAAGAGATTCGAGAAGGATCCGGACCATCCAGATTACTTTATGCAGTGA

Protein sequence:

>DPOGS215362-PA
MYAKGKSSAVPSDAQAREKLALYVYEYLLHVGAQKAAQTFLSEIRWEKNITLGEPPGFLHSWWCVFWDLYCAAPERRDTCEHSSEAKAFHDYGFVNSGYGVNGIGHNAGPAPPNDGMGGGGMPPGFFPNSSLRPSPPAPHPGSQPSPHGPQPQLMGTGQPFIGPWYSGGPRTAVRMGMGNDFNGPPGQGMMSNSLERGSGMLGGPRMTPPRPGMGPMSPGAYAAGMRGPPPQAPGMPPMGMGPRGAWAGGSGGAGGGSAPLNYSGGSPGAYGAPPGSNGPPGPPTPIMPSPQDSSNSGGDNMYTLMKPVGAALGAEFPLAGEHGPSSQHLPQPPTSEGLGGVDGMKASPGGVGGGGPGTPREDSGSGMGDYNLSFGGPGGDQNDQTESAAILKIKESMQEEAKRFEKDPDHPDYFMQ-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: