MonarchBase - Protein-coding gene

DPOGS206806
Transcript	DPOGS206806-TA	2718 bp
Protein	DPOGS206806-PA	905 aa
Genomic position	DPSCF300001 - 4124608-4147483
RNAseq coverage	1205x (Rank: top 10%)

Annotation
*Heliconius*	HMEL010553	82.45%
*Bombyx*	BGIBMGA000629-TA	80.78%
*Drosophila*	Unr-PB	64.76%
EBI UniRef50	UniRef50_E2B5T4	58.45%	Cold shock domain-containing protein E1 n=4 Tax=Formicidae RepID=E2B5T4_HARSA
NCBI RefSeq	XP_967163.1	60.22%	PREDICTED: similar to AGAP004937-PA [Tribolium castaneum]
NCBI nr blastp	gi\|91079915	60.22%	PREDICTED: similar to AGAP004937-PA [Tribolium castaneum]
NCBI nr blastx	gi\|91079915	60.57%	PREDICTED: similar to AGAP004937-PA [Tribolium castaneum]

Group
Gene Ontology	GO:0003677	6.1e-13	DNA binding
	GO:0006355	6.1e-13	regulation of transcription, DNA-dependent
	GO:0003676	1.9e-10	nucleic acid binding
KEGG pathway	oaa:100074630	2e-07
	K01490 (E3.5.4.6, AMPD)	maps->	Purine metabolism
InterPro domain	[105-176] IPR016027	8.6e-19	Nucleic acid-binding, OB-fold-like
	[261-319] IPR002059	6.1e-13	Cold-shock protein, DNA-binding
	[756-820] IPR011129	1.9e-10	Cold shock protein
Orthology group	MCL14397		Single-copy universal gene

Nucleotide sequence:

>DPOGS206806-TA
ATGTCAAGCAATCCTCAGTGGAAAATGTTCCAGCCGCCAGATTCACACAACTCCCCTTTACAGGATATTTTAGATCTCCAACAATCAAATATGCAGGCCAAACAGGTTTATCGTAATGGTACTTACAGCGGTGAGTACCCAAGTTCCCCTCGAGATAATTTTAATAATATGGGCAAGTCAAGTGGTGGAAATAGATTTTCTGTTGGCAATTATAATTTGGATGGATGTCCCATGGGAGATTCTGTGGGAGTGTATTCTTCCAGTTCAACCAATAACCAATCTCAGTATGATTCCACGAATCACCCACCTATAAGAGAAACAGGGATTATTGAAAAATTGCTTCATTCCTATGGCTTTATACAATGCTGCGAGAGGCAAGCTCGTCTATTCTTCCACTTTAGCCAGTTTGGTGGTAATATAGACCATCTGAAAATAGGTGACCCAGTAGAATTCGAGATGACTTACGACCGTCGTACTGGCAAACCAATTGCGTCTACAGTAACTAAAATAGCCCCCGAGGTGGTACTGAGTGAGGCTCGAGTTACCGGAGTAGTGACTACGGAGGTGAAGGGAGAGGGTTCAGGGGATAACACCGGACGCATATCGTATGAGAACCGCGGCGAATGCTTTTTCTTGCCGTATACTAAAGATGACGTCGAAGGAAACGTAACCCTTCGTACAGGAGACGCTGTCAGCTTCCAAATCGCAACCAACCAAAGAGGCACTCTTGGAGCGTGTCACGTGCGTTTCGAGAACCCCGCGCATCCCGTCAAGTATCATGGCGTAGTGTGTTCTAAGAAGGAAAATTTTGGTTTCATCGAGCGGGCTGATGTCGTTAAGGAGATATTCTTCCATTACTCTGAAGCCAAGGTCAAAGAGGAGCTGTCTCTAGGAGATGACGTGGAGTTTATAATACAGACTAGGAATGGTAAGGAGGTTGCGTGCAACATCAGTAAGCTGCCGAGTGGGTCGGTTGTGTTCGAAGACGTTAGCCCGGAGCAGCTTCGGGGGCAGGTGCTGAAGCCGCTGGAGCGTGGGGCGCGACTCCAGAGCGACCCTCTACCAGGCAGGATCAGATACAGGGCACCGGACCATTCTGAAGTTGAGGTGCCTTTCGGCGACAAAGACCAGTGCGGGGAGTTCACCTTGCGGCACGGGGATTGGGTCCAGTTCCAAGTGGCAACGGACAGACGGGATCAACTGAAACGGGCAACCAATATATCGCTGCTGGATGAGTCATTCAACGTATCAGGCGAAAGACGTGAACAGGGCATTGTTTGTTCCTTGAGAGATGGCTTCGGTTTCATCCGATGCGTAGAGCGTGAGCAGACCATGTTCTTCCACTTCGCCGAGGTGTTGCGTCTCGGCCAGGAGTTAAGTGTTGGCGACGAGGTTGAGTTCACCGTGGATCCTTTGTCATCCTTCTCCAACATGAACAGCCGCCAGTCAGCCATCCGTATCCAGCACTTGTCTGCTGGTTCCGTACAGTTCGAGTCCCTTGTGGAGCGAGGCGTCCGCGGGGTCGTCACCAAGGAAGCGCATTATTCCAACGAGAGTCCCAACAGAAACTCACCGAATGAGTCCGGTATCATAACGTGTCAAATAAACAACTTGAAGAAATCTATACCATACACGGTCAAGAAATGTGAATCAAAGATGCTGCCTCGCGTGGGCGACAAAGTGACCTTCGATCTGTATCAGGTGAAGAGGACTAAGGAGCTGGTTGCTATGAGTGTGACGATGCAGCACAGCATGACGAACGGCCGGATTGGAGGGGCGGGGGCTGGAGGGGGATCGGGGGCGGCCACCCAGCAGGGCTTCGTGGCCGCACTCAAGGATGGCTTCGGTTTCATTGAGACAGCCGATCACACCAGGGAGGTGTTCTTTCATTTCAGTAATCTGGAAGGCAGCCCGGATGTATTGGAGTTGGGTTCAGAGGTGGAGTACACTGTGGGTCGTCAGAGCAGCGCTAGCGGTGGTTGTGCCAGCGCCGAACATGTGCGACCACTGCCTCGTGGAACTGTGCCCATTGCACGACCCCTGGAACCTCCTCTCACCGGCACGGTGACACGTACGCTGAGGGCCCTCAACCCCGACCAGGCCAAGTACTCTGGCTTAATCCAAGTGGAGGGTGGAATGACCTACGAATTTGGCATCATGGGACTAGCGAGCAAGCGAGAGATTCTGCAAGTTGGCGATCCGGTCACATTTCAGTCGGACATGGAAGGTCGCGCTACTAACATAGTGCCCATTAGAAAGAAGAGACGGGCCACCGTAGACGCTATAAAAGGCGGCTTCGGTTTCCTGTCTCTCGAGGCTGAGGAAGGTCGCCGTCTCTTCTTCCACATGAGTGAGGTCCGCGGGAACCCTTCAGATCTGGCGCCCGGGGACGCCGTCGAGTTTGTGATGCTAACCAACCCCAGGAACGGGAAGTGCTCAGCCTGCAATGTCGTCAAAGTCGGGAGCAACAGCAGCAATAGCAAGATATCAAAGCGCGATCGCGAGAGGGAGCGTGAGAGAGAGCGTCCAGAGAGGCCGGAGCGTCTGCTGGCCAGGCTGAGGACGGTGTCACTGGAGGAGCCCGGGCCGCGCGTGCTGGTGTTGCGACCCCCGCGGGGACCGGACGGCAGCCTCGATACCAGCCGCACCACCACCCGCCGCAGAGTCTACAGGTTCGGTAAGCAGCCCCCGCCGCCGCCGCCGCCGGGCCGTCCGTGA

Protein sequence:

>DPOGS206806-PA
MSSNPQWKMFQPPDSHNSPLQDILDLQQSNMQAKQVYRNGTYSGEYPSSPRDNFNNMGKSSGGNRFSVGNYNLDGCPMGDSVGVYSSSSTNNQSQYDSTNHPPIRETGIIEKLLHSYGFIQCCERQARLFFHFSQFGGNIDHLKIGDPVEFEMTYDRRTGKPIASTVTKIAPEVVLSEARVTGVVTTEVKGEGSGDNTGRISYENRGECFFLPYTKDDVEGNVTLRTGDAVSFQIATNQRGTLGACHVRFENPAHPVKYHGVVCSKKENFGFIERADVVKEIFFHYSEAKVKEELSLGDDVEFIIQTRNGKEVACNISKLPSGSVVFEDVSPEQLRGQVLKPLERGARLQSDPLPGRIRYRAPDHSEVEVPFGDKDQCGEFTLRHGDWVQFQVATDRRDQLKRATNISLLDESFNVSGERREQGIVCSLRDGFGFIRCVEREQTMFFHFAEVLRLGQELSVGDEVEFTVDPLSSFSNMNSRQSAIRIQHLSAGSVQFESLVERGVRGVVTKEAHYSNESPNRNSPNESGIITCQINNLKKSIPYTVKKCESKMLPRVGDKVTFDLYQVKRTKELVAMSVTMQHSMTNGRIGGAGAGGGSGAATQQGFVAALKDGFGFIETADHTREVFFHFSNLEGSPDVLELGSEVEYTVGRQSSASGGCASAEHVRPLPRGTVPIARPLEPPLTGTVTRTLRALNPDQAKYSGLIQVEGGMTYEFGIMGLASKREILQVGDPVTFQSDMEGRATNIVPIRKKRRATVDAIKGGFGFLSLEAEEGRRLFFHMSEVRGNPSDLAPGDAVEFVMLTNPRNGKCSACNVVKVGSNSSNSKISKRDRERERERERPERPERLLARLRTVSLEEPGPRVLVLRPPRGPDGSLDTSRTTTRRRVYRFGKQPPPPPPPGRP-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: