MonarchBase - Protein-coding gene

DPOGS204520
Transcript	DPOGS204520-TA	2949 bp
Protein	DPOGS204520-PA	982 aa
Genomic position	DPSCF300205 + 120538-133076
RNAseq coverage	444x (Rank: top 28%)

Annotation
*Heliconius*	HMEL008902	3e-93	74.83%
*Bombyx*	BGIBMGA012455-TA	0.0	65.49%
*Drosophila*	CG15439-PA	1e-129	39.16%
EBI UniRef50	UniRef50_E2ARM4	2e-160	46.96%	PHD finger protein 14 n=7 Tax=Formicidae RepID=E2ARM4_CAMFO
NCBI RefSeq	XP_970496.2	5e-162	49.21%	PREDICTED: similar to phd finger protein [Tribolium castaneum]
NCBI nr blastp	gi\|340718256	0.0	43.12%	PREDICTED: PHD finger protein 14-like [Bombus terrestris]
NCBI nr blastx	gi\|340718256	0.0	43.62%	PREDICTED: PHD finger protein 14-like [Bombus terrestris]

Group
Gene Ontology	GO:0005515	2.2e-10	protein binding
	GO:0008270	1.9e-08	zinc ion binding
KEGG pathway
InterPro domain	[872-973] IPR011011	5.4e-12	Zinc finger, FYVE/PHD-type
	[515-581] IPR013083	9.7e-12	Zinc finger, RING/FYVE/PHD-type
	[926-975] IPR019787	2.2e-10	Zinc finger, PHD-finger
	[524-574] IPR001965	1.9e-08	Zinc finger, PHD-type
Orthology group	MCL14120		Single-copy universal gene

Nucleotide sequence:

>DPOGS204520-TA
ATGAGTAATCCTAGCAGAGGTCTTGCTAAACGCAAAGTTAAACCTGTAGAGCCGCAGTCGTTGTTGGATTTTGATCTCGGGGAGGGTGAGAGCTCTGATGATTCTGACTTCCGAATCGAAGATCATCCTGAAGAGAGTGACGATTATTCTATAAATACTGACGATGAAGAGAAAAAAAATGCTAAGAGTGAAAGTTCAGAAGAACAGTCTGGCTCAGATGATGAAGATGAATTCAAAAATACAACCAACAAGTTGGGAGAGGAAATGTGTGTGTCTGATTTACTAGAAAAAGCTAAACAGAATGAATTTAAGTTTCCCGAACTGGCCAATGTCATGATATGTGCTGGTTGTCTCGGCTCAAGGAGTGATGATATCAATGAGATTGTTGAATGTGATGGTTGTGGAGTCACAGTTCACGAAGGTTGTTATGGAGTGTCAGATGTTACCAGTGAGTCCAGTACAGTAAGCTCAGCCTCAACAGAGCCCTGGTTTTGTGAGGCTTGCAAAGCTGGCGTCACCGACCCTAGCTGTGAATTGTGCCCTAATAAAGGTGGAATATTTAAAGAAACAGAAGTAGGTGCATGGGTTCATCTGGTATGTGCATTGTATGTGCCGGGGGTGGCATTCTCAGAGAATGTTATAAAGTATTTAACTATGCTTTTCTTTGACAGCGGTCAACGTGAAGGTTTATTGGCGGAGGCGCATTCTGAAGAAGCTGAACAAGCGGATCCTTTCTACGCGCACTGTCGCTTACATTCAGACAAAACACTAGTCAAGAAACGGAAAAGAAATTGGCTGGCGTTACAGTTGAGAACAGAAAAAAGGAAAATGGAGCTGCAGAACAATCTTAGTACAGAAGAGAAGAAGAGGATACAGAGGAAATTAATCAAGTATAGAAAGAAGTACTCGCTGCAAAAAGAAAATAGAAATCCGCCATGGGTGCCGACTCAAAAGATGGCGCGCATGATATACAGCAGTGCCTCGGCTGTGCGGAAGTTCCAAGACAAGGCGCTCTGTATGGGCGTGGACACGCATGCGTTAGAGTTTAGAGATTCACAGATGGCAGCACTGAAGGACGTGTCTCGTAGATGGCACGTGCCGCCCGCGTTCTCAGTGGAGTTCGTCGGTTATTATTTGGAGAGGAACACTCGAGTGACGTCATTAAGGAAGTCCTTGGAACGACTGACGAAGGAGAACGAGATATTGGTAGCCGATGACGAGGATCTGCGGACGGAGTATGATAAGGCTTCAAAAGAGAACACAGACGCTATAGCCGAGTTGGCTTCAACACGGCTCGGTTTACAGAAGATGTATGACACTATAGTGTGTTTGTGCCCTAAGAGGTCAACGCCCGCCATATTAGAAGACCGACCGCTGGTCATAGCTCCACCGAGATCCACGCCTAAGGTCACGCCTCAGCAGTTACAAAAACGGTCGATATCTGTGCCCACCGCGGCTGCACTTAAGATGGGCGTTGGTTTTCCTCTTAGCGACAATCCGGACGCTCGCCACGGGAAAGTTCTCTCTACGTCTATGGAAGCGAGCGCTGACGGGGCGTTAGCTGCTCGTGCTTGTTTCGCGTGTGGTCGGGCCAGCGAGCGCCATCTGATGGCGGCCTGCGACACTTGCAGACACCACTACCACTTGCATTGCCTGCGACCACCCCTGCAAAGACCACCCAAAAAGACGAAGCTGTACGGATGGCAATGTTCAGAATGCGACAAGACTTCAGATTCGGAACCGGAAGTGCTCGAGAAGAAAGTGCCTCGTCGTTCACGTATACGTTACAGCAAAGACGGAGCCATAGTATCGGAACCACTGAGTCCGGGTTCCGTACCTAATTCACCACCACCCAAACCTAAAATCGAGAAGACCTTGAAGGTCGAGAAAAAGATGAGCCTCTCGTCAGAGAACATATCTCCGATAAAAGTCACAATAAAACCGTTCGAGTTTAACAACGACTGTGGAGAAGGAGGCGAGGTCAAGGTGAAGAAGGAGAAGAAGTCGAAATCGAAAAAGGACTACTCCTCGACATCCGGCGGAGAGAGTGAGATATCAGCCAAAAAGATACACAAAAGAAGCTTCACGTCACCCATACTGACGAACACGCCGCTTATGTCGATAACGCCCATAGTGGCGGACAGTCCGAGCGATTCTCACAACGATCACTCAAACGACTCCACAAACGTGCCGCCGAAAGAACCGAGCTTCTTTTCCCAGAACCTGTCATTCTCGGCTCTGTTGAACGAGCCCAAGGAGAGGGATAGCAAAACCATAGAGAGCTCGATAGAGAACACGCTAGCGAATCTGTCCTCCGATATAGCGATGTACAAAGCCAATAGAAAGAGAAGGAAGGAGAAACACAGGTCTAGATATTCGCCTGATCTGTTACGATCACCGACGAAATCTCACAAACACAAGAGGAAGAAGAAGACTCAGGACATGGAGAATCCTGACACACCACATCCGAGGATTACTATCAAGATCAAACCAATACCTAAACCTGACGGCTCTTTAGATACACAGATGTTCTACGTACCCACGGACAGTAACGACGGACCACCGCCCGCCGTTATAAGGAAGATCTCCAAACAATGTGAGCCTGAGCCTCCCCCCTCCCCGCCCCAGGCTCTGTATCCACTGCTAACTCAAGAGGAAAAACCAGTAGAGGTCGTACCTACTGTCTCGACAAAGCCGAAGCGCTCACGTGAGAGCCGGGCTCGTGGTTCGATGTCGTCTCGTCCACCGCGAGCTGCCGTCACACCTCTCACACACTGCGATGTATGTTCAGAACCGGGTGATGGTACCAACCTCGTCAGATGCGACGAATGCAGCAAGAGGTACCACTTTACTTGTTTGGAGCCGCCGCTGAACAAGAATCCGAAGAAACGCGGCTATTCGTGGCACTGTGCCGATTGCGATCCAACTGACTTGGAAGAAAATAACTAA

Protein sequence:

>DPOGS204520-PA
MSNPSRGLAKRKVKPVEPQSLLDFDLGEGESSDDSDFRIEDHPEESDDYSINTDDEEKKNAKSESSEEQSGSDDEDEFKNTTNKLGEEMCVSDLLEKAKQNEFKFPELANVMICAGCLGSRSDDINEIVECDGCGVTVHEGCYGVSDVTSESSTVSSASTEPWFCEACKAGVTDPSCELCPNKGGIFKETEVGAWVHLVCALYVPGVAFSENVIKYLTMLFFDSGQREGLLAEAHSEEAEQADPFYAHCRLHSDKTLVKKRKRNWLALQLRTEKRKMELQNNLSTEEKKRIQRKLIKYRKKYSLQKENRNPPWVPTQKMARMIYSSASAVRKFQDKALCMGVDTHALEFRDSQMAALKDVSRRWHVPPAFSVEFVGYYLERNTRVTSLRKSLERLTKENEILVADDEDLRTEYDKASKENTDAIAELASTRLGLQKMYDTIVCLCPKRSTPAILEDRPLVIAPPRSTPKVTPQQLQKRSISVPTAAALKMGVGFPLSDNPDARHGKVLSTSMEASADGALAARACFACGRASERHLMAACDTCRHHYHLHCLRPPLQRPPKKTKLYGWQCSECDKTSDSEPEVLEKKVPRRSRIRYSKDGAIVSEPLSPGSVPNSPPPKPKIEKTLKVEKKMSLSSENISPIKVTIKPFEFNNDCGEGGEVKVKKEKKSKSKKDYSSTSGGESEISAKKIHKRSFTSPILTNTPLMSITPIVADSPSDSHNDHSNDSTNVPPKEPSFFSQNLSFSALLNEPKERDSKTIESSIENTLANLSSDIAMYKANRKRRKEKHRSRYSPDLLRSPTKSHKHKRKKKTQDMENPDTPHPRITIKIKPIPKPDGSLDTQMFYVPTDSNDGPPPAVIRKISKQCEPEPPPSPPQALYPLLTQEEKPVEVVPTVSTKPKRSRESRARGSMSSRPPRAAVTPLTHCDVCSEPGDGTNLVRCDECSKRYHFTCLEPPLNKNPKKRGYSWHCADCDPTDLEENN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: