MonarchBase - Protein-coding gene

DPOGS207050
Transcript	DPOGS207050-TA	3486 bp
Protein	DPOGS207050-PA	1161 aa
Genomic position	DPSCF300001 + 2074283-2083978
RNAseq coverage	244x (Rank: top 42%)

Annotation
*Heliconius*	HMEL010495	84.65%
*Bombyx*	BGIBMGA012992-TA	88.02%
*Drosophila*	Br140-PA	54.21%
EBI UniRef50	UniRef50_D6WYQ1	61.24%	Putative uncharacterized protein n=1 Tax=Tribolium castaneum RepID=D6WYQ1_TRICA
NCBI RefSeq	XP_967270.1	61.24%	PREDICTED: similar to AGAP007617-PA [Tribolium castaneum]
NCBI nr blastp	gi\|91087827	61.24%	PREDICTED: similar to AGAP007617-PA [Tribolium castaneum]
NCBI nr blastx	gi\|91087827	49.32%	PREDICTED: similar to AGAP007617-PA [Tribolium castaneum]

Group
Gene Ontology	GO:0005515	1.2e-35	protein binding
	GO:0008270	1e-07	zinc ion binding
KEGG pathway
InterPro domain	[567-699] IPR001487	1.2e-35	Bromodomain
	[129-226] IPR019542	6e-23	Enhancer of polycomb-like, N-terminal
	[1041-1121] IPR000313	6.7e-23	PWWP
	[230-311] IPR011011	1.7e-19	Zinc finger, FYVE/PHD-type
	[242-294] IPR013083	3.7e-11	Zinc finger, RING/FYVE/PHD-type
	[247-293] IPR001965	1e-07	Zinc finger, PHD-type
Orthology group	MCL10756		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS207050-TA
ATGGGTTTGGATTTTGATGTCTTTGAATTCTGCAAAAAATTGCGTCAGAACAGGCCTCCTCCGTATCAGTGTCCACTAGAGAAATGTGATAAAGTATACAAGAGTTTATGTGGTTTGCAATATCACTTAGTAAACTATGACCATGACAATCCAACACCGGCGACACCTTCAATTGCAAGCAGTCGCAAGAAAGGCAGAACTCGAGCTGCTGTGCCTACTGGAGATATCGCACTTCAAAGCCCACCTAAGGAAGCTTTGACTTTTGCTGAGGCACAAAAAGTGGTGCAGTTTGAAGTTGATGGAAAAATTAGTAGAATACCAATTGACCAGCCACTGCCTATAGTTTCATTGGAAGAGTGGGAGAGAAAAAATGCAGATTTAGAAAAGCCTATGCCATTTGTAGAGCCACCATCAGAGCCTCATGTTAAATTACCAGAGGCTACATTCCGTCTAATACCAGATTATAATGCACGGGTATGTGACGCACCACCTCGGCCAAATGCATACATACGTTTCATAGAGAAGTCGGCTGAGGAATTGGATGGTGAAGTGGAATATGATGTTGATGAAGAAGACACAGCCTGGCTGGCCATTATTAATAAGAACAGAACCAAACAAGGTCTACCACCCGTCTCCGTAGATACCCTGGAGCTACTCATGGATAGATTAGAAAAGGAATCATATTTTCAGGCTACACAGAACGGCCAGCAACCTGCGGCAACGGTGGACGAAGATGCTGTGTGCTGCATATGCATGGACGGGGAATGCCAGAACACCAATGTGATCCTGTTTTGTGATATGTGTAACCTGGCCGTCCACCAGGATTGTTATGGGGTGCCATATATACCAGAGGGACAATGGCTGTGCAGACGTTGTCTTCAATCACCATCACGACTTGTTAACTGTGTGCTATGTCCCAACACTGGAGGAGCATTCAAGCAGACAGATCAGGGCACTTGGGCGCACGTCGTCTGCGCCCTCTGGATACCAGAAGTTCGCTTTGCAAATACAAATACATTTTATTTGTTAACAGATTCAATAGAGATGATTCCGGCTGCTCGTTGGAAGCTTCAGTGTATGGTGTGCAAGCAGCGAGGTGCTGGTGCTTGCATACAATGTCACCGTAGCAACTGTTACAGCGCCTTCCATGTCACATGCGCCCAGCAGGCCGGTTTGTATATGAAGATGGAAGCGGCCGGATCTGGCCGTGATCCCAGTCAACCAGTTCAGGTGGCCAAAATGGCGTACTGTGATGCACACACACCAGCACATGTATTACAGGAGAGGAGAGCTTTGGAGTCGGAAGGTGAAAGTAAATCTTCAGATTTGACTTCCATACGACAGAAAGGAAGGGAGAAGATAAAACAGGCTCGGAGAGTGTTAGCGTTGAAGCGTACGTGGGCGCCGGTAGTGTTGGTGCCGACATTACCACCTGAACGTGTTGCTGAGATTGCCCAACTGTCACACGGGACACCCGCGGCTAGAGCACAGCTGATGAAAAGACTTCTCGCTTACTGGACCCTCAAAAGACACAGCAGGAACGGGGTTCCACTCCTTAGGAGGCTACAAAGCCTGACCAGCCATCACGGGAGCCGAGGTATCCAAGATGGCACTGTGAATGTACGAGAACTCTGCAATCAACTCAAGTACTGGCAGCGGATAAGACAAGATCTGGAGAGGGCTAGATTGCTGTGTGAGTTGGTACGTAAACGCGAGCGTCTCAAGGCGGAATACACTCGTGTTTGGGAACGCTGTGTTTTGCATACGCTCCGACCTGAACGTGCCATGCTGAGCAAGATGCTGCGCATGATGAGACACGCTGACCACAGTGACGTGTTCACGGAGCCGGTCGACCCGCTAGAGGTTCCAGATTACAGCACCGTCGTAAAGCATCCCATGGATTTAAGTACCATGGGCAAGAAATTGGACAGAGGCATTTATAAGACCATAGATGACGTAGAGGCAGATTTCCAACTAATGATAGACAACTGCCTCACATATAATAAAAAGGATACAGTGTTTTACAAAGCTGGTGTCAAGATGAGGGAGCAGTGTACGTCTATATTTCGTCAAGCACGTCGTGACGTCATAGAGGCGGGTCTGGCGTCGCTGGCAGGGGAAGGGGACGCAGAGGAAACTTACACACCCGGGCGCACACACGCACAGAAACACACACAGTCAAGGCGCAGGAGTGTAAGAAACACAAGCAGCGACAGCGATCGTACAGCCGATACTCGAAGCGAGCGCGGCGTCTCCCTGGCACGTAGCGAGCGACGACACACCAGCGCATTGAGAGACAGTGACGACGACATTAATCAGCGCGAGCCGTCGCCGGCTAAGAGCAAGGTGAACCGCAATTGGTGGCGCGGCCGCGGTCGTGGTAGGGGCAGGAGGGGGAGGAGGGGCCGCGGGAGAGGGGGACACGTGTCGCCTCGACCACTCAGAGACAACGATACTCCGACGACGGATTCAGAAGCTCCTATAGTTAAATCGAAGACTGTTGAGCGAACACAAAAATTGGTCACACCAGAAAAGTCACCAACTAAGCAACTGGAAAGTACTGGTCTAGGACTACTGGGTGGTTTGAGAAAACCTACTTTGCTTGTGACGCCCTCAATAACCACCCCTCCGAAGAGTTTTGGTTCTGATGCCACTTTGCCAACACTATCAGCCAGCTTGGGACACACAGAACCCTCGCCCAGGAAGAAGGGTCGCGGTCGTCCACGGAAACAAGATAAAACAACAGATCTATTCAGAGGGGACTCGGAGGTCCTAGGAGGAGCATCGTTCCTTCAATACCGCGGTCCTCCCGGGGAAGTCGGCTCGGATAGCGATTTGGCACTATCAAGGTCGTCAAGCAGTAGTTCAGCGTGGTCCCAGTCATGTTCCTCGTGCACACACTATGACGACGATAGATCTGGCGATGACAGTTCCAGCGAAGGTTCTAGTTACAATGAAACGTTGGATTCGTTAGAAAGCCGCGGTCCGGAGCCCAGACGTCGCGGCCGTCGGGCCGATGAGGGAGTCGACCGCACTCAGCCAGCAACACCCGTCAAGGGCCGTGGTACAAGATCTTCTACGTCCAAGACTCCGGTGAAAGTTACCCAATCAGATGTTCTGCTTGAGCCGTTGCAGTTAGTATGGGCAAAGTGCAGAGGCTATCCTTGGTATCCCGCACTAATAATAGATCCGAAGATGCCAAAAGGTTACATATACAACGGAGTTCCTCTACCAGTGCCGCCTCAAGATGTACTGAACCTCAAGAAGAATTATGCTCACGAACCAGTATTGTACCTAGTTCTATTTTTCGACGTTAAACGAACGTGGCAATGGCTGCCTCCAAATAAATTGGAAATCTTGGGCCTAGATAAGGAGATAGATGAAGCCAAACTGGTGGAGTCACGGAAACCGACCGACAGGAAGGCTGTCAAGAAGGCTTATGGTGATGCAATGCAGTTCCGGAAGCAGGTTGACGGTGATAAATGA

Protein sequence:

>DPOGS207050-PA
MGLDFDVFEFCKKLRQNRPPPYQCPLEKCDKVYKSLCGLQYHLVNYDHDNPTPATPSIASSRKKGRTRAAVPTGDIALQSPPKEALTFAEAQKVVQFEVDGKISRIPIDQPLPIVSLEEWERKNADLEKPMPFVEPPSEPHVKLPEATFRLIPDYNARVCDAPPRPNAYIRFIEKSAEELDGEVEYDVDEEDTAWLAIINKNRTKQGLPPVSVDTLELLMDRLEKESYFQATQNGQQPAATVDEDAVCCICMDGECQNTNVILFCDMCNLAVHQDCYGVPYIPEGQWLCRRCLQSPSRLVNCVLCPNTGGAFKQTDQGTWAHVVCALWIPEVRFANTNTFYLLTDSIEMIPAARWKLQCMVCKQRGAGACIQCHRSNCYSAFHVTCAQQAGLYMKMEAAGSGRDPSQPVQVAKMAYCDAHTPAHVLQERRALESEGESKSSDLTSIRQKGREKIKQARRVLALKRTWAPVVLVPTLPPERVAEIAQLSHGTPAARAQLMKRLLAYWTLKRHSRNGVPLLRRLQSLTSHHGSRGIQDGTVNVRELCNQLKYWQRIRQDLERARLLCELVRKRERLKAEYTRVWERCVLHTLRPERAMLSKMLRMMRHADHSDVFTEPVDPLEVPDYSTVVKHPMDLSTMGKKLDRGIYKTIDDVEADFQLMIDNCLTYNKKDTVFYKAGVKMREQCTSIFRQARRDVIEAGLASLAGEGDAEETYTPGRTHAQKHTQSRRRSVRNTSSDSDRTADTRSERGVSLARSERRHTSALRDSDDDINQREPSPAKSKVNRNWWRGRGRGRGRRGRRGRGRGGHVSPRPLRDNDTPTTDSEAPIVKSKTVERTQKLVTPEKSPTKQLESTGLGLLGGLRKPTLLVTPSITTPPKSFGSDATLPTLSASLGHTEPSPRKKGRGRPRKQDKTTDLFRGDSEVLGGASFLQYRGPPGEVGSDSDLALSRSSSSSSAWSQSCSSCTHYDDDRSGDDSSSEGSSYNETLDSLESRGPEPRRRGRRADEGVDRTQPATPVKGRGTRSSTSKTPVKVTQSDVLLEPLQLVWAKCRGYPWYPALIIDPKMPKGYIYNGVPLPVPPQDVLNLKKNYAHEPVLYLVLFFDVKRTWQWLPPNKLEILGLDKEIDEAKLVESRKPTDRKAVKKAYGDAMQFRKQVDGDK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: