MonarchBase - Protein-coding gene

DPOGS212418
Transcript	DPOGS212418-TA	5352 bp
Protein	DPOGS212418-PA	1783 aa
Genomic position	DPSCF300258 - 53168-58642
RNAseq coverage	436x (Rank: top 28%)

Annotation
*Heliconius*	HMEL009616	0.0	69.67%
*Bombyx*	BGIBMGA002817-TA	0.0	66.87%
*Drosophila*	MESR4-PB	5e-126	43.12%
EBI UniRef50	UniRef50_E2BEC1	1e-134	45.97%	Chromatin modification-related protein YNG2 n=1 Tax=Harpegnathos saltator RepID=E2BEC1_HARSA
NCBI RefSeq	XP_001960743.1	1e-140	37.78%	GF11347 [Drosophila ananassae]
NCBI nr blastp	gi\|194756970	2e-139	37.78%	GF11347 [Drosophila ananassae]
NCBI nr blastx	gi\|380013185	0.0	34.59%	PREDICTED: uncharacterized protein LOC100867677 isoform 1 [Apis florea]

Group
Gene Ontology	GO:0005515	3.5e-07	protein binding
	GO:0008270	3.5e-07	zinc ion binding
	GO:0003676	9.8e-05	nucleic acid binding
KEGG pathway
InterPro domain	[1690-1774] IPR011011	1.9e-20	Zinc finger, FYVE/PHD-type
	[1719-1778] IPR013083	1.8e-17	Zinc finger, RING/FYVE/PHD-type
	[1727-1774] IPR001965	3.5e-07	Zinc finger, PHD-type
Orthology group	MCL19366		Insect specific

Nucleotide sequence:

>DPOGS212418-TA
ATGGAAATAAATCCTTTGTATTGTATTCGTACTGGACGTACGATTTCAGAGAAAACTATGGAAGATGGTAATATTACCAATATTCAAGACGATAAAATCGCTGCAGCATCTTTGGCAAATCTCTATAGTGAACGGCCCAGTAAACTAACGACAAACGGACATGATTTCGCTGGAGAGTCGTCTAGTTCACCCGACCAGTCTTTTGGCACGCGATGCCATAGCGCTGACACATTACAAGAAGATAAGTTCAGGAAACGCATTAATCCGCTTAAAATACACTTGGGTAAAAGACCTTTTGTGGATAATTCAGTTTCCTATAGTGTGAATAAAAAGCGCAAGCCGTTCGTTAACAAAACCAGTGACACACCGAAGAATATACCCCCTAGAGTACCTAAGTCAATACCGAAACGCTTGGAAAACAGTCATTTTCAAAATGTTGCATCACACAGTGGACTGGAGAGTGAAAAGGACAAACCTGTGCCTCGTCTCGTGCCTAAGAGTCAGTTATCACAATATAAAAAGGGTAAAGTGGAAAAGGGAGCCCAGTTGAAAGAGTATGCTCAAAGCTTAGGATTACAGCCCATGGTAAAATTTAAATGTCGAAAATGTTGCTCCATGTCATTCAAAACTCTGGCTATGTTAAAAGAACATCAACTGGTGTGTCGGGCGCAGGCTAAGGAACCTGCACTCAGTCCCGAGGCAGCACCCAATACAGAAATGAACAGCAGTGGTCCTTCGAGAGTCACTCGCAAGGTCTATTTGTGTTCCGCATGTGGAACCTACTATGAGAATTGGAATCTCTTCCTCCACATGCGGGAAGTACACAACAGACACATTTGCCTGTTCTGTTTGGGAATGTTTTCCAAAGCTGAGAAACTCTCATCTCACTTAACAAATAAACACTATGTGAAAGAGTTCAATTTCGACAGCAAGGAGGAATTCTCTAAAGTTTACAATGGAACATTTTATTTAATGTGCTGTGCCTGTGATGAAATATGTAGTGAAAAAGATGATTTTTTCAATCATGACTGTAACAATGTGAAGCCTAAACCTGTGCCTGTTCTTATTAGTAAGAATTCAATGAAGACCAATTCCAAAATTTGTAAAAGTACGCATGAAACTTCACACAATGGACCCGGAGTAGTGAATAAAGATACTAAATCTGTACATAGCAAAAAAATTATAAGCGAGCCCAAACCTGACAAACAAACTACACATTTACAGAGACCAATGAGTTTTATGAACAATGATTCTATCAACACCGATACAAGTATTAGGAGCAACAGTTCAATAGCTGTTAGTAAGGAGACCAGTATCCAGTTGGACTCGGCAAATGAGAATAATAACATAACTGAGAATTCAACAATAAATTCCATTGATAATTTATTGAATAATACGACAGAAGCCATTACACCTTCGGTTCCTAATGGCAATGAACCCTCTGAGGAGTCCGAAGATAGCGACACACCTGAATCAGAGAGCCTAGAACCACCAGCACCTGACTCTACATCCTTGAGGCCTAGAGAACCATCTCCTCCACCGGTAGAGAAAGAAAAAGAGGGTGGTATTAAATTGAAATTGAGTCTTAATAATGCTAATTCCCCAGTGATTATTAATTCCACTGTGGATCCCACCGTGGGCCAGCAGTATGCTCACAAGCCCCCTTCACGGAACAGAAGACCTCCTAAAAGATATGAGAAAGATAAGCCTCCCGATCCTGCACCTCCCATAAAGCCTCCCTCAATTAAGATGACTATATGTGATAAAGCTGACAGCTCATTTGTAAAGACGACTATCATAGAAAATAATAAAGAAACTATAATGAAGACGCTTGTAAATAATAATGTGGAGTCCATAAGCAAACCTCCCGAACATAAGACGGACACCGCAATCAAGTCTACCATTTACGATAACAAGCTAGAAGATCTTAATACTTTAAATAGGGTACCAAAGCTAACTGTACGAGTTCCTAAAGAGTTTCTAGACAAAGATTCTTCTAGTGATTATTCTTCGGATAGCGATAGTGGCGAAAAGTGTAACGGCGAGAGCAAAGAGAGTGTGGAAGAGCCATGTCCAGAAATGGAAGAACCGAAATGTGAAGTGACTCCGACACTACCCGACGATGTTAGAAAAGAAGAATCTACGGAAAATGAAAACGCCCATGAGCCTCCAGTAGACGAAACCATCAAAAACGAGGAACAAACCCTGGTTCAAGTTGAGCCGAAAGTAGAGGAAGCGGAGCAGACTGTTCCTGACGAAATTAATGTAGAGGAGCCGGATGAAAGTGACAATGTACCTGTAACAGAATTGACATTAGATAGGCCAATTGATAAATATCCATTAAAGGACCTCCTTAAAGTGTTTCTGGCTTCAACTGTCATAAATTGTATCTATTGTAATCATGCACGTAAGATAGCAGTGAATTGTGAGCAACTGGCACTCCATATGGTGGCCGAGCATCGGTTCTCGGCCACGGTGAACAGTATAACTGCCGAGGAGTTAATGCCAGAAACGATCACGGCCAAAGTTAAAGCTGGGGCCCCGGAGTTGTGTAAAGTTTATATTAATTTAGACTCTTACGACAGTGTTGACAAGTGTGAGACGGTTCAGAACAATCAACTTTTCGAATGTTTTCAGTGTTATTTTAGAACTGCTGTTCATAAAGATCTCTATTTACATAATCGTAAAATGCACCAGAAGACAATTTTACTGTGTGTCATGTGTAAAAATAATTTTTATTCTTATAGTGAGTTGTTATGTCATTTATGCCCTGGAACATATGATTCTGAATATGAAATTAAGTTTAGATGCTGTTTTTGTAACGTAGACAACATTCTGTCGACGTTTAGGTTGATGGTGCATCTTAGGAAGATACACCACACTTGCGATGTGTGTTTAGAATTCTGCCAAAGTCAAGCACGCCTATCTAACCACGTGTGGAAACATAAGCTGCATCATTTGTGCTACCGTTGTGATATAGCCTATAGGAATAAGCCAGACATTACTAATCACTTGTTTTGGAAACATGGCACCGAAAGTGTGTTATGTAAAAGGTGTCTGCAGAAGAAATGGCCGCACGTGTACCATTTCTGCACCCCTCCCGCTGTATTCGTTTGCGACGAATGTACTCTTCAGTTCACTAGAGCTGTTTGTCTCAAAGTCCATAAGAGATTTCATTCAGAAGAATATCCACATGTGTGCATTGAGGAAGGTTGCACGGAAAAGTTTGTATCGAAGAAATTGCTTAATAAGCACTCCGAGGAACATGGAAAGAAATTAGTTAAAGAAGACCTTAAAGATACTAAACCGTTAGAATCAAATGATGCACCACCAGAAGATCAGAAAGACCCTATTCCCGTCATAGATCTTGTTAACGATAAACCAAAAGAGGAAGCTGGATCTTCCGAGGTTAAAGCTGAGGCCGAGACTGAACTGTCTTCTAAGAAAGTCAAAAAGAAGAAGGTGAAAGACAAGGATGCTTTGTTGTTAGATGTCAATTTGCCTGCATTAAATCTGTCTGAAAGTGATAGCGACGACTCGGACAGTAATTCAATCCAACCAACAAAAGAAATTGATTCAGAAGATAAACCTAAACTTGAACCAGTTGAAGATAATGCTGTAAATCCCGTAAATAACGAAAAAGATGCCACTGACGGAAATGTTGAAATAACTTCGAATAAAGTAGAGGAGACACCAGAGTCATTAGAAGATAAGACGAATGAGCAGCAAGTATTAGATATATGGGATAACTTCAAAAAGTATCAGGCTAAGGTGGAGAAGCAAAAGGAAAAAACGCCCCCACTCGTTCCTATCAGAAAACACGTTTGTGAATCGGACCATGACTATTGCGTTATACCTACGGAAGTCAACGGAGACGATGAATCCTTTGATAAGAGAAAAAACAAAAAATCCCCAAAGAAAAAACACGGCGGCCTGTCATCATCTAGTAGTAGCAGTAGCGACAGTGATTCCAGCTGTTCCTGTGGATCGAACTGTAGTTGTTCTTCGAGCAGCGGTTCCTCATCGTCCAGCTCGTCAGATTCCGATTCATCAGACGAATCTGGAAACGAAAAGAAAAAGAACAAACAAATGAAGAAGTCACTTCCAAACAGAAGAATGAGTAACGGTTCTAATGTTGATGTAATGGGTATGTCGGAGACCCCCATACTTGTACCGGAAAAGACTGAGCCAGCCATCGCCGAGAGCGACCTGGAAACGGATGAAAGTGAAACAGATGAAGAATTCTATGACAAAAATCCTCAACAAATTGCCAATAAATTACACAACGAAAAACGAAACCAACTGTTGTTGTTAGCATCAGTCGCTCCGTCTGACGGAGGTTCCGTGTCTGGAGATGTAAGCCGCTGTAACACACCAGTCAAAGAAGAAGAACCAGAGAAGCAGAAAGAAGAGGTAAAAGACGAAGACATTAAGGAAACCGAAGTGAAACAGGAATCTGAGGCAAAAGATAAAAGTAGCAGCGGCAAAAAGAAGAGTAAAAAGAAAAAGAAATCGAGAAGTTCACGCAAACACGGCCCACTTAAGATGATAATTCCCAAGGATGTCATTAGTAAACCAGAAGAAGAGATCCCACCGCCGTTGATTCCGAATAAAATAACTATATCATTACAATCGAATACCGTTCAACTGCCGGAAACTCCCAAAACAGCCTCGATCCCGCCACCCAAGAACTCGAGTACTCCCGCGACCACCATAGAGAGAAAGAGGGCGTCCAAAAGAAGAAGGGTGCCGAACAGGTTCTACGGCTATTCCAGTGACGAAGAGGCACCACAGACTCCTGCTGCATTAAAACCTCAACTGCCTCCCAAATTAGAGTGGCGGAAGGAGGACCTACCATCGCCGGTCACGCACAAACCCAAAAAAGAAATTCCGTCTACCGTAACTCCTCAGAGAATGTTCAACTACACGGAACCCATACGACTGACGGCTCCCATACCAGATCCGGAACCGCCTCGGTTCCTCATGAATTCCGAATCTATGGAGTCCAGCGATTCCGAGTCCAGCACGGAACCAGCGTTAGAGATATTCCAACCGCCGGCTCCGAACCCTCCTCCCGTGACAGTTCCGCCGCCGACGTATCTGAACTCTGGCACTTCCAGCTTGCCGTACGCCTTCCAAAGGCCAGCGGCGCGGCAGGCGCGGGAAGGCGAGAGCGTGTACTGCTACTGCCGCTGCCCCTACGACGAGGTGTCGGAGATGATCGCGTGCGACGCCGAGGGCTGCCCCATCGAATGGTTCCACTTCGAGTGTGTCGGTATCATGGTACCGCCTAAAGGCAAATGGTACTGTCCGGAATGTAGGAAAAATCAAAGCGTCACAGGCTGCAGATAA

Protein sequence:

>DPOGS212418-PA
MEINPLYCIRTGRTISEKTMEDGNITNIQDDKIAAASLANLYSERPSKLTTNGHDFAGESSSSPDQSFGTRCHSADTLQEDKFRKRINPLKIHLGKRPFVDNSVSYSVNKKRKPFVNKTSDTPKNIPPRVPKSIPKRLENSHFQNVASHSGLESEKDKPVPRLVPKSQLSQYKKGKVEKGAQLKEYAQSLGLQPMVKFKCRKCCSMSFKTLAMLKEHQLVCRAQAKEPALSPEAAPNTEMNSSGPSRVTRKVYLCSACGTYYENWNLFLHMREVHNRHICLFCLGMFSKAEKLSSHLTNKHYVKEFNFDSKEEFSKVYNGTFYLMCCACDEICSEKDDFFNHDCNNVKPKPVPVLISKNSMKTNSKICKSTHETSHNGPGVVNKDTKSVHSKKIISEPKPDKQTTHLQRPMSFMNNDSINTDTSIRSNSSIAVSKETSIQLDSANENNNITENSTINSIDNLLNNTTEAITPSVPNGNEPSEESEDSDTPESESLEPPAPDSTSLRPREPSPPPVEKEKEGGIKLKLSLNNANSPVIINSTVDPTVGQQYAHKPPSRNRRPPKRYEKDKPPDPAPPIKPPSIKMTICDKADSSFVKTTIIENNKETIMKTLVNNNVESISKPPEHKTDTAIKSTIYDNKLEDLNTLNRVPKLTVRVPKEFLDKDSSSDYSSDSDSGEKCNGESKESVEEPCPEMEEPKCEVTPTLPDDVRKEESTENENAHEPPVDETIKNEEQTLVQVEPKVEEAEQTVPDEINVEEPDESDNVPVTELTLDRPIDKYPLKDLLKVFLASTVINCIYCNHARKIAVNCEQLALHMVAEHRFSATVNSITAEELMPETITAKVKAGAPELCKVYINLDSYDSVDKCETVQNNQLFECFQCYFRTAVHKDLYLHNRKMHQKTILLCVMCKNNFYSYSELLCHLCPGTYDSEYEIKFRCCFCNVDNILSTFRLMVHLRKIHHTCDVCLEFCQSQARLSNHVWKHKLHHLCYRCDIAYRNKPDITNHLFWKHGTESVLCKRCLQKKWPHVYHFCTPPAVFVCDECTLQFTRAVCLKVHKRFHSEEYPHVCIEEGCTEKFVSKKLLNKHSEEHGKKLVKEDLKDTKPLESNDAPPEDQKDPIPVIDLVNDKPKEEAGSSEVKAEAETELSSKKVKKKKVKDKDALLLDVNLPALNLSESDSDDSDSNSIQPTKEIDSEDKPKLEPVEDNAVNPVNNEKDATDGNVEITSNKVEETPESLEDKTNEQQVLDIWDNFKKYQAKVEKQKEKTPPLVPIRKHVCESDHDYCVIPTEVNGDDESFDKRKNKKSPKKKHGGLSSSSSSSSDSDSSCSCGSNCSCSSSSGSSSSSSSDSDSSDESGNEKKKNKQMKKSLPNRRMSNGSNVDVMGMSETPILVPEKTEPAIAESDLETDESETDEEFYDKNPQQIANKLHNEKRNQLLLLASVAPSDGGSVSGDVSRCNTPVKEEEPEKQKEEVKDEDIKETEVKQESEAKDKSSSGKKKSKKKKKSRSSRKHGPLKMIIPKDVISKPEEEIPPPLIPNKITISLQSNTVQLPETPKTASIPPPKNSSTPATTIERKRASKRRRVPNRFYGYSSDEEAPQTPAALKPQLPPKLEWRKEDLPSPVTHKPKKEIPSTVTPQRMFNYTEPIRLTAPIPDPEPPRFLMNSESMESSDSESSTEPALEIFQPPAPNPPPVTVPPPTYLNSGTSSLPYAFQRPAARQAREGESVYCYCRCPYDEVSEMIACDAEGCPIEWFHFECVGIMVPPKGKWYCPECRKNQSVTGCR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: