MonarchBase - Protein-coding gene

DPOGS204904
Transcript	DPOGS204904-TA	1728 bp
Protein	DPOGS204904-PA	575 aa
Genomic position	DPSCF300340 - 157125-173074
RNAseq coverage	6x (Rank: top 87%)

Annotation
*Heliconius*	HMEL010734	2e-71	39.83%
*Bombyx*	BGIBMGA001777-TA	8e-39	27.43%
*Drosophila*	CG6654-PA	2e-26	27.89%
EBI UniRef50	UniRef50_G3X996	4e-39	29.85%	RIKEN cDNA 2210010B09, isoform CRA_a n=5 Tax=Murinae RepID=G3X996_MOUSE
NCBI RefSeq	XP_002739995.1	1e-34	28.53%	PREDICTED: zinc finger protein 347-like [Saccoglossus kowalevskii]
NCBI nr blastp	gi\|197384864	6e-39	30.10%	zinc finger protein 426-like 2 [Rattus norvegicus]
NCBI nr blastx	gi\|260789365	2e-46	31.73%	hypothetical protein BRAFLDRAFT_100841 [Branchiostoma floridae]

Group
Gene Ontology	GO:0003676	7e-09	nucleic acid binding
KEGG pathway
InterPro domain	[512-538] IPR013087	7e-09	Zinc finger, C2H2-type/integrase, DNA-binding
Orthology group	MCL23304		Lepidoptera specific

Nucleotide sequence:

>DPOGS204904-TA
ATGTCTGGTTTCATGCAATTAATCTTACCCGACTATACAAAAGAGGTTCCGCAGGCAAAATGCTGTATTGCTTGCCTTAACAAAAATGTGATTTCTATCGATTTAAACACTTGTAAACATGCTGCAATCATTGAATATTTATTAGATTATAAGCCAAACTTAAAAGAGGCCATTGTATGTTTAAACTGTCACAGTCTGATAAAGAAGATAGAGAAATTCAGGGTTGAGTTGACGGAGAATATGAAATTATTTGAAGAGTCTCAAACAAATATTCTTAATGTCAATCGAAGCGGTCTTGGTTATTCGAATATCGAAATCTATTCAACGATCGACTCCCAGCCAATAGAAATGGAGATAAAATCGACCAATCAGGTGTCGCCGATCGAAATTATGACAGAAGTCAAAATCGAATATGACAGCTCCAATTCGGAACACGTCCCATTGGTGGAGATTCAAAAAAGGAAACCCGTCAAAAAGCCACAGAATATAAAGAAGAATAAGAAAGAATTAAAAAATAAGCCTGTCAAGAGAAATGTGTCGTCGCTACAGAAACAGTACGAGGGTAAAATTCGGATAGTCGTACTGAGTCAAGACGAAATGTTGGAGGAGAGACAAGTTGAGGCCAAGAAGCCGAGTTATCTGAGACTTCCATACAAATGTGATCTCTGTATAACGGCTTTCGACCACGAGTTGACTTTGAAGAGTCATATAGAGTCTAGACATAATAAATCTGGTGAATACGAGTGCTGTGTTTGCAAGTCTCACCTCTCCACTAAAATATCATTTGACGAGCATTACAAGAGACATTTCAGACGCACGGTTCACGGCCAGTCGAGTCGCGTGTACGGCTGTGATAAGTGCAACAAGGTGTACAAGGCTAAGTCCGGTCTGAGCGCGCACATCGCGACGCACTCCTCGCCGGTCTACTGCAGGGACTGCGACACGCACTTCAGGACACCGCACGGACTCAGACACCATCTCAAGACTCACTCTAGACACGTGGAGGATAATGATAAGAGGTTCGTGTGCAAAGATTGTGATCTGAAGTTCCTAACGCCGAAGTCCCTGAGGGAGCACGTGGATTGGGTTCACTTGAACGACACGAAATACGAGTGTGACTCGTGCTCTAAGGTGTTCAAGAATAAGAACAGCCTGAAGAAACATTTTCAATACGTGCACGAAAAGAAGAGACCTCCGAGGAATAAGATCTGTGATCACTGCGGCAGAGCATTCACTTCGCGTATGATATCCGTCTCCGAGTTCCCAAACCTCTTTGTGTTAAGGTTCGTGTGCAAAGATTGTGATCTGAAGTTCCTAACGCCGAAGTCCCTGAGGGAGCACGTGGATTGGGTTCACTTGAACGACACGAAATACGAGTGTGACTCGTGCTCTAAGGTGTTCAAGAATAAGAACAGCCTGAAGAAACATTTTCAATACGTGCACGAAAAGAAGAGACCTCCGAGGAATAAGATCTGTGATCACTGCGGCAGAGCATTCACTACGCTACAAATCCTCCGATCCCATATCCACACTCACACGGGCGAGCGGCCGCACCGCTGCGACGTCTGTGGCGCCTCGTTCGCTCACAAGGGGGCGCTTTACACACACAATAAGGCGAAGGGCGACCTCGTGTGTGAGCCGTGTAACAGAACCTTCTCCTCGATAGCCACGTACCAGCAACACATGAAGATCAGCAAGAAACATGCGACCGAAAACGATTTCAAGTGA

Protein sequence:

>DPOGS204904-PA
MSGFMQLILPDYTKEVPQAKCCIACLNKNVISIDLNTCKHAAIIEYLLDYKPNLKEAIVCLNCHSLIKKIEKFRVELTENMKLFEESQTNILNVNRSGLGYSNIEIYSTIDSQPIEMEIKSTNQVSPIEIMTEVKIEYDSSNSEHVPLVEIQKRKPVKKPQNIKKNKKELKNKPVKRNVSSLQKQYEGKIRIVVLSQDEMLEERQVEAKKPSYLRLPYKCDLCITAFDHELTLKSHIESRHNKSGEYECCVCKSHLSTKISFDEHYKRHFRRTVHGQSSRVYGCDKCNKVYKAKSGLSAHIATHSSPVYCRDCDTHFRTPHGLRHHLKTHSRHVEDNDKRFVCKDCDLKFLTPKSLREHVDWVHLNDTKYECDSCSKVFKNKNSLKKHFQYVHEKKRPPRNKICDHCGRAFTSRMISVSEFPNLFVLRFVCKDCDLKFLTPKSLREHVDWVHLNDTKYECDSCSKVFKNKNSLKKHFQYVHEKKRPPRNKICDHCGRAFTTLQILRSHIHTHTGERPHRCDVCGASFAHKGALYTHNKAKGDLVCEPCNRTFSSIATYQQHMKISKKHATENDFK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: