MonarchBase - Protein-coding gene

DPOGS201602
Transcript	DPOGS201602-TA	1575 bp
Protein	DPOGS201602-PA	524 aa
Genomic position	DPSCF300152 + 194372-200607
RNAseq coverage	37x (Rank: top 73%)

Annotation
*Heliconius*	HMEL013443	2e-06	39.62%
*Bombyx*	BGIBMGA001689-TA	2e-06	22.33%
*Drosophila*	CG4707-PA	2e-06	27.11%
EBI UniRef50	UniRef50_G3UVV3	8e-07	36.30%	MCG1556, isoform CRA_b n=43 Tax=Eutheria RepID=G3UVV3_MOUSE
NCBI RefSeq	XP_001994311.1	3e-07	26.97%	GH23864 [Drosophila grimshawi]
NCBI nr blastp	gi\|380796067	2e-06	36.30%	zinc finger protein 407 isoform 1, partial [Macaca mulatta]
NCBI nr blastx	gi\|322798982	3e-11	22.36%	hypothetical protein SINV_02496 [Solenopsis invicta]

Group
Gene Ontology	GO:0005634	2.8e-09	nucleus
	GO:0008270	2.8e-09	zinc ion binding
KEGG pathway
InterPro domain	[15-83] IPR012934	2.8e-09	Zinc finger, AD-type
Orthology group

Nucleotide sequence:

>DPOGS201602-TA
ATGAAGAGGCTAAATATGGAGGAGGAAGAGGACTTTGTAGGTTGCATTACCTGCATGTCCACAAATGATTTATGCGACCTATTTGTTAATTACGCAAACAATGAAGAAACTTACGCCCAAATGCTTGAAACCTGTTTCGAAATAAAGGTAACAAATGATTTTAAATACATATGTGCAATTTGTGTGGAGAAATTGGAAAAATCCTACGAGTTCAAAGATCAGACGGTTAAGAGTATTGATATGCTTCAATCCATTAAAGAGGAAGAGTATCTGGATGAGGCGATCTTTGACGATCCGGACAAGGATAAGTCCAGGAAAGCCGATTTGAATTACGAGGATGATGAAGAGCATGAGATCGAAGCGCTGGACGAGACCCGCTGTATCTACTGCGACCTCCAGCTGGGGTCGTCGGAGGAGGTGCAGCACCACGTGAGGCTCAGACACGGTCTGGAGCCCCGCACTGGGCGGAGGGTGACACAGTGCCACCTGTGCGGGGCTTCGCTGAGGGACCTCGCTGACCATATTAACAGATGCCACAGCAGTTCGGAGACCGAGCGCCAGTACGGGTGCCACTTCTGCGACAACGTCTACAACAGCAAGAAGGCGTGCTTCACGCATCTCAGGATGAAGCATGGATTGAAGCTCTGCAATGACCACACTCCGAAGTACTCGTCACGCGACAGGAAGAAGTGCCACATCTGCGGCAGGGACTTCAGCCAGAAGCAGATCCTGAACAACCACCTGTGGAAGGCTCACGGGTTCGAGGTTTCGTTCCACCTCTTCGCGTTCCGGTTCTTCTGTCCGCTCTGCTCGGAGCGCGTCAGTTACGGCGCCAACTTCAGCGCCCACCTCACGCAGCAGCACGACGTCACCGAGGACGTGGAACAGCTGGAGTTCAGCTCCATGGACGATTTCATGCTGTACAAGAGCGCTATTCAAGAGGAAACCAAGTTTCGGTTCAGGAAGACCACCGCCAGCAAGCAGACGATAGAGGGAGTCAGGTCGCACTACATGTGCAGCCAGTCCGGCATATACGTGTATCAGGTGAGGACGGGCAGGAGGCTGGGCTGGCTCCCGGCCCATTTCATGCTGTACAAGAGCGCTATTCAAGAGGAAACCAAGTTTCGGTTCAGGAAGACCACCGCCAGCAAGCAGACGATAGAAGGAGTCAGGTCACACTACATGTGCAGCCAGTCCGGCATATACGTGTATCAGGGTAAGGGCAAACGTCCGGCCCCCGAGCGTCAGATCTACAAGACGGGCAAGGCGTGCCCGGCCCACATGATAGTGACGGAGACCCTGGACAGAGTCCTCGTCACCTTCTACAAGACGCACGTCGGACACGGCACGTGTCCGTACTACGAGCCGCGCGATCCGAAGCGCTCCAAGCAGGAGGAGCAGGCGCTGGTGTGCGACACGTGCGGGGCGAGGGTCGCCGCGGGCAGGCTGCGGGCTCACGTGGCGGCTCACGGTCTGCACCTCTTCCCGTGCGACTACTGCGACCAGCTGTTCCAGAACATCGACGCGTGGACCCAGCACACGAGGACGGAGCACGCGGTCGGCTCGCTGTTCTGA

Protein sequence:

>DPOGS201602-PA
MKRLNMEEEEDFVGCITCMSTNDLCDLFVNYANNEETYAQMLETCFEIKVTNDFKYICAICVEKLEKSYEFKDQTVKSIDMLQSIKEEEYLDEAIFDDPDKDKSRKADLNYEDDEEHEIEALDETRCIYCDLQLGSSEEVQHHVRLRHGLEPRTGRRVTQCHLCGASLRDLADHINRCHSSSETERQYGCHFCDNVYNSKKACFTHLRMKHGLKLCNDHTPKYSSRDRKKCHICGRDFSQKQILNNHLWKAHGFEVSFHLFAFRFFCPLCSERVSYGANFSAHLTQQHDVTEDVEQLEFSSMDDFMLYKSAIQEETKFRFRKTTASKQTIEGVRSHYMCSQSGIYVYQVRTGRRLGWLPAHFMLYKSAIQEETKFRFRKTTASKQTIEGVRSHYMCSQSGIYVYQGKGKRPAPERQIYKTGKACPAHMIVTETLDRVLVTFYKTHVGHGTCPYYEPRDPKRSKQEEQALVCDTCGARVAAGRLRAHVAAHGLHLFPCDYCDQLFQNIDAWTQHTRTEHAVGSLF-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: