MonarchBase - Protein-coding gene

DPOGS211954
Transcript	DPOGS211954-TA	1227 bp
Protein	DPOGS211954-PA	408 aa
Genomic position	DPSCF300011 + 1020334-1024026
RNAseq coverage	34x (Rank: top 74%)

Annotation
*Heliconius*	HMEL002947	6e-138	94.68%
*Bombyx*	BGIBMGA000905-TA	3e-119	91.07%
*Drosophila*	Kr-PA	1e-65	70.37%
EBI UniRef50	UniRef50_Q17D31	6e-67	59.63%	Zinc finger protein n=2 Tax=Culicinae RepID=Q17D31_AEDAE
NCBI RefSeq	XP_001648943.1	1e-67	59.63%	zinc finger protein [Aedes aegypti]
NCBI nr blastp	gi\|297522154	2e-67	60.62%	kruppel protein [Clogmia albipunctata]
NCBI nr blastx	gi\|221139854	4e-71	51.36%	protein krueppel [Tribolium castaneum]

Group
Gene Ontology	GO:0003676	2.1e-14	nucleic acid binding
	GO:0008270	0.0001	zinc ion binding
	GO:0005622	0.0001	intracellular
KEGG pathway
InterPro domain	[269-298] IPR013087	2.1e-14	Zinc finger, C2H2-type/integrase, DNA-binding
Orthology group	MCL16090		Insect specific

Nucleotide sequence:

>DPOGS211954-TA
ATGAGTGTGGTCGGAGTTGAGGGCGCGGGCCGGGGAGCGTTATGTGGTACACGGGAGGAAATAGTGCATCGCGTGCATACGGCTGCAGTGAAGACCGGCGGGGAGGCCGGGGCGGCGGCGGGGCGAGCGGGGACCCGGGCTCGGGGGGCGCGGGGTCCGAGGAGACCCTGGTGGGGCGTGGGGGTGTGTTTACAGCGAGGGGCGGCCGGACAGCGGCGCGCCACAGTCAGTGTTGTGGTAGGTCCCACAGAGGAAGCTCGCCTCGGCACGACGCACTCGCTCTCGAGACTTCGCGACGGAACATGCTCACAGTGGTGTGAGATGGCCCTGTCGCTGCAGTCCAACCAGACCTCGCGAGGAGTTTCTGTAAGATCACTATCAAGTATGAGGGAGGAATCGTTGCCGATGTTGGCTGAGCGTATACTAGCAAGCCGTGCTGCTGCTTTAGTGGCCGGTCTACCTGCGGAACTATATTCTGGAGCATTACTAGCAGCTTGGCCACCGTCACCGCCCGCCCCCTTATTGCCTCCACCAGCTCCGGAAATAGAAAGAGCAAGGAAACGACGACGAACGCCGAAACTAGACGATACAACGTCCCCTGCCCCACCATCACCACCGTCCTCTGGTTCATCACCAGGAGCTACCGACCCACCGCGAGATAAATTGTTCACTTGCAAAGTTTGTTCGAGGTCCTTCGGATACAAACACGTCCTCCAAAACCACGAGCGAACACACACTGGTGAAAAACCATTCGAGTGCGGAGAATGCCACAAACGGTTTACTCGTGATCACCATTTGAAGACACACCTTCGCCTGCACACTGGCGAGAAGCCGTACAGTTGTCCGCATTGTCCACGGCACTTCGTACAAGTCGCTAATCTGAGAAGACATCTTCGGGTTCACACAGGAGAGAGACCCTACGCCTGCGCTCGCTGTCCAGCTCGATTCTCAGACTCGAATCAGCTCAAAGCTCATGCTCTGGTACACGAAGGTGACGCCCCGTTCGCTTGCCGATGTGGAGCGAGATTCAGGAGACGACAGGCTGCAGCTTTACACCGCTGTCCGAGCGGTGGCTGCGAGCCCGGCACGCCAAGCCCTCCAGCCTCGATCGCCCCGGATTGGCGCTGGGACGACTGGCCGGAGCAAACCGAGCCAGAAGATTTATCTCTGCCCCGAAGACCGGCGACTCCGGATTCGCCGACTGACTTGCGCGTGCACGCGGCGTAG

Protein sequence:

>DPOGS211954-PA
MSVVGVEGAGRGALCGTREEIVHRVHTAAVKTGGEAGAAAGRAGTRARGARGPRRPWWGVGVCLQRGAAGQRRATVSVVVGPTEEARLGTTHSLSRLRDGTCSQWCEMALSLQSNQTSRGVSVRSLSSMREESLPMLAERILASRAAALVAGLPAELYSGALLAAWPPSPPAPLLPPPAPEIERARKRRRTPKLDDTTSPAPPSPPSSGSSPGATDPPRDKLFTCKVCSRSFGYKHVLQNHERTHTGEKPFECGECHKRFTRDHHLKTHLRLHTGEKPYSCPHCPRHFVQVANLRRHLRVHTGERPYACARCPARFSDSNQLKAHALVHEGDAPFACRCGARFRRRQAAALHRCPSGGCEPGTPSPPASIAPDWRWDDWPEQTEPEDLSLPRRPATPDSPTDLRVHAA-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: