MonarchBase - Protein-coding gene

DPOGS214691
Transcript	DPOGS214691-TA	1974 bp
Protein	DPOGS214691-PA	657 aa
Genomic position	DPSCF300022 - 1551915-1563730
RNAseq coverage	303x (Rank: top 37%)

Annotation
*Heliconius*	HMEL010830	6e-148	68.77%
*Bombyx*	BGIBMGA005595-TA	1e-85	62.69%
*Drosophila*	GATAd-PA	3e-29	35.62%
EBI UniRef50	UniRef50_D6WX57	4e-42	36.93%	GATAd n=2 Tax=Tribolium castaneum RepID=D6WX57_TRICA
NCBI RefSeq	XP_001812551.1	4e-43	36.66%	PREDICTED: similar to GATAd CG5034-PA [Tribolium castaneum]
NCBI nr blastp	gi\|189240277	8e-42	36.66%	PREDICTED: similar to GATAd CG5034-PA [Tribolium castaneum]
NCBI nr blastx	gi\|270012803	3e-44	37.10%	GATAd [Tribolium castaneum]

Group
Gene Ontology	GO:0006355	8.1e-23	regulation of transcription, DNA-dependent
	GO:0008270	8.1e-23	zinc ion binding
	GO:0003700	8.1e-23	sequence-specific DNA binding transcription factor activity
	GO:0043565	4.9e-21	sequence-specific DNA binding
	GO:0005634	3.5e-14	nucleus
KEGG pathway
InterPro domain	[494-549] IPR013088	8.1e-23	Zinc finger, NHR/GATA-type
	[492-542] IPR000679	4.9e-21	Zinc finger, GATA-type
	[11-89] IPR012934	3.5e-14	Zinc finger, AD-type
Orthology group	MCL22098		Insect specific

Nucleotide sequence:

>DPOGS214691-TA
ATGTGTAATTTGCCGCCGAAGTTCCATTCAGTGTGTCGCCTTTGTTTATCATTCTGTGGCGATAATTGCAGTGATGTTAAACTCCCAATATTCGATCGTGATAAGGATAAATCCCGGCTTTCCGAGATGATAATGACATATTTGTCCATAATGGTATCATCAGAGGACATGCTGCCGCAGGTGGTATGTGGGAGCTGTGCACACAAACTTGATGAGTTCCACACATTCAGAGAACTGACACACAAGTCTGAGAGACTTTTGGAACAATTTGTACAATACGCTAATTCACTGTCAGGTCCAAAAGAGGATATCCTGAATGTAACCGCCGACAAGTTGGAAGAAATTATTAAGTCCTTAAACGAGAATGATTACGACGATCCCATAAAGAGCAAGTACGATGAGATCGGCTCCCCGGACTCTACCGAGGAGATGAAGAACCTGGAGAGTCGGCAGGCGGCTGTGACACTGCTGCAAATAAAAAACTACGATCCTACTAAATACGCCGTCAAGACTGAGGAAAGTCCTCACATAATGTTCAATAGCGTTCCGAGTTTACCGCCCGCCGACAGAGCGAGAGAGGTTATGCATTGTAATGCCGTCATAGATATAATAAGCAAGGCTGTCGCGGTGGCACAGCGCGAGAACGTTGAATCTCAGAACTACCAGCCGAATTACACGGGCGTCATAGACAGGACGTCCTCTACGGCCGCTGAGCTAGCGTACACGCAGGACTACCCTGAGGAGCAGTACGCTGGGTACAATGCCGCTCATGACGTCACCAGCCCCGGCAGCGATGACGACAACAAGGAAATGGACCTTGAACAGAACGAGCAGTGCGAGCGTGATACGAGCGGCTTCTTACAGAGGAACCACGCCAGTAACAAATCCAGCTTCGTCGAGGAATACAAGCAGCACGTGTTCGGGCAAGCTAAGAAGCATAATGACAGCTCGCCCGTGTACGAGGAGTGCAGTCAGAGCAGCAGCGGCTCAGACCCTGATAGACTACAGATGGATATCTCTGAAGTATCGCAGGACGACCCCGAAGAGACGCAATCGGTGCCATCAGCTCAGTCTTCCCCCAAGCCGCCTCACGACAACGATACGGACAAGGAGTCCCTGTGGCAGGCGCTCCACAAACAGAACGGTCGTGGCGGCGAGGCGACTCACCTGCTGCGGAGGCTCATCAACAGCAAACACCTGGGCATGACGGTGTCCCCGCTCCGGGCCGCGCCCTCACCACTACCACAGACACACCCGCACACACACAACGGCACCGTGTCACCGAACGGTGAGTGGTCGAGTCCCACTCGCGGCGGGTCGGGGGCGGGCGCCGGCACAGCACGCAGGAAGCAGAGCTGCCCGGCTCGAGCACAACCAGCCCTGGACACCACCGGCTGGACCAGCGACCAGCAGGAGAGTCCAGAGAGCGCGTCTAATACAACATCAGGCGTGGTGTCGGGTGGGGCAAGGGGTCCTCGTGTGGAACTGTCCTGCAGTAACTGCGGCACTCACACCACCACCATCTGGCGGAGGGACGCCCGCGGGGAGATGGTGTGCAACGCGTGCGGTCTGTACTACAAGCTGCACGGTGTACCGCGGCCCAGCGCCATGAGGAGGGACACGATACACACACGGCGCAGGCGGCCCAGACACGACGGGAAACATACTAGGAACACCTCGCCAGGCGGCGGTGAGGGAGGGGGGACAGTGGTCAGTACTGAGGGGGAGGTGTCACGCGGTGGAGGCTCTGGAGGGGGAGGGGGAGCCGCCGCAGGGGGGCCGTCTGACGGGGCCGAGGAGGCCGTGCTCGCAGCGCTCAGGAGACAGCTACAACCTCACTTGCTGGCAGCACTACACGCACACACACCCAGGGAACACACGCACACACGTACACAGGGCCGCAGCGTGTCGGAGTACGATGAGGCGCCCCTGAACCTGGTGGCGAGTCACGTGGCCGCCGAGGAGACGCGCTGA

Protein sequence:

>DPOGS214691-PA
MCNLPPKFHSVCRLCLSFCGDNCSDVKLPIFDRDKDKSRLSEMIMTYLSIMVSSEDMLPQVVCGSCAHKLDEFHTFRELTHKSERLLEQFVQYANSLSGPKEDILNVTADKLEEIIKSLNENDYDDPIKSKYDEIGSPDSTEEMKNLESRQAAVTLLQIKNYDPTKYAVKTEESPHIMFNSVPSLPPADRAREVMHCNAVIDIISKAVAVAQRENVESQNYQPNYTGVIDRTSSTAAELAYTQDYPEEQYAGYNAAHDVTSPGSDDDNKEMDLEQNEQCERDTSGFLQRNHASNKSSFVEEYKQHVFGQAKKHNDSSPVYEECSQSSSGSDPDRLQMDISEVSQDDPEETQSVPSAQSSPKPPHDNDTDKESLWQALHKQNGRGGEATHLLRRLINSKHLGMTVSPLRAAPSPLPQTHPHTHNGTVSPNGEWSSPTRGGSGAGAGTARRKQSCPARAQPALDTTGWTSDQQESPESASNTTSGVVSGGARGPRVELSCSNCGTHTTTIWRRDARGEMVCNACGLYYKLHGVPRPSAMRRDTIHTRRRRPRHDGKHTRNTSPGGGEGGGTVVSTEGEVSRGGGSGGGGGAAAGGPSDGAEEAVLAALRRQLQPHLLAALHAHTPREHTHTRTQGRSVSEYDEAPLNLVASHVAAEETR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: