MonarchBase - Protein-coding gene

DPOGS203153
Transcript	DPOGS203153-TA	1107 bp
Protein	DPOGS203153-PA	368 aa
Genomic position	DPSCF300035 - 981250-983580
RNAseq coverage	402x (Rank: top 30%)

Annotation
*Heliconius*	HMEL006505	1e-145	90.49%
*Bombyx*	BGIBMGA011498-TA	2e-165	85.29%
*Drosophila*	sr-PA	3e-77	89.58%
EBI UniRef50	UniRef50_E0VJ72	2e-75	81.29%	Early growth response protein, putative n=3 Tax=Neoptera RepID=E0VJ72_PEDHC
NCBI RefSeq	XP_970833.2	1e-77	74.09%	PREDICTED: similar to conserved hypothetical protein [Tribolium castaneum]
NCBI nr blastp	gi\|270002538	2e-76	74.09%	hypothetical protein TcasGA2_TC004846 [Tribolium castaneum]
NCBI nr blastx	gi\|189234146	2e-80	44.90%	PREDICTED: similar to conserved hypothetical protein [Tribolium castaneum]

Group
Gene Ontology	GO:0003676	2.4e-14	nucleic acid binding
	GO:0008270	1.1e-05	zinc ion binding
	GO:0005622	1.1e-05	intracellular
KEGG pathway	nvi:100117007	1e-75
	K09203 (EGR1)	maps->	Prion diseases
InterPro domain	[325-355] IPR013087	2.4e-14	Zinc finger, C2H2-type/integrase, DNA-binding
Orthology group	MCL25861		Lepidoptera specific

Nucleotide sequence:

>DPOGS203153-TA
ATGGGCGCGGATGGAGACCCACCGACCGGGCCTCACCTCCTCTCGCTGGCGGACGTCGGGGCGCTGGGCTTCGACTGCGCTCTGAAGCCGGTGACCGCGCCTATGACAGGCGGCGCTCCGGCCGATCTCAACACACCCGTGTCCACATCGGAACTTCCCGCTTTCTTCCCGAGCCTGCTCGAGCCTCCTCCGATATCAGGTACTTTACCAGGCGATGAGTTACTGGGGTGCTCCCCTCGTCGTCACAAGCACGAAGCGTCTTTGTCACCGGGAGCGAGGGCTGAGGACGCTAGCAATGCCTCTAGTGCTAGCGCCTCTCTATACGGACCGCCGATGGGCGGCAAAAGAGCTCCCTCACCACCACTACAATGGTTGCTACCATCTGGACCCGGTCCCGGCAGCGTCGATAAATACTTCCAACAAGAATACGAGGAACGCGTCGAGCTTCTACCGCCCGAATGTCAGCCTTCTTACTGTACAGCACCGCAGCAATGCCAGCCGCAACACTGCGACTACAGACCCCAACCTCCACCACAACCCCAACACTCGTGGGAGACGCAGGAGTACGCGAGCGTGCCGCAGCCAACACCGGGTCCCTCCGGAGTCCCCAAAAGAGAACCCTATCCAAACACAACAGGCGACAGACCCGTGCAACTAGCAGAATACAACCCGTCCACGAGCAAAGGCCATGAGATATTATCTCAAGTGTATCAACAGAGCGCTCAACCACTGCGTCTAGTCGCCGTCAAACCTCGCAAGTATCCCAACCGTCCGAGTAAAACACCCGTACATGAAAGGCCCTATGCCTGTCCAGTGGACGAGTGTGATCGCAGGTTTTCGAGATCAGACGAGCTGACAAGGCACATACGCATACACACAGGACAAAAACCGTTCCAGTGTCGTATCTGTATGCGCTCGTTCAGTCGATCGGATCATTTGACGACACATGTCAGAACTCACACAGGGGAGAAGCCGTTTGCGTGCGACGTGTGCGGTCGTAAGTTCGCGAGGTCTGATGAGAAGAAGCGTCACGCGAAGGTTCACCTTAAGCAGCGTCTCAAACGCGAGCGGGGCAGTGGACCGGCTCACCCACACGCGCCGCTCTAG

Protein sequence:

>DPOGS203153-PA
MGADGDPPTGPHLLSLADVGALGFDCALKPVTAPMTGGAPADLNTPVSTSELPAFFPSLLEPPPISGTLPGDELLGCSPRRHKHEASLSPGARAEDASNASSASASLYGPPMGGKRAPSPPLQWLLPSGPGPGSVDKYFQQEYEERVELLPPECQPSYCTAPQQCQPQHCDYRPQPPPQPQHSWETQEYASVPQPTPGPSGVPKREPYPNTTGDRPVQLAEYNPSTSKGHEILSQVYQQSAQPLRLVAVKPRKYPNRPSKTPVHERPYACPVDECDRRFSRSDELTRHIRIHTGQKPFQCRICMRSFSRSDHLTTHVRTHTGEKPFACDVCGRKFARSDEKKRHAKVHLKQRLKRERGSGPAHPHAPL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: