MonarchBase - Protein-coding gene

DPOGS203942
Transcript	DPOGS203942-TA	1293 bp
Protein	DPOGS203942-PA	430 aa
Genomic position	DPSCF300005 - 80893-82576
RNAseq coverage	16x (Rank: top 81%)

Annotation
*Heliconius*	HMEL012081	2e-169	72.24%
*Bombyx*	BGIBMGA012275-TA	2e-132	60.47%
*Drosophila*	CG17385-PA	9e-31	38.32%
EBI UniRef50	UniRef50_E9Q2S7	1e-33	38.32%	Uncharacterized protein n=5 Tax=Murinae RepID=E9Q2S7_MOUSE
NCBI RefSeq	XP_001945749.1	1e-32	38.61%	PREDICTED: similar to mCG7830 [Acyrthosiphon pisum]
NCBI nr blastp	gi\|203097404	4e-33	38.32%	zinc finger protein 426-like [Rattus norvegicus]
NCBI nr blastx	gi\|326667255	4e-37	38.96%	PREDICTED: zinc finger protein 91-like [Danio rerio]

Group
Gene Ontology	GO:0003676	2.6e-13	nucleic acid binding
	GO:0008270	7.6e-05	zinc ion binding
	GO:0005622	7.6e-05	intracellular
KEGG pathway
InterPro domain	[280-306] IPR013087	2.6e-13	Zinc finger, C2H2-type/integrase, DNA-binding
Orthology group	MCL25941		Lepidoptera specific

Nucleotide sequence:

>DPOGS203942-TA
ATGGAAGATATCCAGAATGTTTTAATTACAAATTCGGAAGGTGTTTTAAATAAGGATTATATTTCAGGCTTTATAGAGAAACCTGAACAGGATGGATCAGCTGTTTTTATTTGTCGCATTTGTAAGAAGACATTTTATAATGCTAACGCGCTTCAAAATCATAAGAATTTGCAACATGACGATATTGGTTCCCTTTCTGATGATGATAATATTTCTTATTCAGTCAATTCCAATGACCAGATTTATGAAGATCTCTGTGGTTTTAAATTCATCCCTTTAAAAAAAAACGAAGAAGATTTGATTATAGAGGAGGATGGCATTTCAAAACGCACGTTTAGGTGTGATACCAGCTACCTCATTGTGAAATATGAAAGCAATGAAAGTGTAGGTGTAAAGAGATCTCGTTTGGATAACATGATCAGAAAAATTCAGTCGAAGCCAGAAAAGAAACCAGTCGACTTGAGGGGACCATTTACGTGCACACTTCCCTCGACTTTGCGACCCAGTGTACAATGTCGCCAGATTTTTTTTAACTGTTGCGAATATTCGTTACATTACCGAGAAGAACATACCAAACGAAGGAAAGCCGCTTTACGCTGTCAAGTTTGCGAGAAACGTTTGGACAGAGACTTTTATCCAACGACCACTCTAACTGAGCAATTAAACACCCAGAACACTTCATCTTTCTCGTGTCGTATATGTGGGTTTACATTTTTAGATAGTACAGATTTCGATGAGCATAATCGCATAGTGCACGCAAAAATGAAACCACACCAGTGTAGTTTGTGCTCCAAACGCTTCACACAACTTGGTGGTCTCCAACAACACATGCGTATGCATACAGGAATACGTCCGTTCGTATGTAAATTCTGTTCGAAAGCATTTACGCAAAAGGCTGGTTTGGATCAACATTTACGAACTCACACTAAGGTAAAACCATTTAAGTGTATCATTTGTTGCAAATGCTTTTCGCAGTCAGTTCATTTACGTCAGCACATGCGAACACATACAAATATCCAGCCTTTTGGATGTCCTATATGCAATAGGAGATTTAAACAGAGTAGCCATTTAAACTTTCATATGCGTTCTCATGTTGGAGAAGCGAGTGCATTGATCATGGAACAATATGCTCAGGCTATGCAGCAACAAGGTCAAATGGACTTTCTCAATTTTTCAAAAGTGCAGCCAGTTCAGGATGGTGAAACCATTTACTATTCTGCAGAATTAGCTTCGATGCCTCCCGAAGCCGGTGCAGCTAATAGTAAATATTTCCTTTCTAATAAAGGCATCTGA

Protein sequence:

>DPOGS203942-PA
MEDIQNVLITNSEGVLNKDYISGFIEKPEQDGSAVFICRICKKTFYNANALQNHKNLQHDDIGSLSDDDNISYSVNSNDQIYEDLCGFKFIPLKKNEEDLIIEEDGISKRTFRCDTSYLIVKYESNESVGVKRSRLDNMIRKIQSKPEKKPVDLRGPFTCTLPSTLRPSVQCRQIFFNCCEYSLHYREEHTKRRKAALRCQVCEKRLDRDFYPTTTLTEQLNTQNTSSFSCRICGFTFLDSTDFDEHNRIVHAKMKPHQCSLCSKRFTQLGGLQQHMRMHTGIRPFVCKFCSKAFTQKAGLDQHLRTHTKVKPFKCIICCKCFSQSVHLRQHMRTHTNIQPFGCPICNRRFKQSSHLNFHMRSHVGEASALIMEQYAQAMQQQGQMDFLNFSKVQPVQDGETIYYSAELASMPPEAGAANSKYFLSNKGI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: