MonarchBase - Protein-coding gene

DPOGS203885
Transcript	DPOGS203885-TA	1113 bp
Protein	DPOGS203885-PA	370 aa
Genomic position	DPSCF300402 + 86937-100540
RNAseq coverage	191x (Rank: top 48%)

Annotation
*Heliconius*	HMEL008131	2e-132	60.48%
*Bombyx*	BGIBMGA003834-TA	5e-81	43.97%
*Drosophila*	crol-PE	3e-27	28.52%
EBI UniRef50	UniRef50_UPI000206267F	2e-31	34.28%	UPI000206267F related cluster n=5 Tax=unknown RepID=UPI000206267F
NCBI RefSeq	XP_001951603.1	4e-32	33.95%	PREDICTED: similar to zinc finger protein 35 [Acyrthosiphon pisum]
NCBI nr blastp	gi\|260837031	5e-34	36.10%	hypothetical protein BRAFLDRAFT_208499 [Branchiostoma floridae]
NCBI nr blastx	gi\|260794567	1e-42	32.92%	hypothetical protein BRAFLDRAFT_57705 [Branchiostoma floridae]

Group
Gene Ontology	GO:0003676	1.3e-10	nucleic acid binding
	GO:0005634	1.9e-07	nucleus
	GO:0008270	1.9e-07	zinc ion binding
	GO:0005622	4.5e-05	intracellular
KEGG pathway
InterPro domain	[277-303] IPR013087	1.3e-10	Zinc finger, C2H2-type/integrase, DNA-binding
	[7-56] IPR012934	1.9e-07	Zinc finger, AD-type
Orthology group	MCL24943		Lepidoptera specific

Nucleotide sequence:

>DPOGS203885-TA
ATGTCGTGTGGAAATGAGAATTATTTTCAAAAAATAACAGAATGCTTGGATATAGATCTAACAAAATATGATCATCCTAACAAAGCATGCGACAGTTGCTTGGATCAAATTAACAAATTTCATGACTTTAAAAAATTTTGCCAAGAAACAGATAGGAGGTTGAGAGAAATTTTTGAAAATCAACACAACATCATCAAAAAAGTCGGAAGACAAAGCACTATAGTGGAGATCTTTGATTGTTTACAAACCGACAGCGAAAACGAAAAAAAAGAAATTAAAAAATCTTGGCGGTACAAACCGAAGCGAACACCTACGTATTGCAATATATGTAGAATAGATTTTAAAACTTTAGAAAAATTCAGCGAACACAGTTCTCAAGAGCACGGCATCGAAAGTGGGCTGTACAAATGTTTTGGTTGCGAGAAGAGGTTCAAAAATCGAAAAACGAGACTTGGCCATGAGCTGAAAATTTGTAAAAATCTTAAAAATGGGTATAGATGTGGCATTTGTAATAGATATCTCCCGAGACGAGGCTTGTACGAGACACATATGAGAGACCACAGAGGGAATGTACCAATGAAGCTTCCGAATGAGCTATTCAAGTGCAGAAAGTGTGACAAAGTGTTTGACACAAACGACAATCTCTCGAGACATGTCTCCGAACATGACTTGAATGAGGACAATTATATATGTGAGAAATGTGGTCGCGTATTCACAAGGAAGGACTACCTGCACAAGCACAAACTAACGCACACAGGCGAAAAACAGCACACATGTCCGCACTGCGACTTCCGGACGATACAGAGGTCGTCGCTGATTGTTCATATAAGGAAGCACACCGGCGAACGTCCCTACAAATGTAGCGTGTGTCCGCAACGGTGCATCTCCAGTTCAAACCTGAGAGCACATCAGCAAAGACACTTGGGTCTCAAAGTTCATGAGTGTACAATCTGCAATAAAAAATTCGGTTATAAAATAAGTTTAAAAGAGCACATGTCGACGCATGCTCCGTCGAGTTACTCTTGCGATCAGTGCAGCTCGACTTACTCGAGATTGAGAGGGTTAAGGCGACATGTGCTGACGAAACATGGAACCAGAAAGGAGGGACTATGA

Protein sequence:

>DPOGS203885-PA
MSCGNENYFQKITECLDIDLTKYDHPNKACDSCLDQINKFHDFKKFCQETDRRLREIFENQHNIIKKVGRQSTIVEIFDCLQTDSENEKKEIKKSWRYKPKRTPTYCNICRIDFKTLEKFSEHSSQEHGIESGLYKCFGCEKRFKNRKTRLGHELKICKNLKNGYRCGICNRYLPRRGLYETHMRDHRGNVPMKLPNELFKCRKCDKVFDTNDNLSRHVSEHDLNEDNYICEKCGRVFTRKDYLHKHKLTHTGEKQHTCPHCDFRTIQRSSLIVHIRKHTGERPYKCSVCPQRCISSSNLRAHQQRHLGLKVHECTICNKKFGYKISLKEHMSTHAPSSYSCDQCSSTYSRLRGLRRHVLTKHGTRKEGL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: