MonarchBase - Protein-coding gene

DPOGS214461
Transcript	DPOGS214461-TA	1416 bp
Protein	DPOGS214461-PA	471 aa
Genomic position	DPSCF300441 + 63806-66745
RNAseq coverage	140x (Rank: top 55%)

Annotation
*Heliconius*	HMEL004429	1e-66	50.19%
*Bombyx*	BGIBMGA011248-TA	3e-14	28.06%
*Drosophila*	CG9650-PH	3e-11	36.90%
EBI UniRef50	UniRef50_C3XT90	5e-18	35.51%	Putative uncharacterized protein n=2 Tax=Branchiostoma floridae RepID=C3XT90_BRAFL
NCBI RefSeq	XP_002738554.1	1e-16	31.76%	PREDICTED: zinc finger protein 64-like, partial [Saccoglossus kowalevskii]
NCBI nr blastp	gi\|260823014	6e-17	37.24%	hypothetical protein BRAFLDRAFT_71734 [Branchiostoma floridae]
NCBI nr blastx	gi\|260811193	1e-21	33.01%	hypothetical protein BRAFLDRAFT_66809 [Branchiostoma floridae]

Group
Gene Ontology	GO:0003676	4.3e-09	nucleic acid binding
KEGG pathway
InterPro domain	[17-82] IPR006612	4.3e-09	Zinc finger, C2CH-type
Orthology group	MCL35022		Lepidoptera specific

Nucleotide sequence:

>DPOGS214461-TA
ATGAGTTTGTCCAAGAACGGCTTCGCCGGAGCACCCTTTAACGAACGCACTGAAGGGCGAAGTCCCTACTTTATTTTCCCGGCGAGCAAGACGCTGCTGCGGAAGTGGCTGGACGTGACGCCGACCAAGGGAAGGATCACCATCGACTCGGTCATCTGTCATCAGCACTTCAAGGAGGACGAGTACGACTTCATCCGTGGGAAGACCAGGCTCAAGGCGAAGGTCGTCCCGAGCGTGTTCGATGTGAAAAGTCGCCGTCGCCCCAAAGAGAAGGCAACACAGAACATTGTCGACATCAATGACGAGATACCCGCGGCCACCATAGACAAGAACACGTTGAAGACTGTAAGCACCATAGACAAGAATATAGAGACGGAAAACAGTAAACACCATGAACCGAACGGAGATATTATCGAACGACTAGTAGCAAACTCGTCACAAGACAACGAAGCACACAAAGACATAGAAGACATTATAACGAACTATCAAATAAAACAGATAAGACCTATAAACAGGGAAACGGAAACGGAAAAGGAAGGAGAAGTAGAGAAAGAGGGAGAAGAAAGAAGAGAAAAAGAGATACAGAACGAGGAGAATGACGTGGTGACGATAGAAGACGCCGCGCCCGTCTACATAGAAGTTAACGTAGACAAAGGTAGCGACGTGGCCGGCGACTGTATGATGGTGCTGGAGAGCGTCCAGTGCGAGGTGGACCCCGGCCTGTTCGAGGAACAGGACAACGACCACGACCTGGACAGAGACTCGGATGTCATCGACCTTGGAGAGAGGAAGGAGGATCCTATAAGTCTGCTGACGTCCAGCGACGAGGACGAGGTCGTCATAGAGGAACCTCACATCGACACTGTGGAGGTGTCCGACGGAGACTCGGAGCACGACCTCGAGGAGGAGGACGATCTGCCGCTGGTGAAGCTGGTGCCGCACGGACACCGGAACAGGAAGTGGCCGCTCTACCAGTACTACTGTGTGGAGTGCGGCTTCACCACCGACGACAGGACGGAGTACAAGAAGCACAGGAGCGATCACACCACCGTCCTGGAGGTGTGCCAAGTGTGCGGCTACACGACGGCCAGCAAGGCGCAGTTCGGCAGACACAAGAGGAAACACAAAGACGAGAAGAAATACAAGTGTCACCTGTGCGACTACAGGGCGAGGCACAACATGAGCCTCATATACCACCTCAAGTCGCACGAGCGGGTCATAGTGAACGGCAAGGACGGGTACCAGTGCAGCAAGTGTAGCTACCGGAGCAACGTGAAGAGCAGCCTGGTGAGGCACGTCAGAATGTGCGGGGGCAGGTTCGCCTGCGAGGGCTGCGACTACAAGACCAAGAGGGAGAGCGACCTGCGGAAACACCGGCTGCGGAGACACGCCGCCTCCAGGAGAATACACAAGTGA

Protein sequence:

>DPOGS214461-PA
MSLSKNGFAGAPFNERTEGRSPYFIFPASKTLLRKWLDVTPTKGRITIDSVICHQHFKEDEYDFIRGKTRLKAKVVPSVFDVKSRRRPKEKATQNIVDINDEIPAATIDKNTLKTVSTIDKNIETENSKHHEPNGDIIERLVANSSQDNEAHKDIEDIITNYQIKQIRPINRETETEKEGEVEKEGEERREKEIQNEENDVVTIEDAAPVYIEVNVDKGSDVAGDCMMVLESVQCEVDPGLFEEQDNDHDLDRDSDVIDLGERKEDPISLLTSSDEDEVVIEEPHIDTVEVSDGDSEHDLEEEDDLPLVKLVPHGHRNRKWPLYQYYCVECGFTTDDRTEYKKHRSDHTTVLEVCQVCGYTTASKAQFGRHKRKHKDEKKYKCHLCDYRARHNMSLIYHLKSHERVIVNGKDGYQCSKCSYRSNVKSSLVRHVRMCGGRFACEGCDYKTKRESDLRKHRLRRHAASRRIHK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: