MonarchBase - Protein-coding gene

DPOGS205035
Transcript	DPOGS205035-TA	1734 bp
Protein	DPOGS205035-PA	577 aa
Genomic position	DPSCF300388 - 67312-78480
RNAseq coverage	94x (Rank: top 62%)

Annotation
*Heliconius*	HMEL022523	4e-102	53.24%
*Bombyx*	BGIBMGA001784-TA	2e-26	56.70%
*Drosophila*	su(Hw)-PB	7e-16	26.57%
EBI UniRef50	UniRef50_D6WMT6	2e-19	26.36%	Putative uncharacterized protein n=2 Tax=Tribolium castaneum RepID=D6WMT6_TRICA
NCBI RefSeq	XP_967201.1	4e-20	26.36%	PREDICTED: similar to zinc finger protein 99 [Tribolium castaneum]
NCBI nr blastp	gi\|91092524	8e-19	26.36%	PREDICTED: similar to zinc finger protein 99 [Tribolium castaneum]
NCBI nr blastx	gi\|366039961	1e-25	28.96%	zinc-finger protein 80-like [Mus musculus]

Group
Gene Ontology	GO:0003676	8.3e-05	nucleic acid binding
KEGG pathway
Orthology group	MCL34575		Lepidoptera specific

Nucleotide sequence:

>DPOGS205035-TA
ATGTCATGTCTGTGTGTTGGGCGATGTATCCAAGAGGTTAAGGAAGAAAGATTAAAGCAGTATTATTTAGATTTGCTCAGAGAAATTCCTTTGAATGTAGACCTTCCATCCCCATGGCTCTGTTGGGAGTGTGTATCCCTGTTACAAAGAGTGGTGGCGTTCAGAGATCAAGTGAAAGACTCGTATAGGATACTACAAACTTATACTAAGGAGAATTTCAATGAATGCCTGCAAAGCGATGTGTCGAGATCTCCACGGTTGAAGTTGGCCAAGCAATTGTGTATTGATATACCGCCTGAAAATGTGAAGTTTGCAATTGACGAAGATGAGTTGACTCCGAGGAATAAGAGTTTTAATATAGACTTGGAACATGAACTCGAAGAGGTCCACACGGTCATATGTGATGTACAGCGAGGACAGGGGAAGATCACAAACAACGGAGGTCTGTTCTTCAACGAGGATGATCCGATGTGTACCCAACACGACGTCAAGAACGAGCCGTGCGACGATGTATTTACTGAGAAAATGAAAATAGAAGCCGTCGATGAATCGAATTTGACCCTGAGGAGAGAGAGAAAGAAGTTAAATCATAAAATAAAGCGACCGGAAGTTAAAGATTACTGTGAGAACGGAAGTAATGAAATAATTGAGGTCAAAATTGAGAATTATGAAGGCAAGGTTTCATTTAGGAGAGAAGACATCTCGGAGAAGAACAAAAAAGATGTCAAGATAAGTATTGATGAAAACAAGATGGAAGGAGATAACGAAGACACGAAGGACAAGGTTACAGACACTAAGTGCGTTAAGAATCAATACTACAAAACTGTGCATCTCTCCTACGAGGAGATGCAAGCGGAGAGACAGAAACTGCGCTGCGCGGAGAGTTTCTTGAGCTCTCCGTATAAATGCGAGTCTTGCATACTGGTTTACAACAACCAGAGGTCGCTGAAGATTCATAGAGAAAAGAGACATTCAGTCACAGGTAAATATACCTGTTCCATTTGCGACATAAACGTATCATCAGCTGATGAATTCACGTCACACTACAGGCGGCACATGAGGACTTCAGCGGCAACACACAGGTACCACAAGGAAAAGCATCACTCTAACAAACCGAGGATAGAGTGCGCCGATTGTGATAAAACTTTCAGTCATCGAGCCGGGCTAATGAATCACAGGTTGACTTTTCACGAGTATCAGAACAAGTTCCCCTGCAACGTGTGCAACAAGATATTCAGGTGGAAAACTAGTTTAAAACGGCATTTGAAGAAACATAATGAGTCTAAGGATAACCGCAGTAAAGCCTTCTGTGCTAAATGCGACATCGTGTTCTCGTCTGTGTGTTCGTTGCAGCGTCACCTCAGGAACAGTTTGAAACATGTCACCAGCGATCAATTGAAGTTCATCTGCGACCACTGCAACCATAGATTTGCTGACAAGACGAAGCTGAGAGACCACATTGAAGAGAAGCACCTGTTCAGGACCTACCAATGCCATATCTGCCATAAGCCGTCCAAGAACAGGGTCGGACTGGAACAGCACATACGAACAGTGCATAAGGGAAGGCCGAATAACAGGATGTGTCACCACTGTGGCAAAGGGTTCCCCGTACACCTTAACATAAAATCGAAGAGGTATCCTATGTGCAGGAAACGGAAGGAGAACAATCAACCGGATGTGGCCGTCTTCACACTTCCGGTCCACTTTATGCCGGATAACGGATATGCTATATAA

Protein sequence:

>DPOGS205035-PA
MSCLCVGRCIQEVKEERLKQYYLDLLREIPLNVDLPSPWLCWECVSLLQRVVAFRDQVKDSYRILQTYTKENFNECLQSDVSRSPRLKLAKQLCIDIPPENVKFAIDEDELTPRNKSFNIDLEHELEEVHTVICDVQRGQGKITNNGGLFFNEDDPMCTQHDVKNEPCDDVFTEKMKIEAVDESNLTLRRERKKLNHKIKRPEVKDYCENGSNEIIEVKIENYEGKVSFRREDISEKNKKDVKISIDENKMEGDNEDTKDKVTDTKCVKNQYYKTVHLSYEEMQAERQKLRCAESFLSSPYKCESCILVYNNQRSLKIHREKRHSVTGKYTCSICDINVSSADEFTSHYRRHMRTSAATHRYHKEKHHSNKPRIECADCDKTFSHRAGLMNHRLTFHEYQNKFPCNVCNKIFRWKTSLKRHLKKHNESKDNRSKAFCAKCDIVFSSVCSLQRHLRNSLKHVTSDQLKFICDHCNHRFADKTKLRDHIEEKHLFRTYQCHICHKPSKNRVGLEQHIRTVHKGRPNNRMCHHCGKGFPVHLNIKSKRYPMCRKRKENNQPDVAVFTLPVHFMPDNGYAI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: