MonarchBase - Protein-coding gene

DPOGS203674
Transcript	DPOGS203674-TA	2058 bp
Protein	DPOGS203674-PA	685 aa
Genomic position	DPSCF300010 - 2280870-2285283
RNAseq coverage	1331x (Rank: top 10%)

Annotation
*Heliconius*	HMEL013337	0.0	81.68%
*Bombyx*	BGIBMGA003468-TA	0.0	60.73%
*Drosophila*	CG8108-PB	2e-43	32.15%
EBI UniRef50	UniRef50_F4WXI2	8e-81	40.62%	Zinc finger protein on ecdysone puffs n=8 Tax=Pancrustacea RepID=F4WXI2_ACREC
NCBI RefSeq	XP_001121361.1	9e-81	43.46%	PREDICTED: similar to CG8108-PB, isoform B, partial [Apis mellifera]
NCBI nr blastp	gi\|328784238	6e-81	42.33%	PREDICTED: hypothetical protein LOC725524 [Apis mellifera]
NCBI nr blastx	gi\|307205724	2e-86	37.60%	Zinc finger protein on ecdysone puffs [Harpegnathos saltator]

Group
KEGG pathway
Orthology group	MCL18818		Insect specific

Nucleotide sequence:

>DPOGS203674-TA
ATGGAGGTCGGGGTAACTACAGCGGCCGTGGAAGTGGTTATAGAGGATCATTTCGTGGTAACGGGAGTCGCGGCGGATATGATGGCGGCCGTGGGGGCCGAGGAGGCGGCTACTCAACCTATAACGAAAATCGATACAACAGTAACAATGCCAACAGATATTCATCAAGTCGGGATCGTTGAAAGTTCAGCTAGTTATTCAAATCGTGACTATGGTGGTCGATCAGGCTCTCCAGAACGCAAACGGATGAGAATGGAGCATAGGAGCGATGCAAACAGAATTATCTACAGGGCTCATCGAGCGATAGACGTAGCCACGATGGCGGCAGTCACTATGGCGGCTCGTACGGCGGTAGACAGGAGGGTTACGGCGAGCGGCGGTCGTTCGCGAGCGAGGACAGGCGGCGGTCGCCGGCTCGAGAGTATCGCAAGCCCAGTGGCATGGGGCCGCCGCGAGAGCCGCTCCGAGCGCTCGTCCGGCCGCGGGCTGCGCGACGCTCATTCCGCGGACGAACATTGCGCACTCGCCCCCTCTATCGGGGAGCCCCCCGTTCCCGTGGATCCTTCTCCTCTAGGCGATTTGCTGAAAGATCGCTGGGGTACACCCGCACATTTAGAACTACTAAGGGGCGAAGGTAATGCTAAATGCAAAATAATGTTTAAGTTAGTTTCCGATCCCATGGAAGGTGAGCCTGATTCACAAAGCTCTGTTAAATCAAAAGAAGATGAAGCATCTTCCACAGAGGAAGATTGGGAAGCTGATGAGAAAGAGGAAGTCATAGAAGAGAAGAAAGAAACCAAGAACAAGTCGCCAGAAGTCAGTGCACCAGAAGTCGAGGGGTCAGAAGGTGAGGCAGGTGAAGGCGGAGAGGATACTGATAAAGAACCAGATGCTGCGTCAGATACGGCTCCATCGCGTCCCTATGTTCATCTTGCCTGTGTTCACTGTAAAGAGAAATGTGTTACTTTTGGAAGTTACACCAAACACCTTTTGTCGAGTAAGCATCGTGCCGCTATGAGTTCAGTGGCTCGTCGCCATAAGCTAGAGTTGCTACGTATGCGTGTAGCTCAGCGCGGCGCGCAACGTGACCTGGAGGCTGCGGCAGGCGCCGAGCTGGCGGCCCGTACCACTTTCTGTCTTGTGTGCCGCCTCAACCACCGTACCACGAGACACGCGCATAACCTCACCGACACTCACCGCGCCATGAAACGACTTCTGATGCCATTCTGCCGCATCTGTCGTATCACTTTCCGCTCACCCATGATTTACGAACACCATATTTGTTCCGTGGAACATCTTAAGAAAAAGGCCAGTCTTAACGCTCGACGGGCGAGCCCAAAGGCTGAAGCTAGTGCTGATGAGGGTATGGATGTGGATTTGGATAACTTCATGACGTTGGACTCTGTGGGTGATGTTGATGAAGTTGAAGATGATGACTCCGGCGGTGAGAAAAAAGATGAATCTGCCCCAAAAAAAACAAAAGTTGAGATAAATATTGGTAGCGAGCATATTAAGAAGTTAGAGGTTCACTGGTGCGAGCTATGTCGCGTGTATTTGCCGCGTGTGGAAGCTGGTAGTGCTGAGGAGGCGGAAGCTCTTCGCCGTCACTGCCGTCTGCGTGTCCACCTCGGTCGGTATGTGCAGCACCGGGACACGCGCACACTACGGCGCCACGCAGAGAGAATACACCGCCAGCTACACCAACAAAAGGAAGATGAAAAAGAAGTTGCCGCTTCTGAAGAAGTAGCCGATAAGGAAAAAATTGAAAAAAAGGAACCTTCTGTTGAAAACGCAAATTTGGAAAATGGAGCTGATCTGTCAAATATTTCTGGAAGCGAAGATAAATTGTGGGCTGATGTGGATAAGGATATTGGCGAGTTATTAAGAGAAGTGGATCCTCAGGGAAATGAAGCTAGTGACGATGACGAAGACCTTGGAAGGTATGATAAATTTCGTAAAAGTGATAAAAAACCAAAGGCTGATTTAGAAGAAGGTGAAGATGCTAAAGAAGAAATCTCCAATGAAAAAGCAAATGTAGAAGTAAAAACATCTATTTGA

Protein sequence:

>DPOGS203674-PA
MEVGVTTAAVEVVIEDHFVVTGVAADMMAAVGAEEAATQPITKIDTTVTMPTDIHQVGIVESSASYSNRDYGGRSGSPERKRMRMEHRSDANRIIYRAHRAIDVATMAAVTMAARTAVDRRVTASGGRSRARTGGGRRLESIASPVAWGRRESRSERSSGRGLRDAHSADEHCALAPSIGEPPVPVDPSPLGDLLKDRWGTPAHLELLRGEGNAKCKIMFKLVSDPMEGEPDSQSSVKSKEDEASSTEEDWEADEKEEVIEEKKETKNKSPEVSAPEVEGSEGEAGEGGEDTDKEPDAASDTAPSRPYVHLACVHCKEKCVTFGSYTKHLLSSKHRAAMSSVARRHKLELLRMRVAQRGAQRDLEAAAGAELAARTTFCLVCRLNHRTTRHAHNLTDTHRAMKRLLMPFCRICRITFRSPMIYEHHICSVEHLKKKASLNARRASPKAEASADEGMDVDLDNFMTLDSVGDVDEVEDDDSGGEKKDESAPKKTKVEINIGSEHIKKLEVHWCELCRVYLPRVEAGSAEEAEALRRHCRLRVHLGRYVQHRDTRTLRRHAERIHRQLHQQKEDEKEVAASEEVADKEKIEKKEPSVENANLENGADLSNISGSEDKLWADVDKDIGELLREVDPQGNEASDDDEDLGRYDKFRKSDKKPKADLEEGEDAKEEISNEKANVEVKTSI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: