MonarchBase - Protein-coding gene

DPOGS203772
Transcript	DPOGS203772-TA	1845 bp
Protein	DPOGS203772-PA	614 aa
Genomic position	DPSCF300010 + 641747-649879
RNAseq coverage	120x (Rank: top 58%)

Annotation
*Heliconius*	HMEL004224	6e-170	62.53%
*Bombyx*	BGIBMGA007089-TA	2e-29	27.39%
*Drosophila*	CG5245-PA	1e-31	28.24%
EBI UniRef50	UniRef50_UPI00020F6A30	1e-34	30.16%	UPI00020F6A30 related cluster n=1 Tax=unknown RepID=UPI00020F6A30
NCBI RefSeq	XP_002031464.1	8e-35	29.53%	GM24032 [Drosophila sechellia]
NCBI nr blastp	gi\|326676531	6e-37	30.46%	PREDICTED: zinc finger protein 850 [Danio rerio]
NCBI nr blastx	gi\|326676531	2e-44	29.81%	PREDICTED: zinc finger protein 850 [Danio rerio]

Group
Gene Ontology	GO:0003676	7.4e-06	nucleic acid binding
KEGG pathway
InterPro domain	[344-378] IPR013087	7.4e-06	Zinc finger, C2H2-type/integrase, DNA-binding
Orthology group	MCL34513		Lepidoptera specific

Nucleotide sequence:

>DPOGS203772-TA
ATGGCACAAATACAGATTAAAATAGAGCCTGAAGAAGAAGACGATTCTATGGATGTGGAAGTGAGTTTAAAAATGGAAAATGGAGATGAGAGCCAATCGGCTGTGAGCATTACTTCACAACATTTATTAGAAGAGAATGTAGTTGTGATTAAAGAGGAATTACGAGATAATATAGATGTAAAGATAGAACCTCTAGATATTAAAGATACTAATGAAGAAGATGGGGCTTTAGATGAGAAACAGGGAATATATTACGAAAGTGAACCCGAAGATCTCTCGGTACGGAAGCCCACCGGTTATAGCTCTGGAGATGAAGATAAATCACAAGGTTCTGATCTGGACTACCTCCTGCCACTCGCTGAGGACAAGACAAAGGAACCAAATGTGAAGCCTACGTTCAATGGAAAAATTAGAAAGGACAAGGAACAGAAATATTCAGACGAGATAACGAAACACATAGAGATAGTGACTATAGATGAACCGGCCCGTCAGCTGGAACACCGCGAACTGCTGGCGGGCCGGCTGCACATGAACTACACCTGTGAACCTTGCGCGCTCGGGTTCGTCGTGGAGGAAGCGTACGTCATGCACATGAAAATACACTCGCCGGAGAATGGTCCACATGAGTGCAGTATATGCAAGTCTCGCGTCAAATCCCTGGACGTGTTGTATCGTCACCGACTGCGTCACTACCGCCGCTACCGCTGCGCCATCTGCCGGCTTCAGTTGCGTGATAAAGACACGGTCGCCGCTCACGTCATGAGAGAACACTTGGGATCCGCTTTCCTTTGCACGCATTGCGGCAGAGGGTTCAAACGTCCACAATATCTGAAGCGTCACGTGGAACAGATGCACACTCGCCCGCTCCACCTGGAGTGCCCCGTGTGTCACAGGGTGTTCTACGAGCGAGGCTGGTACAGGTGTCACGTTAGAACCCACAACGAGCAAGTAAAGCAGCGAGCTGATCGTAAAGCGGTGTGTTCGCACTGCGGGCGCGAGTTCAGAAATAAGTCGTATTTGATACGACATCTTCAGACTCACGAGGATCGACGACAGGTGCGGTGTCCGCAGTGCGCGCGCTCATTCAAGAATAATGAGGTGTTGAGAGTTCATAGACGACAGCATCACACCGAGAACCCCTCCAGATACAGCCTCGACAGCGACGGCTTTAAGATTTACCCTTCAACTCTATCGGGACCAGCGAGTACAACCTGCGAGCAATGCGGCCGAGTGCTCACGACACGCGCGATGCTCACGAGACACGTTAACAGGATGCACACGGACAGGACCAAGAAGTTCCAATGTGATTACTGCAAGCGTCACTACTTCTCGAAAGCGGAGGTCCGTTCTCATATCGAGTGGACCCACCTCCAGCAGCGGCGACACGCGTGCACCTGCGGCCGGGTGTTCCGTACACCGGCTCGACTGAGGGCCCACGCGTGCGCCGTACACCTCAGGATACAGCAGCCGAGGGACAAGACGTGCCCCGTCTGCGGCAAGATGTTCGCGAACCAGCAGGTGTTGACGCGTCACATCCGGGGTCACTCCGGAGAGACCTACCCCTGTACGGAGTGCGGGCAGTCCTTCAAAACACAATCCTACGTAAAGATACACTACAAGATAAAACATCTAAATATGACGCGAGCGGAAATTAAGGCTCAGAGCAAAAGGAAACTGATCATGTTGGAGAACGTAGACGAGAGTATGAGCGCCAAGATAAAGAAGAAGAAGAGCCTAAAGAAGGATCCCTTGAATATAGAGGGGGCTGTCAGAATAAAGAAGGAGATAACAGAGCTCACGGTACCTCTATTTGAAACGTTCGTTGATATACAAAGGGAGTATTGA

Protein sequence:

>DPOGS203772-PA
MAQIQIKIEPEEEDDSMDVEVSLKMENGDESQSAVSITSQHLLEENVVVIKEELRDNIDVKIEPLDIKDTNEEDGALDEKQGIYYESEPEDLSVRKPTGYSSGDEDKSQGSDLDYLLPLAEDKTKEPNVKPTFNGKIRKDKEQKYSDEITKHIEIVTIDEPARQLEHRELLAGRLHMNYTCEPCALGFVVEEAYVMHMKIHSPENGPHECSICKSRVKSLDVLYRHRLRHYRRYRCAICRLQLRDKDTVAAHVMREHLGSAFLCTHCGRGFKRPQYLKRHVEQMHTRPLHLECPVCHRVFYERGWYRCHVRTHNEQVKQRADRKAVCSHCGREFRNKSYLIRHLQTHEDRRQVRCPQCARSFKNNEVLRVHRRQHHTENPSRYSLDSDGFKIYPSTLSGPASTTCEQCGRVLTTRAMLTRHVNRMHTDRTKKFQCDYCKRHYFSKAEVRSHIEWTHLQQRRHACTCGRVFRTPARLRAHACAVHLRIQQPRDKTCPVCGKMFANQQVLTRHIRGHSGETYPCTECGQSFKTQSYVKIHYKIKHLNMTRAEIKAQSKRKLIMLENVDESMSAKIKKKKSLKKDPLNIEGAVRIKKEITELTVPLFETFVDIQREY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: