MonarchBase - Protein-coding gene

DPOGS202607
Transcript	DPOGS202607-TA	1794 bp
Protein	DPOGS202607-PA	597 aa
Genomic position	DPSCF300140 - 80612-85900
RNAseq coverage	475x (Rank: top 26%)

Annotation
*Heliconius*	HMEL010437	0.0	79.53%
*Bombyx*	BGIBMGA012517-TA	0.0	76.07%
*Drosophila*	mamo-PG	9e-56	84.87%
EBI UniRef50	UniRef50_UPI0002063B44	2e-70	61.04%	UPI0002063B44 related cluster n=2 Tax=unknown RepID=UPI0002063B44
NCBI RefSeq	XP_971723.2	1e-80	58.39%	PREDICTED: similar to CG34346 CG34346-PC [Tribolium castaneum]
NCBI nr blastp	gi\|383859047	3e-131	49.67%	PREDICTED: uncharacterized protein LOC100879930 [Megachile rotundata]
NCBI nr blastx	gi\|345481332	3e-149	49.18%	PREDICTED: hypothetical protein LOC100119619 isoform 2 [Nasonia vitripennis]

Group
Gene Ontology	GO:0005515	5.9e-24	protein binding
	GO:0003676	7.2e-11	nucleic acid binding
KEGG pathway
InterPro domain	[3-118] IPR011333	8.6e-30	BTB/POZ fold
	[21-118] IPR013069	5.9e-24	BTB/POZ
	[31-127] IPR000210	7.8e-20	BTB/POZ-like
	[544-574] IPR013087	7.2e-11	Zinc finger, C2H2-type/integrase, DNA-binding
Orthology group	MCL15210		Insect specific

Nucleotide sequence:

>DPOGS202607-TA
ATGGGAAGTGAGCACTATTGCCTGAGGTGGAACAATCATCAGAGCAACTTGCTCGGCGTTTTCAGCCAACTGTTGCACGACGAGAGCTTGGTGGACGTCACGCTCGCGTGTTCCGAAGGCGCCTCCATAAGGGCTCATAAGGTCGTTTTATCAGCGTGTTCATCCTACTTCCGTTCGCTGTTCGTGGACCATCCCTCACGCCATCCCATAGTGATCCTCAAAGACGTGGGTTTGGAGGAGCTCAGAACACTTGTCGACTTCATGTACAAGGGTGAGGTCAACGTCCAATACTGCCAACTACCTGCGCTCCTGAAAACTGCTGAGAGCCTGCAGGTCAAAGGATTAGCTGAAATGACGACGCTAAGTGCAGCCGGTATTGATACAAGAAACGTTCCAGAACCAATGGATGAATGTCAACAGAGAGATACAAGAGAATGCGCTGAGTCGCATGAGACGTTAGACGATCAGGAAGAACGAAGAGAGGCAAAGGAATTCCGTGAGCTACGTGAAAGGGAGTCCAAAGACAACAGGGAAAGCCATAGAGAAATTCGCGATTCGCGAGAGTTGCGAGAGCACAGAGAAAGGGAACGAGACAGAGAATCTCGAGAGTTGATTCGGGAAATAAGAGACCCCCGAGACCCTTGTAGGGATCATAGAGAATTGCGCGAAGTAAAAGATAGCAGAGATCCTCGTGATTTACGAGATACTAGGGATCCCAGAGAGCTCAGAGATTCTCTTGACCCACGAGAGGCAACAGAAGCCTCTCCTCCCAGAATATCCCCATTATTATCTGTACGACGATTTAGGCCCGATATTTCAATTGATACACCAACTTTGACGCATCCACCGATACCTAAAGACGAGCCTCCTGACGAACCCATACGTCCAACGTCACCGGAAGACGACACAATATCAATAAGATCAAATGGAGCAAGTGAGAATATGGGTATAAATATGACCATAAACAGTCATGGCATGGGACCAAGATACTCTCCAGTTGAACAAAGGCTGAGTGTTTTGAACACCTTGCCACATCCCGGCTTGACTCATCCATCCCACAGCTCGTTATCCAGTCCAAGAAATGAACCTATAGCTGGACCATCTGGTTTGCCACCAGTACAACAAGTTCCTTTGTCACTAAAGAAAGAAGCGGATTGGGATAGGGGTAACGATGAAAAGGTTGGGGAGACAGACTACCGTATGCCACATGAATCGGAGTACGAAGGGTCCGGTAGGGGGAGAATTGAGGAGGGGGAAAGGGCATATCCTTGCATACATTGTGGAGCAGCATTCCCACACCAGAGCAAACTAACGAGGCACATACTGACCACGCATACCCTCGACACTCTAAAGTATCGGGACGCCATATTGGGCCGGCCGTTGGGTTTGCCCATGATAGGACAATTCAGTGAACCGACTTACATGATGCCCACTGAAGAATCGCCCCTAGATCTGGACATCGGCCCAGTTGAGCCGGGCAACGTAGTGTTGTGCAAATTCTGCGGCAAGAGTTTCCCTGATGTATCATCGTTAATAGCCCACTTACCGGTTCATACGGGCGACCGACCTTTCAAATGTGAATTTTGTGGCAAGGCGTTCAAACTACGACATCATATGAAAGACCACTGTAGAGTCCACACAGGCGAACGACCGTTTCGTTGTGTTCTATGTGGTAAAACATTCTCACGATCAACTATACTGAAAGCACACGAGAAAACTCACTATCCCAAGTACGCGAGGAAATTCCTCTCGCCGAGTCCCGTCGACACCGAGGAAGAGAGTCCACATCAATGA

Protein sequence:

>DPOGS202607-PA
MGSEHYCLRWNNHQSNLLGVFSQLLHDESLVDVTLACSEGASIRAHKVVLSACSSYFRSLFVDHPSRHPIVILKDVGLEELRTLVDFMYKGEVNVQYCQLPALLKTAESLQVKGLAEMTTLSAAGIDTRNVPEPMDECQQRDTRECAESHETLDDQEERREAKEFRELRERESKDNRESHREIRDSRELREHRERERDRESRELIREIRDPRDPCRDHRELREVKDSRDPRDLRDTRDPRELRDSLDPREATEASPPRISPLLSVRRFRPDISIDTPTLTHPPIPKDEPPDEPIRPTSPEDDTISIRSNGASENMGINMTINSHGMGPRYSPVEQRLSVLNTLPHPGLTHPSHSSLSSPRNEPIAGPSGLPPVQQVPLSLKKEADWDRGNDEKVGETDYRMPHESEYEGSGRGRIEEGERAYPCIHCGAAFPHQSKLTRHILTTHTLDTLKYRDAILGRPLGLPMIGQFSEPTYMMPTEESPLDLDIGPVEPGNVVLCKFCGKSFPDVSSLIAHLPVHTGDRPFKCEFCGKAFKLRHHMKDHCRVHTGERPFRCVLCGKTFSRSTILKAHEKTHYPKYARKFLSPSPVDTEEESPHQ-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: