MonarchBase - Protein-coding gene

DPOGS208604
Transcript	DPOGS208604-TA	1740 bp
Protein	DPOGS208604-PA	579 aa
Genomic position	DPSCF300052 - 5558-22449
RNAseq coverage	148x (Rank: top 54%)

Annotation
*Heliconius*	HMEL009227	0.0	86.68%
*Bombyx*	BGIBMGA013385-TA	2e-159	84.17%
*Drosophila*	Lin29-PC	2e-138	61.67%
EBI UniRef50	UniRef50_UPI0002064132	9e-145	72.75%	UPI0002064132 related cluster n=2 Tax=unknown RepID=UPI0002064132
NCBI RefSeq	NP_726568.2	2e-139	63.17%	CG2052, isoform B [Drosophila melanogaster]
NCBI nr blastp	gi\|328786101	3e-144	72.75%	PREDICTED: hypothetical protein LOC100576251 [Apis mellifera]
NCBI nr blastx	gi\|328786101	1e-150	71.03%	PREDICTED: hypothetical protein LOC100576251 [Apis mellifera]

Group
Gene Ontology	GO:0003676	8.2e-14	nucleic acid binding
	GO:0008270	2.2e-05	zinc ion binding
	GO:0005622	2.2e-05	intracellular
KEGG pathway
InterPro domain	[92-126] IPR013087	8.2e-14	Zinc finger, C2H2-type/integrase, DNA-binding
Orthology group	MCL16014		Insect specific

Nucleotide sequence:

>DPOGS208604-TA
ATGAAGTGTGATTTGTGGGGATATAACATGTTCGATAATGCATCAATACTATCACAGATCTTCATGCACAAGAACGCCATGCAAATGCATGCACGCGAGCTGCAGCGCGGCCTCGGTGGTGAGGTGAAGCCGCACCAGTGCCAGCAGTGCTTGAAGTCGTTCAGCTCGAACCACCAGCTCGTCCAGCATATCAGGGTCCACACGGGCGAGAAGCCGTACAAGTGTTCCTATTGTGATCGACGGTTCAAGCAGCTCAGTCACGTTCAGCAGCACACCAGATTACACACAGGGGAGCGTCCGTATAAATGTCATTTGCCTGATTGTGGCCGTGCCTTCATCCAGCTGTCGAACCTCCAGCAGCATCTGAGGAACCATGACGCTCAGGTGGAGAGAGCAAAAAATAGACCATTCCATTGTAATATCTGTGGGAAAGGATTCGCGACTGAGAGCAGCTTGCGTACTCATACAGCCAAGCAACACGCGGCGCTCATGATAGGGGGCGCTACGGCCACCCCGTGTCCTATATGCCATAAAGTTGTTTTCGGGGGCGAAGCCCTAGTAGAACATATGAAGAACACGCATAAGGACCCGAACGCATCCGGTGTTGCGAGTCCGCCGGCCACGTCACCGTATCCTAAACTGGACCCGTATGTAGCGAAGCGGCGTACGGCGAACCACCCGTGTCCTGTCTGCGGGAAGCACTACGTGAACGAGGGTTCGCTGAGGAAGCACCTCGCCTGCCACCCAGAGACACAGCTCACCAGCGGACTGAGGATGTGGCCCTGCTCCGTCTGTCAGGCCGTGTTCACACATGAGAGCGGTCTTCTATCCCATATGGAGCACATGCGGATGGAGCCTAAGCATCAGTTCGCTGCTCAGTACGTGCTGTCACGAGCGGCGGCCGAGAGACGGGAGAGAGACCTCATTGCCGCTGTATCATCAGCTGGGGGCTCTGGACTCTTGAACCTGGCACCCCCATCACCAGCACACTCCGACTCATCATCCAACGGACGGCTCTCATCATCCGCCGGATCTGACGCCGGCGCCGCCGTCAACAAACTATCAGACCTCCTCCGCGCCAACAACGGCCAGTACGGAGACGAGAGGGTCGCGGCCATAGCAGCGGCCGCCGCCAACATGATGAGCCAACCAGGTGAGAGCAACAACGCTGTACAGGTAGCCGCTGCCAATCTAGTAACGGCCATGAGACAACAGCTGGCGAGGGAACCGCAACCGGAAACACCTCCAGCTCAGGCGGAAGCGGCGCTCAGGATACAACAAGCTGAAGCTCTGCTACGGAGTCAGGCGGAAGCGTTACGGTTGGCCGTGTCACAGGCCGCCGCCGCTCATAACACCGAAACACCCAGCCCCTTGCGACATAACGGGGGATTCCCCCAACCGAACGACGCCAGCGGACAACTATCACCTGAATTGGTCGAAGCCTTCAGAATCGCACAGGAACAGAGACTCGAACAAGCGCTGCGACTTCACGACCCGAGAATGTTGGGCTTCAACATACCGTCGCCGGTACAGGCGGCGCAACAAGTCGCCGCTCAGGCTCAGGCTCAAGCCCAAGCCGCCCAAGCCGCCCAAGCCGCTCAAGCCGCTCAGGCAGCGCAGGCCGCTCAACAAGTCGTACAGCAGCAACAAATTCAAGCGGCACAAGCAGCACAAGCGGCACAAGCGGCTCAACAAGCTGCACAACAAGCTGTCCACCTCCAACAGAACCCACAACCATGA

Protein sequence:

>DPOGS208604-PA
MKCDLWGYNMFDNASILSQIFMHKNAMQMHARELQRGLGGEVKPHQCQQCLKSFSSNHQLVQHIRVHTGEKPYKCSYCDRRFKQLSHVQQHTRLHTGERPYKCHLPDCGRAFIQLSNLQQHLRNHDAQVERAKNRPFHCNICGKGFATESSLRTHTAKQHAALMIGGATATPCPICHKVVFGGEALVEHMKNTHKDPNASGVASPPATSPYPKLDPYVAKRRTANHPCPVCGKHYVNEGSLRKHLACHPETQLTSGLRMWPCSVCQAVFTHESGLLSHMEHMRMEPKHQFAAQYVLSRAAAERRERDLIAAVSSAGGSGLLNLAPPSPAHSDSSSNGRLSSSAGSDAGAAVNKLSDLLRANNGQYGDERVAAIAAAAANMMSQPGESNNAVQVAAANLVTAMRQQLAREPQPETPPAQAEAALRIQQAEALLRSQAEALRLAVSQAAAAHNTETPSPLRHNGGFPQPNDASGQLSPELVEAFRIAQEQRLEQALRLHDPRMLGFNIPSPVQAAQQVAAQAQAQAQAAQAAQAAQAAQAAQAAQQVVQQQQIQAAQAAQAAQAAQQAAQQAVHLQQNPQP-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: