MonarchBase - Protein-coding gene

DPOGS204382
Transcript	DPOGS204382-TA	1725 bp
Protein	DPOGS204382-PA	574 aa
Genomic position	DPSCF300002 - 1735548-1737350
RNAseq coverage	166x (Rank: top 51%)

Annotation
*Heliconius*	HMEL013075	0.0	81.69%
*Bombyx*	BGIBMGA007089-TA	3e-41	31.28%
*Drosophila*	fu2-PA	1e-51	33.24%
EBI UniRef50	UniRef50_D6X448	9e-107	39.61%	Putative uncharacterized protein n=2 Tax=Tribolium castaneum RepID=D6X448_TRICA
NCBI RefSeq	XP_972260.2	2e-107	39.61%	PREDICTED: similar to zinc finger protein [Tribolium castaneum]
NCBI nr blastp	gi\|189241599	3e-106	39.61%	PREDICTED: similar to zinc finger protein [Tribolium castaneum]
NCBI nr blastx	gi\|270000872	5e-111	40.07%	hypothetical protein TcasGA2_TC011130 [Tribolium castaneum]

Group
Gene Ontology	GO:0005634	2.4e-15	nucleus
	GO:0008270	2.4e-15	zinc ion binding
	GO:0003676	6e-12	nucleic acid binding
	GO:0005622	7.3e-06	intracellular
KEGG pathway
InterPro domain	[13-89] IPR012934	2.4e-15	Zinc finger, AD-type
	[282-310] IPR013087	6e-12	Zinc finger, C2H2-type/integrase, DNA-binding
	[263-285] IPR007087	7.3e-06	Zinc finger, C2H2
Orthology group	MCL18273		Insect specific

Nucleotide sequence:

>DPOGS204382-TA
ATGGATGATTCATTTATCGTGGCTAATTTTCATGAGTTATGTCGCCTCTGTTTACGCAAAAGTGAATTCACAATATCAATTTTTGGAGCTGTTCCTGACAATGAAGAAAATATATCTCTAACCTCGAAAATTGCTGAATGTCTCGAGCTGCAGATGGATCCCAATGATGGTCTCCCTACTAGGATCTGCTACAAATGCTTATTTAAGGTTAATAAATGCTCCAAATTTAGATTACAGTGTATTCAGAGTGAGGCCAGATTAAGACAAATAACGAATCGTGTGAATGAGTTAGATAATTCAAACTCATCAGAATTAAGTAATTATAATTTTAACAATACCCCAGAAACATTAAAACCAAAGGCTGAAGATTATATTGTTGAAGATAGTGTCGTGATGGTAGTAGATCCTAGCTTAGACTATGATTCTTCAGAGGAATCTGAGTATATAGATCAGACAGAAACGGAGACTTGTGAAAGAGATAACACACCTGACGGAGAAACAGCTTCGGAATCCTTTTATAAAAATGTATTTATGTGTCAATATTGTGATCAAGCATTTGTGTCTCAAGAAAAGTGCAAAGAACACGAGCAAAGTTTCCATGACCCAAATCTTCCTTATAAATGTGTGGAGTGCAGTCTAGTATTTTCGGAACGCAGTCAATTTGTTGCACACACTAGGCAAGTCCATGGTAATGATAAACCCTATCATTGCCCGGAATGTGACAAATGTTTTGGTAGACGCTCTGATTTAAGGAAACATTCTATAGTTCATACTGGTATAAGACCTTTTCAATGCCATTATTGTCTTAAGAGCTTCTCGAGGAATACAAACTTAAGTAAACATTTAAGAATACATGCAGGACATAAGCCTCATGTATGTCCTTTATGTCCGCGAAGCTTTGTAGCAAAAGGTGATTTACAGAGACATGTACTAGTTCACTCGGGTGTTAAACCTTATGCATGTAGGAAGTGTCCACTCACATTTGGACGAAGAGATAAGCTGATAAAGCATGAAGTCCGTCATGGACCTGTAAGTCCAGAAAATAAAGAATATGAAAATGATGATGCTCATGACATGGTTGTTAATGTAAACCCTTTTAGTAATTTAATGACATCCCCACCTCAGCACAATATTGAAAACACGAATGAATATGATTTGCCAAGGGTTCCGGACCATATTGCCGGTGATAGTACTTTTTTAAATCAAATTCAAAAGAATCCATCCACTTCTAGCAAACCTCAAACAAATTCACCACCTAAACCGAAAATGGCATCACCAAATAAAAATAAACCTAAGAATATAAAATGTCATCAGTGTCCAAAGAGGTTCTCCTCGTTAGATGCATACAAAACTCATGTGTCCATAGCACATATTGGATCTAGGATATTTCAGTGTAAGATATGCTTCAAAAAATTCCCTAGAAAAAGAGAATTTGATCGCCATGTAGCTTCTCATTCTGGTATGAAACCATTTAGTTGCAGTCAATGTGATAAAAAGTTTACGAGGAAAGATAAACTTAACAAGCATGAACAAACTCATGAATGTCTGGTTGTGAATATGCCTTGCATAGAATGTGGAGCAACATTTGAGAAAAAACCTGACCTAGTTGCACACATTAAGTCCCACTTTCCAGAAAATTATGATAACAAAATCCTTAATACTGAAATTAAGAAGGAAAATGTACCCGACTTCCCTTTGGACAATTTTTATGACTTGGAAACCTGA

Protein sequence:

>DPOGS204382-PA
MDDSFIVANFHELCRLCLRKSEFTISIFGAVPDNEENISLTSKIAECLELQMDPNDGLPTRICYKCLFKVNKCSKFRLQCIQSEARLRQITNRVNELDNSNSSELSNYNFNNTPETLKPKAEDYIVEDSVVMVVDPSLDYDSSEESEYIDQTETETCERDNTPDGETASESFYKNVFMCQYCDQAFVSQEKCKEHEQSFHDPNLPYKCVECSLVFSERSQFVAHTRQVHGNDKPYHCPECDKCFGRRSDLRKHSIVHTGIRPFQCHYCLKSFSRNTNLSKHLRIHAGHKPHVCPLCPRSFVAKGDLQRHVLVHSGVKPYACRKCPLTFGRRDKLIKHEVRHGPVSPENKEYENDDAHDMVVNVNPFSNLMTSPPQHNIENTNEYDLPRVPDHIAGDSTFLNQIQKNPSTSSKPQTNSPPKPKMASPNKNKPKNIKCHQCPKRFSSLDAYKTHVSIAHIGSRIFQCKICFKKFPRKREFDRHVASHSGMKPFSCSQCDKKFTRKDKLNKHEQTHECLVVNMPCIECGATFEKKPDLVAHIKSHFPENYDNKILNTEIKKENVPDFPLDNFYDLET-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: