MonarchBase - Protein-coding gene

DPOGS204102
Transcript	DPOGS204102-TA	1521 bp
Protein	DPOGS204102-PA	506 aa
Genomic position	DPSCF300184 - 274907-278795
RNAseq coverage	124x (Rank: top 57%)

Annotation
*Heliconius*	HMEL012927	0.0	63.93%
*Bombyx*	BGIBMGA013591-TA	4e-118	50.10%
*Drosophila*	CG42726-PA	4e-34	26.54%
EBI UniRef50	UniRef50_D6WCR3	2e-49	34.86%	Putative uncharacterized protein n=1 Tax=Tribolium castaneum RepID=D6WCR3_TRICA
NCBI RefSeq	XP_002734413.1	2e-33	32.88%	PREDICTED: zinc finger protein 111-like [Saccoglossus kowalevskii]
NCBI nr blastp	gi\|270002410	7e-49	34.86%	hypothetical protein TcasGA2_TC004467 [Tribolium castaneum]
NCBI nr blastx	gi\|270002410	1e-55	34.05%	hypothetical protein TcasGA2_TC004467 [Tribolium castaneum]

Group
Gene Ontology	GO:0003676	1.5e-11	nucleic acid binding
KEGG pathway
InterPro domain	[218-248] IPR013087	1.5e-11	Zinc finger, C2H2-type/integrase, DNA-binding
Orthology group	MCL19619		Insect specific

Nucleotide sequence:

>DPOGS204102-TA
ATGAATACCCAAGTTTGTGTAAATTGTTACAATAAAAAGGCTGTTAATTCGACGGACAACCGTTTAGTAACGGAGAGTTGCGGTCATGTTAAGTGTATGGATTGTCTTCTGCAAGAAAAATCAGGTTGTGTCGCCTGTAAGCAGAACGTTAGTGAGCCTGAAACAATCGAGAGTTCAGAACAGAATCCTCCGCTGACGCCGGTTGAAAGCTACGAAGAACCAGCAGCCTGTGAAGATGCTTCTAACGAGGATAACGCAAACATTGTAGACCCCAATTCTAAGAAAAAATTAGAAATCTCTCACATTAGGATAGAAATGGATGGTGATAGAAAGTGTTATACATGTACAGTGTGCAAGAAAAAATTTTATGCTCGAAGCCAGGTGTCATATCATGCTTACTGCAACGGTCAGAAAAAACCATACAATTGTCAACTTTGTAAGCAGAGCTTTGCATCCCTATCACATTATAAATACCACACTCGAGTGCACAGCCAGGAACGTTCTTATGGCTGTGATGTATGCGGAGCAGGCTTCTATCAGATGTCAAAGCTGAAGAGGCACAAGTTGAAACATACCAAAGAGAAGAATTTCTCGTGCAGTGAGTGCAATAAAGCATTCAACAACATGTCCTCGCTGAGAAAACATGCTCGAACACACACCGAGGAACGACCGTACTCGTGTAACACATGCGGCAGGCGATTCAGAGACAGCTCCAACTATAAGAAACATGTCGATAAACACAAGAAACCATGCAAGTCGTGTGGAATGGAGCTTCAGGCGTCTGGTGTGCATCGCTGCGAAGGTCCTGGTAGTGGCAGTCCTGGTGGTAGGGGGAATGGTGGTGGGCCCACCACGGGGGGGCCTCGCGCTCACGCCTGCCCCCGCTGCAGGAAGGCCTTCCACTCCCGGAAGGACATGAGACGCCACGCAGCCATTCACTCAGATTCTAAACCGTTCCGCTGCAAAGCCTGCCCTGACGAACGACGTTTCAGACGCAAAGATAATTTAGAGCGGCACATCCGCAATGCACACCCCAACTGCGCACCCGCCACAGCTCTGGAATGCGATCTGACCGCCCTCCAGAGCGTAGCCCACCACGCCTATGAAATACACGAGAAGATACGCCTAGAAATTCTCAACCCATTACCGCCTCTACCTCAGGAAGTCATCCAGAAACACATAGACGTCGAGGTCGTTGACAAAAAGTCGATCATAGAGGCGAACAACGCCAGGGAGAGCGTCATAGTCGAGAAGAAACCCGAGGAGAAGAAGGTCGTTACTCCAGAGAACGAATATGTCCATAAAATAAGGAAAGCCATAATACCTCTACCGCCCATAGACCAGGAGAAGTTCAGGAGCGTTCAGAGAGGATTGTTACCGGACAGCGTGGCCGCAGCACCCATCAAGAATATGGAGATATACAAGAAGATACTGTACGAGAAGATAGAGAAGGACTCGGCCGAGGTCATACAGAACCCCAAGATGCATTGGAGGAGGAAGATGGAACAGGATAGCAATTAG

Protein sequence:

>DPOGS204102-PA
MNTQVCVNCYNKKAVNSTDNRLVTESCGHVKCMDCLLQEKSGCVACKQNVSEPETIESSEQNPPLTPVESYEEPAACEDASNEDNANIVDPNSKKKLEISHIRIEMDGDRKCYTCTVCKKKFYARSQVSYHAYCNGQKKPYNCQLCKQSFASLSHYKYHTRVHSQERSYGCDVCGAGFYQMSKLKRHKLKHTKEKNFSCSECNKAFNNMSSLRKHARTHTEERPYSCNTCGRRFRDSSNYKKHVDKHKKPCKSCGMELQASGVHRCEGPGSGSPGGRGNGGGPTTGGPRAHACPRCRKAFHSRKDMRRHAAIHSDSKPFRCKACPDERRFRRKDNLERHIRNAHPNCAPATALECDLTALQSVAHHAYEIHEKIRLEILNPLPPLPQEVIQKHIDVEVVDKKSIIEANNARESVIVEKKPEEKKVVTPENEYVHKIRKAIIPLPPIDQEKFRSVQRGLLPDSVAAAPIKNMEIYKKILYEKIEKDSAEVIQNPKMHWRRKMEQDSN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: