MonarchBase - Protein-coding gene

DPOGS208361
Transcript	DPOGS208361-TA	1986 bp
Protein	DPOGS208361-PA	661 aa
Genomic position	DPSCF300251 + 429355-432182
RNAseq coverage	833x (Rank: top 15%)

Annotation
*Heliconius*	HMEL002758	7e-98	77.57%
*Bombyx*	BGIBMGA009570-TA	2e-128	66.92%
*Drosophila*	CG9915-PB	2e-99	57.27%
EBI UniRef50	UniRef50_Q7QFC0	3e-102	63.27%	AGAP000400-PA n=3 Tax=Anopheles gambiae RepID=Q7QFC0_ANOGA
NCBI RefSeq	XP_002430170.1	2e-116	51.02%	conserved hypothetical protein [Pediculus humanus corporis]
NCBI nr blastp	gi\|242019442	4e-115	51.02%	conserved hypothetical protein [Pediculus humanus corporis]
NCBI nr blastx	gi\|189235381	1e-167	54.53%	PREDICTED: similar to CG9915 CG9915-PB [Tribolium castaneum]

Group
Gene Ontology	GO:0005634	1.8e-17	nucleus
	GO:0003677	1.8e-17	DNA binding
	GO:0006351	1.8e-17	transcription, DNA-dependent
KEGG pathway
InterPro domain	[486-540] IPR017923	1.8e-17	Transcription factor IIS, N-terminal
Orthology group	MCL11525		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS208361-TA
ATGTCTCGCGATGGTTCAGTTCGCTCCAAGTCAGCGTCTCGTTCTCGTTCTCGCTCCAAGTCGTCTTCCCGCTCTCGCTCCAGATCCCACTCGTCCAGGTCAAGGTCGGGCTCCAGATCTCCCAGCGGCTCGCGGAAGTCCCGGTCTCGCAGTAGTTCCCCAAAATCTCCCCGCTCCAGAAGCGGATCGGCTAATTCTAATCGATCTCTGAGCGGATCGAATAAATCCAGATCTAGGAGTGGGTCTCCTAGGAAATCCAAATCGAGGAGTCCTTCGGTCGCGTCCAAGGCTGAATCTAGATCGAGGAGTGGATCGGCACACTCGCGCTCCCGGTCTAGGAGCGGCTCTCCCGCTAAGTCTCGTTCTCGTACCGGTTCCCCTGCAAAGTCTCGGTCGCGCAGTGTGTCGCGTGCCAAGTCGCGATCCCGAAGTCGGTCTGGGAGCGGATCTCCGAGAAAATCGAGATTCAGGAGCGGGACACCCAGGAATTCTAAATCCAAAAGTAGATCGAGGTCAAGGAGTTTATCGAAACGTTCTCGATCGAACAGCGTGTCTCCAGAAAAAGCCAGATCGAGAAGCGGATCCGTCAAATCAGACACAGCTCGAAAATCAAGATCTAAGAGTCCTTCACCGAGTACAGAGTCCAAGAAGAAATCGAGATCTCGCAGCCTTTCACCTCAGAAGGCATCCAGTAAGTCCCCAGACAGTAAACAAAGGAATGAATCTAAACAAATGGAAACCGAGGAAAAGGAGCTTGACAGGCCGGGGTCGGCCGCTGATGTGAGAGCCAGTCGGTCTCGCTCCAGGTCAGTCGGTCGTAAGTCTGGGTCTCGTTCTCGTTCCCGGTCCGGTTCCCGGTCTCGCTCTCACTCCAGATCAAAGTCTCGATCACGCTCACGATCCGGCTCAGCGAAGTCAAGGTCCCGTTCTCGTTCTGGGTCCCGCTCGGGGTCCGGCTCACCGTCTCGTAAAGAACACAAAAAACGACGCACGGTCCGCCTGGCCTCAGACGACGAGAACGAGGGCGTGGCCGAGGGGAGGGAGGAAGAAGAGGTCGGAGAGGGAGTCGTTGAGGAGGAGGAGGGGGAGGACGAGGAGGGAGGGGGAGGTGGCAGAGAACAACACGGACTGTCCGACTTCGAGGCTATGATGCAGAGGAAGAGAGAGGAGCGGCGAGGAAGACGCAGGAGGAGAGACATCGAGATGATCAACGACAACGACGACCTCATAGCGGCGCTCCTCGCGGACATGCGGCGGGCGGCGGACGAGGACCGCGAGCTGAACCGAAGGAATCAGCCCGCCGTGAGGAAGGTGTCCATGCTGAAGAGAGCCGTGTCGCAGCTCATCAAGAGAGACCTGCAGCTGGCTTTCCTGGAGGCCAACGTGCTCAACGTGCTGTGCGACTGGCTGGCGCCGATGCCCAATAGAGCGCTGCCCTGTCTGCTCATCAGGGAGAGCGTGCTGAAGCTGCTCATGGATTTCCCAGCCATCGACAAGTCTCTTCTCAAGCAGTCGGGGATCGGCAAAGCGGTGATGTACCTCTACAAGCATCCCAAGGAAACGAAAGCTAACAAAGAGCGTGCCGGCCGCCTCATATCCGAGTGGGCCCGACCGATATTCAACTTGTCCACAGACTTCAGAGCTATGACACGAGAGGAGCGACAGGCGCGAGACGAGGCCATGTCGGGGAATAGGAGGAGGGAGGAAGCCCCGCCCAGCAAGAGAACCCGCACAGAGGAACCGGAGAGAGCTGTCCGTCCCGGTGAGCCGGGCTGGGTGTCCCGGGCGAGGGTTCCCGCGCCCTCCAACAAGGACTACGTGGTGAGGCCCAAGTCTACCTGCGACCTGGACATGTCCCGGGTCAGCAAGAAGAAGATGACGCGCTACGAGAAGCAGATGAAGAAGTTCCTCGACCAGAAGAGAATGAAGGGAGGGACCAAGAGAGCCGTCGAGATCTCCATAGAGGGGAGGAAGATGGCGCTGTAG

Protein sequence:

>DPOGS208361-PA
MSRDGSVRSKSASRSRSRSKSSSRSRSRSHSSRSRSGSRSPSGSRKSRSRSSSPKSPRSRSGSANSNRSLSGSNKSRSRSGSPRKSKSRSPSVASKAESRSRSGSAHSRSRSRSGSPAKSRSRTGSPAKSRSRSVSRAKSRSRSRSGSGSPRKSRFRSGTPRNSKSKSRSRSRSLSKRSRSNSVSPEKARSRSGSVKSDTARKSRSKSPSPSTESKKKSRSRSLSPQKASSKSPDSKQRNESKQMETEEKELDRPGSAADVRASRSRSRSVGRKSGSRSRSRSGSRSRSHSRSKSRSRSRSGSAKSRSRSRSGSRSGSGSPSRKEHKKRRTVRLASDDENEGVAEGREEEEVGEGVVEEEEGEDEEGGGGGREQHGLSDFEAMMQRKREERRGRRRRRDIEMINDNDDLIAALLADMRRAADEDRELNRRNQPAVRKVSMLKRAVSQLIKRDLQLAFLEANVLNVLCDWLAPMPNRALPCLLIRESVLKLLMDFPAIDKSLLKQSGIGKAVMYLYKHPKETKANKERAGRLISEWARPIFNLSTDFRAMTREERQARDEAMSGNRRREEAPPSKRTRTEEPERAVRPGEPGWVSRARVPAPSNKDYVVRPKSTCDLDMSRVSKKKMTRYEKQMKKFLDQKRMKGGTKRAVEISIEGRKMAL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: