MonarchBase - Protein-coding gene

DPOGS210071
Transcript	DPOGS210071-TA	2121 bp
Protein	DPOGS210071-PA	706 aa
Genomic position	DPSCF300017 - 534931-547303
RNAseq coverage	372x (Rank: top 32%)

Annotation
*Heliconius*	HMEL015479	7e-81	61.46%
*Bombyx*	BGIBMGA012712-TA	0.0	65.11%
*Drosophila*	Rfx-PE	1e-77	45.75%
EBI UniRef50	UniRef50_F4X7G1	1e-118	48.22%	Transcription factor RFX3 n=10 Tax=Coelomata RepID=F4X7G1_ACREC
NCBI RefSeq	XP_975182.2	1e-123	41.43%	PREDICTED: similar to GA19507-PA [Tribolium castaneum]
NCBI nr blastp	gi\|189241300	3e-122	41.43%	PREDICTED: similar to GA19507-PA [Tribolium castaneum]
NCBI nr blastx	gi\|270013165	6e-117	40.86%	hypothetical protein TcasGA2_TC011734 [Tribolium castaneum]

Group
Gene Ontology	GO:0003677	2.2e-28	DNA binding
	GO:0006355	2.2e-28	regulation of transcription, DNA-dependent
KEGG pathway
InterPro domain	[208-282] IPR011991	3.1e-36	Winged helix-turn-helix transcription repressor DNA-binding
	[208-273] IPR003150	2.2e-28	DNA-binding RFX
Orthology group	MCL10717		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS210071-TA
ATGTCGGAGATGGGATTTGAGAACGTTTTCTACTTGGAGAGTGAGTATTGTGGGATGAGGGATGGTGTTGCCAGGTTACACTCCCCAGATTTTGAGTGCGCGGGCGACGAAGTGTTGGTGGAGTCGTCTCCGCCCGCTTCACCAGTCATGGCGGCGCGACTAGCGGCGCCCTCACAGGGCTCGGGCGCGGGCGGCGCCTCGCCGGACGCTGTGCGTGAGTTGATCGTTATACCGGAGCTCCCTAATTCAATCCACCTGCAACACGCCATACAGCAGGTGTCGAGTACGGTGGTAGAAGTCAACGGAGACAGTTCAGGACACTCCAGTCCCACGACGGAGGCACAGCACACATACATCGTCACAAGCGAGGGCGGGAACGGCGTCAACTATCACGTCCAGTATGTGGAGCCGCAGGAGATATACGCACAGACAGGACATCAGACACATATGGAGACCCTCCGCTCATATCCCGTGTACGGCGTGGCGAGCGTGCCCGCGGACGGCGCGGTGACGGCCGTGACCGCGGTCACAGCGGTCACCGCCTCCGATGACACCTGGCCGGCTGAGTTCACCTTCGAACAACCGGCCTCGCCAGCACCGGCAGCTCGTATGCCGCCGGCCACCGTGCAGTGGCTGCTGGATCACTACGAGACGGCCGAAGGTGTGTCTCTCCCGCGTTCGACGCTGTACGCCCATTACCTCCGTCACTGTTCCACACATCGCCTGGAGCCGGTGAACGCGGCGTCTTTCGGGAAGCTCATCAGATCGGTGTTCGTGGGTCTGAGGACCCGCCGGCTCGGGACCCGGGGAAACTCCAAGTATCACTACTACGGCATCAGGGCGAAGCATTCCGCGCCCCGAGACCTGCCGCCCACCGTACAGAAGATAGACGAGGAACCGCACTCGTCAGACGAATCCCGTCCCCGTGAGCCGGAGAGTCCCGTGGGTCTGTCTGGTATCGCTCACAGACAGTACTTGGGCTCGGTGAGCGCCCCTGACCCGCCGCCGCTGCAGCTAGACGACCCACCGCCAGACGTGACGCCTGAAGCGATGCAGCAGTTCAGGGATCACCACAGGCAACACGGGGTGGAGTTCCTCGAGGCCGTGGCGTCCCTGGACACGGGAGCTGCGGAGCGCTCTCGTCGGTGGTTCTGGAGGCGCGTGGGCAGGAGCGGGGCCCGCCTGGCCGGTCGCAGGGACGTGTGCACCTGGCTCAGGAGGGCCGAGCTCGAGCTGCACCAGCGAGCCGTGGACCTCCTGCTGCCCGACGTACTCAGGCCCATACCCTCACAACTCACACAGGCCATCCGTAACTTCGCCAAGAGCCTGGAGGGCGCGCTGTCGTCGGGGTCCTCCGGAGCCCCGGCCCCAGCGGCGCGCGCTCAGGCGTTGGCTGCGGGGGCTCTGTCGGCCGCCCTCAGGCGCTACACCTCCCTCAACCACCTGGCGCAGGCCGCGCGGGCCGTCCTCAACAACCACCATCAGATCCAGCAGATGTTGTCGGACCTGAACCGCGTGGACTTCCGCGTGGTGCGCGAGCAGGCGGCCTGGGCCTGCGCCTGTGGCAGTGCGGCCACCGCGCACCGCCTCGAGGCTGACTTTAAAGCCCGCCTCGGTCGCGGGTCGTCGCTGGAGTCGTGGGCGTCGTGGCTGGAGAGCTGCGTCCGCGCCGCGTTGGCCCCGCACGAGCGCCGCGCCGACTACACGCCGCGTGCGCGACGACTGCTGCTCGACTGGTCCTTCTACTCCTCGCTCGTCATCAGGGAACTCACGCTCAGGTCGGCGGCGTCGTTCGGGTCGTTCCACTTGATCCGCCTGCTGTACGACGAGTACGTCTCCTTCCTCATAGAGCGGCGCGTGGCCGAGCACCGCCAGGAGCCGCCCATAGCTGTGATGCAGCGAGCGATGGATGACGACGATGAACTGCCGGAGGAGGTTCCCCGCGACGACGACGACATGAACGGAGAGATGGTGGACGAGGGGCTCGACCACGGGGAGGGAGAGGGGGACGGAGACGGCGAGGGGAACGGAGAGGAGGGGGAGGGGGAGTGGGAGTGGGAGGACGACGACGACGAGCACGAGGAGAGGGAGCAGAAGAGGGCCCGCCTGGACCGAGGCTAA

Protein sequence:

>DPOGS210071-PA
MSEMGFENVFYLESEYCGMRDGVARLHSPDFECAGDEVLVESSPPASPVMAARLAAPSQGSGAGGASPDAVRELIVIPELPNSIHLQHAIQQVSSTVVEVNGDSSGHSSPTTEAQHTYIVTSEGGNGVNYHVQYVEPQEIYAQTGHQTHMETLRSYPVYGVASVPADGAVTAVTAVTAVTASDDTWPAEFTFEQPASPAPAARMPPATVQWLLDHYETAEGVSLPRSTLYAHYLRHCSTHRLEPVNAASFGKLIRSVFVGLRTRRLGTRGNSKYHYYGIRAKHSAPRDLPPTVQKIDEEPHSSDESRPREPESPVGLSGIAHRQYLGSVSAPDPPPLQLDDPPPDVTPEAMQQFRDHHRQHGVEFLEAVASLDTGAAERSRRWFWRRVGRSGARLAGRRDVCTWLRRAELELHQRAVDLLLPDVLRPIPSQLTQAIRNFAKSLEGALSSGSSGAPAPAARAQALAAGALSAALRRYTSLNHLAQAARAVLNNHHQIQQMLSDLNRVDFRVVREQAAWACACGSAATAHRLEADFKARLGRGSSLESWASWLESCVRAALAPHERRADYTPRARRLLLDWSFYSSLVIRELTLRSAASFGSFHLIRLLYDEYVSFLIERRVAEHRQEPPIAVMQRAMDDDDELPEEVPRDDDDMNGEMVDEGLDHGEGEGDGDGEGNGEEGEGEWEWEDDDDEHEEREQKRARLDRG-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: