MonarchBase - Protein-coding gene

DPOGS211117
Transcript	DPOGS211117-TA	1473 bp
Protein	DPOGS211117-PA	490 aa
Genomic position	DPSCF300007 - 552675-576620
RNAseq coverage	80x (Rank: top 64%)

Annotation
*Heliconius*	HMEL012427	2e-165	90.09%
*Bombyx*	BGIBMGA002994-TA	2e-83	98.62%
*Drosophila*	mid-PA	3e-93	48.65%
EBI UniRef50	UniRef50_UPI00022CA4A6	5e-100	78.34%	UPI00022CA4A6 related cluster n=1 Tax=unknown RepID=UPI00022CA4A6
NCBI RefSeq	XP_972626.1	9e-158	63.14%	PREDICTED: similar to T-box transcription factor TBX20 [Tribolium castaneum]
NCBI nr blastp	gi\|91082917	2e-156	63.14%	PREDICTED: similar to T-box transcription factor TBX20 [Tribolium castaneum]
NCBI nr blastx	gi\|91082917	2e-154	63.14%	PREDICTED: similar to T-box transcription factor TBX20 [Tribolium castaneum]

Group
Gene Ontology	GO:0005634	1.5e-157	nucleus
	GO:0006355	1.5e-157	regulation of transcription, DNA-dependent
	GO:0003700	1.5e-157	sequence-specific DNA binding transcription factor activity
KEGG pathway
InterPro domain	[39-488] IPR001699	1.5e-157	Transcription factor, T-box
	[124-315] IPR008967	4.9e-69	p53-like transcription factor, DNA-binding
Orthology group	MCL10344		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS211117-TA
ATGCTGCTGCAGGGCCGGGAAGGCTTCGAAGGCCGGGGGCCTGCCATGGAGGATGAGTGCTCGGCGAGGCCCTGCGCCACTGACTTCTCCATCGCCGCCATAATGGCCAGGGACCGGCAGGAGCGGAGGGAGCGCCGAAGACACAGAGACCCCAGAGAAGATACACTTACACCATTAGAAAAGTTTGTGGACGCTACTGCATCCGCTGCGGAGTCTCCGTCTCCACCTCTGGAATATGAACGGGATTCCCCCGTGGACGTCTCCTCAACCTCAGAGGCTGGTTCAGCTGGAGCGCCCAGCGGTTCCAGAGCTCTCTCCCCCCCAAGAAACCCTCAGCTGGCTGAACGATGGTCCAGCGAGGAAATGAGGCACATACAGTGCCATCTCGAAACTAAAGAACTGTGGGACAAATTCAACGAACTAGGAACGGAAATGATCATCACAAAAACAGGAAGACGAATGTTCCCGACGGTGCGAGTGTCTTTCGCGGGATGCCGAGCCGAGGCTCGTTACGCCGTATTGCTGGACGTGGTGCCGGTGGACGGCAAGCGTTACCGATACGCTTACCACCGCTCTTCCTGGCTGGTGGCCGGCAAGGCAGACCCTCCCGCGCCAGCGAGGCTCTACCCTCACCCTGACTCACCCTTCTCCGGGGACCAACTTCGCAAGCAGGTCGTCTCCTTTGAGAAGGTCAAACTCACGAACAACGAAATGGACAAAAATGGACAGCTGGTCCTTAATTCAATGCATAAGTATCAACCCCGAATCCATCTGGTATTGCGAAGAGAAGGAGCTATCAACGCACCGATCACAGACCTTGAGCAAGAGGAGTTTAAGACGTTCATATTTCCTGAATGCGTCTTCACCGCAGTCACGGCCTACCAGAACCAACTTATAACCAAACTTAAAATCGACAGTAATCCGTTCGCAAAGGGATTCCGCGATTCTTCACGTCTGACGGAATTTGAGAGATTCTATATCACGGGGGAGCACGAAAGAACATCAGTCTTCCCCGATGACGCGCGCCTCGGTGCCGCCCATCCTAGAGAGACGATGGAGTCGATGCTGGCTGAGCAGCATTATTTACGGTCACCTCTTAGACCGTTCGATCTGGATCAGCACAACAACAATCTGACGCTGGAAGAGAAAGCGATTTTGGCGGCCAGGTCACAGTTGTTCTTGCGAGCAGCGTATCCTCTGTACGGTGTACCAGCAGCAGCGTTGTGGGGTCAATGGGCGTGTCTGGCGCCACAATTACTGGCACAACAGCATCTAGCTTCAGGGTCTGGGCTACAGTTGCCTCGGCCAGTATACCCGGGTGGTGTGCCAGCATCACTCTCGCAGCATCGCTTCTCCCCCTACCCCGCCCGCCGTTCCTCACCGGGTTCCTCACCAGACTCCCTCCGCGCGAGTCCCCACTCCTTGCCCCCGCCCGCACCGCACACACCTCACGCACCCCACAGCCCGACCTAG

Protein sequence:

>DPOGS211117-PA
MLLQGREGFEGRGPAMEDECSARPCATDFSIAAIMARDRQERRERRRHRDPREDTLTPLEKFVDATASAAESPSPPLEYERDSPVDVSSTSEAGSAGAPSGSRALSPPRNPQLAERWSSEEMRHIQCHLETKELWDKFNELGTEMIITKTGRRMFPTVRVSFAGCRAEARYAVLLDVVPVDGKRYRYAYHRSSWLVAGKADPPAPARLYPHPDSPFSGDQLRKQVVSFEKVKLTNNEMDKNGQLVLNSMHKYQPRIHLVLRREGAINAPITDLEQEEFKTFIFPECVFTAVTAYQNQLITKLKIDSNPFAKGFRDSSRLTEFERFYITGEHERTSVFPDDARLGAAHPRETMESMLAEQHYLRSPLRPFDLDQHNNNLTLEEKAILAARSQLFLRAAYPLYGVPAAALWGQWACLAPQLLAQQHLASGSGLQLPRPVYPGGVPASLSQHRFSPYPARRSSPGSSPDSLRASPHSLPPPAPHTPHAPHSPT-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: