MonarchBase - Protein-coding gene

DPOGS208840
Transcript	DPOGS208840-TA	1122 bp
Protein	DPOGS208840-PA	373 aa
Genomic position	DPSCF300036 + 811730-814745
RNAseq coverage	1691x (Rank: top 8%)

Annotation
*Heliconius*	HMEL015430	7e-167	89.66%
*Bombyx*	BGIBMGA007946-TA	0.0	83.89%
*Drosophila*	exd-PA	1e-179	86.28%
EBI UniRef50	UniRef50_P40426	1e-135	71.15%	Pre-B-cell leukemia transcription factor 3 n=276 Tax=Metazoa RepID=PBX3_HUMAN
NCBI RefSeq	XP_002100763.1	8e-180	86.51%	GE17244 [Drosophila yakuba]
NCBI nr blastp	gi\|195479102	2e-178	86.51%	GE17244 [Drosophila yakuba]
NCBI nr blastx	gi\|195479102	4e-178	86.77%	GE17244 [Drosophila yakuba]

Group
Gene Ontology	GO:0005634	7.6e-102	nucleus
	GO:0003700	7.6e-102	sequence-specific DNA binding transcription factor activity
	GO:0003677	3.2e-29	DNA binding
	GO:0006355	3.2e-29	regulation of transcription, DNA-dependent
	GO:0005515	1.4e-19	protein binding
	GO:0043565	5.7e-19	sequence-specific DNA binding
KEGG pathway
InterPro domain	[36-234] IPR005542	7.6e-102	PBX
	[235-305] IPR012287	3.2e-29	Homeodomain-related
	[219-295] IPR009057	1.4e-19	Homeodomain-like
	[236-295] IPR001356	5.7e-19	Homeobox
Orthology group	MCL11422		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS208840-TA
ATGGACGATCCGAATAGAATGATGGCGCACAGCGGTGGTCTCATGGGACCCCAAGGCTATGGTCTTCCTGGCGGCGATGGGGCGCCCGCCACTGGTGAAGGCGAAGCCCGAAAACAAGACATCGGGGAAATTTTACAACAAATCATGAATATTACCGATCAAAGTCTCGATGAGGCTCAAGCAAGAAAACATACACTGAATTGCCACAGAATGAAACCTGCACTTTTCTCTGTATTGTGTGAAATTAAAGAAAAAACAGTTTTGTCTCTTCGCAACACGCAAGAGGAGGAGCCCCCAGATCCGCAACTTATGCGTTTAGACAACATGCTGATTGCTGAAGGGGTAGCGGGTCCGGAGAAAGGTGGCGGTGCTGGTGCTGCTGCCTCGGCATCAGCGGCCGCGGGAGAGTGGGGCAGTGTGGCTCAAGCAGATAACGCGATCGAGCACTCGGACTACCGCGCGAAGCTGGCCCAGATCAGACAGATCTATCACCAGGAACTGGACAAGTACGAGAACGCCTGCAACGAGTTCACCACACACGTCATGAACCTGTTACGAGAGCAGAGCCGCACCAGACCCATCACTCCCAAGGAAATAGAGCGCATGGTGCAGATCATACACAAGAAGTTCAGTTCCATTCAGATGCAGCTGAAGCAGTCCACCTGCGAGGCCGTCATGATCCTGCGTTCTCGTTTCCTGGACGCTCGCAGAAAGCGGCGCAACTTCAGCAAGCAGGCGTCCGAGATCCTGAACGAGTACTTCTACTCGCACCTGTCCAACCCCTACCCCAGCGAGGAGGCCAAGGAGGAGCTGGCGCGCAAGTGCGGCATCACCGTCTCCCAGGTGTCCAACTGGTTCGGCAATAAACGTATTCGCTACAAGAAGAACATCGGCAAGGCGCAGGAGGAGGCGAACCTGTACGCCGCCAAGAAAGCCGCTGCAGCGGGGGCGTCACCGTACTCGATGGGCGCCGCGTCGGGGACGGCCACCCCCATGATGTCTCCGGCGCCCACGCAGGACTCCATGGGGTACGCCCTGCCGGCGGCCGGCTACGACCAGCCTCAACCACCATACGACACCTCCATGTCCTACGACCCCATGCATCAGGACCTGTCGCCTTAG

Protein sequence:

>DPOGS208840-PA
MDDPNRMMAHSGGLMGPQGYGLPGGDGAPATGEGEARKQDIGEILQQIMNITDQSLDEAQARKHTLNCHRMKPALFSVLCEIKEKTVLSLRNTQEEEPPDPQLMRLDNMLIAEGVAGPEKGGGAGAAASASAAAGEWGSVAQADNAIEHSDYRAKLAQIRQIYHQELDKYENACNEFTTHVMNLLREQSRTRPITPKEIERMVQIIHKKFSSIQMQLKQSTCEAVMILRSRFLDARRKRRNFSKQASEILNEYFYSHLSNPYPSEEAKEELARKCGITVSQVSNWFGNKRIRYKKNIGKAQEEANLYAAKKAAAAGASPYSMGAASGTATPMMSPAPTQDSMGYALPAAGYDQPQPPYDTSMSYDPMHQDLSP-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: