MonarchBase - Protein-coding gene

DPOGS204167
Transcript	DPOGS204167-TA	2655 bp
Protein	DPOGS204167-PA	884 aa
Genomic position	DPSCF300034 - 260165-262977
RNAseq coverage	112x (Rank: top 59%)

Annotation
*Heliconius*	HMEL013965	0.0	85.87%
*Bombyx*	BGIBMGA005083-TA	0.0	75.18%
*Drosophila*	pros-PI	2e-39	38.86%
EBI UniRef50	UniRef50_D6WUC4	2e-134	43.16%	Prospero n=3 Tax=Coelomata RepID=D6WUC4_TRICA
NCBI RefSeq	XP_971664.2	5e-130	42.16%	PREDICTED: similar to homeobox protein prospero/prox-1 [Tribolium castaneum]
NCBI nr blastp	gi\|270011107	8e-134	43.16%	prospero [Tribolium castaneum]
NCBI nr blastx	gi\|270011107	9e-155	44.33%	prospero [Tribolium castaneum]

Group
Gene Ontology	GO:0005634	3.5e-128	nucleus
	GO:0003677	3.5e-128	DNA binding
	GO:0007275	3.5e-128	multicellular organismal development
	GO:0006355	3.5e-128	regulation of transcription, DNA-dependent
KEGG pathway
InterPro domain	[98-829] IPR007738	3.5e-128	Prospero homeobox protein 1
Orthology group	MCL14987		Insect specific

Nucleotide sequence:

>DPOGS204167-TA
ATGTCATCGGAGGAGGAGGCCGACTCACACGCGCCCTACTCGGATAAACTACTGAAGAAACAGAAACGCGTCAGACAGCGCGTGGACGCCGGCGAGCCGCGCAATTCTTATTCTACTCTCGCGACGAACGGACCCGCGCCCGGGCGCGTCGCACACATGAGTGGAGGACTTTACGGGGCCATCTTCGAGGGGCGCCAGCACTTCGGTCTCTTCGGCCCTTGCTACGCTCCGGCTGAAATGTTAAACGAATTATTAGGCCGTGCACCCAGACAAGAGGATGCCGGCGACGAAGCTTCCAGCGGCGATATGCTTCGCGATCGTGTCCTTCGCGACATTCTACAAAGTCGGAAGAAAGAATTGATGCGATTATCGCCTGACAATAACAACGTGCTCGCTAATAATAATAATGATGAACCCAAAGAAGAGAAACGCTCTCCGGAGCGGCCTATCTCCCGCGACTCTCGGCATGATCTCGACGATGCTCTATTGAATCTCGACAGTGCCGGTGACTCGCGGACCTCGCCGCCTCCCGTTTCTCAAAACGAACCACTTCTTGCTCCAAAGTCTGAACCGGAAGACCGCGATAGTGACGCCCAAAGATCTTCCCCGAGACCTCTTGATGTGAAACGTGCTCGTGTAGAAAATATAGTGTCAACGATGCGTGCTAGTCCCGCACCCCAACAGCCACAAGTGAACGGTTGTAAAAAAAGAAAATTATATCACCCGCAACAACACGACGGTGCAGCAGAGCGTTATGGAACAAGCCATGGCAGCAGTGCACAGACAGTGTCGGATGAGTCTGAGGATGACGGTGATCAACCACCGATTCAACAAAAGTTAGTAGAAAAAAATGCATTAAAAACACAACTGAGAACTATGCAGGAACAACTTGCGGAGATGCGAGAGAAATATATACAGCTATGTAACAGAATGGGTCAAGAATCAGAAACGGCTGATAATGATGGTGCTTCTAGTGATATTGAACAAAACGAGGATCCCGTGCCCAAATCGGAACCATCGTCTCCAGTTAAAGAGGTACCTCCTTCAATACCTAATAGTGCAGCGCCGAATATGTTCAACCAAGTCATAAATAATATGATGTCAGGAAAACTGCCGTCACACCCTGCAGCTCATCCTCACTTGCCACCTGGTTTCAATGGAGCACTACCTCTTATGCCCCATATGCAACCTGGTGACCACATGCATCCACCACATACTCATCAACATCTTAATAATGCTGCTGCTATGTACCTTAACGTCAGCCAAAAGCTGTTTTTAGAACAAGAGGCACGAATGAAGGAAGCTAGTGAACAGCAACAAATCAGCCAACAACGAAGGCCACAATCTAATCAGCACTCACCACAACAGAGACAAATGGGTCCAACTCCTAAACCTCCAGCCTCTGAACTGGCCGAGCGTCTTGATGCATTACGAAGCAATTCAGGGTCCGTTGGACCTGTATCTGGTGCTGACCTAGAAGGCTTAGCCGAGGTTCTGAAAAGCGAAATAACAGCTTCTCTAGCAAGCCTCATTGACTCGATAGTAACCCGTTTCGTACATCAACGTCGTATAATGGGGAAGCAATCAGAGGCAGCAGCGGCAGCGGCGAAACAATTGAACAAGGACTTAATTCAAGCTGCTCGTCTCATCGAGAAATCTCCAACGCCAAAGATGCCGGAACGGCCGTCAGGACTCATGCCAGGTAATCCACCCGTCCATCATCCGGGCGCTCCTAATGGCGTACCGCTAATGCCCAATAACCCGATGTTTATGAGTCATATGAACGGCCCCCGTGCGCCGGGCGGAGCAGTGTTTCCTCTGCACGCCGAGGCGGGCGGGCCAGGCCACGGAGCTCACATGCGGCCTCCAACAGGCATGTTCCAGGCACCGCAGAAGTCACTACAGTCGCACTTCGGTTCATTAAATGGACACTTCGATCGAGACCAGAATTCAGACCCGAGTGAGCCCCTGAGCCTTGTGATGACCCCTAAGAAAAAGCGACATAAGGTGACCGACACTCGCATCACTCCTCGCACAGTGAGCAGGATTCTAGGAGAAGGTGTCGTCCAGTCACCGGAGATAAAATTCCCGGAATCGCCGTCACCGCGGCCGTTCCACGGAGGAATGGCGCTGCCGACCTCAGTGGCGATACCGAACCCATCACTACACGAGAGTCAAGTCTTCTCTCCGTATTCACCATTCTTCGGTCCAGGCGGAGGATCGGTTGGATTGGCTCGATCTCCACCGGGACCCGAGCGGGACTCGCCACCGCTGCCAAACTCGATGCTGCACCCCGTCTTGTTAGCGGCAGCTCACCACGGCTCGCCGGACTACATGCGACACCAGCACGTGCCGCATCACGCCGCCGGCCCGCATCACGCGCAGCACATGGACGCGCAGGACCCTCACTCCGACTGCAACTCCACTGAGATGCCTTACGACGGAGTTCAGCCTACTATATCCTTTTCAAATATAACTTATAAATTTATTTCAGCTCAATTTAATATGTATGACTGCGCCACCTACTTCCTACCAGTAGTTGATATTATACGACTGTTGAAACCACACAAGTGTTGCGGTTTCTACGCTTTACCGTACTTGCCTATCGCCTACCTATACATGAAGGAAATAACCGTAAACTTAATTAAACGCTGA

Protein sequence:

>DPOGS204167-PA
MSSEEEADSHAPYSDKLLKKQKRVRQRVDAGEPRNSYSTLATNGPAPGRVAHMSGGLYGAIFEGRQHFGLFGPCYAPAEMLNELLGRAPRQEDAGDEASSGDMLRDRVLRDILQSRKKELMRLSPDNNNVLANNNNDEPKEEKRSPERPISRDSRHDLDDALLNLDSAGDSRTSPPPVSQNEPLLAPKSEPEDRDSDAQRSSPRPLDVKRARVENIVSTMRASPAPQQPQVNGCKKRKLYHPQQHDGAAERYGTSHGSSAQTVSDESEDDGDQPPIQQKLVEKNALKTQLRTMQEQLAEMREKYIQLCNRMGQESETADNDGASSDIEQNEDPVPKSEPSSPVKEVPPSIPNSAAPNMFNQVINNMMSGKLPSHPAAHPHLPPGFNGALPLMPHMQPGDHMHPPHTHQHLNNAAAMYLNVSQKLFLEQEARMKEASEQQQISQQRRPQSNQHSPQQRQMGPTPKPPASELAERLDALRSNSGSVGPVSGADLEGLAEVLKSEITASLASLIDSIVTRFVHQRRIMGKQSEAAAAAAKQLNKDLIQAARLIEKSPTPKMPERPSGLMPGNPPVHHPGAPNGVPLMPNNPMFMSHMNGPRAPGGAVFPLHAEAGGPGHGAHMRPPTGMFQAPQKSLQSHFGSLNGHFDRDQNSDPSEPLSLVMTPKKKRHKVTDTRITPRTVSRILGEGVVQSPEIKFPESPSPRPFHGGMALPTSVAIPNPSLHESQVFSPYSPFFGPGGGSVGLARSPPGPERDSPPLPNSMLHPVLLAAAHHGSPDYMRHQHVPHHAAGPHHAQHMDAQDPHSDCNSTEMPYDGVQPTISFSNITYKFISAQFNMYDCATYFLPVVDIIRLLKPHKCCGFYALPYLPIAYLYMKEITVNLIKR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: