MonarchBase - Protein-coding gene

DPOGS203877
Transcript	DPOGS203877-TA	1506 bp
Protein	DPOGS203877-PA	501 aa
Genomic position	DPSCF300402 - 38435-45742
RNAseq coverage	26x (Rank: top 77%)

Annotation
*Heliconius*	HMEL008134	0.0	81.99%
*Bombyx*	BGIBMGA003821-TA	7e-107	92.50%
*Drosophila*	sim-PA	5e-150	71.39%
EBI UniRef50	UniRef50_Q7QE88	3e-158	69.48%	AGAP000773-PA n=22 Tax=Bilateria RepID=Q7QE88_ANOGA
NCBI RefSeq	XP_967930.2	2e-170	61.24%	PREDICTED: similar to Single minded [Tribolium castaneum]
NCBI nr blastp	gi\|189241710	3e-169	61.24%	PREDICTED: similar to Single minded [Tribolium castaneum]
NCBI nr blastx	gi\|189241710	1e-173	62.52%	PREDICTED: similar to Single minded [Tribolium castaneum]

Group
Gene Ontology	GO:0005515	6.2e-18	protein binding
	GO:0007165	2e-13	signal transduction
	GO:0004871	2e-13	signal transducer activity
	GO:0006355	8.3e-12	regulation of transcription, DNA-dependent
	GO:0005634	5.5e-07	nucleus
	GO:0003700	5.5e-07	sequence-specific DNA binding transcription factor activity
KEGG pathway
InterPro domain	[251-337] IPR013655	6.2e-18	PAS fold-3
	[80-146] IPR000014	2e-13	PAS
	[82-142] IPR013767	8.3e-12	PAS fold
	[15-30] IPR001067	5.5e-07	Nuclear translocator
	[2-58] IPR011598	4.2e-06	Helix-loop-helix DNA-binding
Orthology group	MCL10938		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS203877-TA
ATGAAGGAGAAGAGCAAGAACGCGGCACGTTCGAGGAGGGAGAAGGAAAACGCTGAGTTCCTCGAACTAGCTAAACTGTTACCACTACCATCAGCCATCACCTCACAGCTGGACAAGGCGTCGGTGATACGGCTCACCACAAGTTACCTGAAGATGAGGCAGGTCTTCCCTGATGGTCTGGGAGACGCCTGGGGCGCCGCCCCTCCTCCACCACAGCCCAGGGAACTCTCAATACGAGAGCTGGGATCCCATCTCCTGCAGACCCTCGATGGGTTTATATTCGTGGTGTCACCAGATGGAAAGATTATGTACATAAGTGAGACGGCGTCCGTTCATCTCGGACTTAGTCAGGTGGAATTGACCGGGAACTCTATATACGAGTACATCCACCAAGCTGATCACGAGGAGATGTCCGCGGTGCTCAGCCTTCAGCATCCGCACACGTATGCTGGACCGCCGGCCGTTGGGTATCCTGTAGGTGGTACCTGGAGTCCCAACGTGGACGTGGAGTGTGAGAGAGCCTTCTTCATCAGGATGAAGTGCGTCCTCGCTAAGAGGAACGCTGGCCTCACCACGTCAGGGTATAAGGTCATCCACTGTTCTGGATACCTCCGCGCCCGCCGCTTCGGCGACGGCACGGCTCCTCTCGGGCTGGTCGCCGTCGGCCACTCCCTCCCGCCGTCAGCCGTCACCGAGCTGAAGCTCCACTCCAACATGTTCATGTTCCGCGCCTCGCTGGACATGAGGCTCATCTTCCTGGACGCCAGGGTGGCGTCTCTCACCGGCTACGAGCCTCAGGACCTCATCGAGAAGACCCTGTACCACTACATCCACGGCACGGACGTGCTGCACATGAGATACTCGCACTGCACGCTGCTGACCAAGGGCCAGGTGACGTCGCGCTACTACCGCTTCCTGACCAAGTCCGGCGGCTGGGTGTGGATGCAGAGCTACGCCACCATCGTGCACAACTCCCGGTCCTCGCGCCCGCACTGCATCGTGTCCGTCAACTACGTGCTCAGCGACGTGGAGGAGAAGAACCTCGTCCTCAACATAGAGCAGGGCCCGCCCAAGGCGAGCCCCGAGCCGCAGCCGCCCGCCGCCAAGGCGCCGCACCCCGCGGGCGAGGACTTCGGCGACGGCTACGGCTATCCCGAGTACAGCCTGCCGGTCATACCCTCGTACGACGCGCACGAGGACTACCAGAACGGCTACCAGGAGATGTTCTACGAGAACTACGCGGAACCGGAGGTGGTCAACTACGTCTACCCTCAGAACCAGCGGCCGTTCTCGGCGAGCTCGTCCTCCTGCAGCTCGGTGGAGAGCTCGGAGGTCAACCAGTACAACTACACCAACCTCATCTCGTTCTACGGACACGGCGCCCAGGGCCAGAGGCAGGCGGAGGGCTTCAGCAGCTTCGCCAAGAACCCGAGCGCCGCGCCGGACGGGTTCGCCGGCGTCATCGTGGACAACACGCAGTTCCACAGCAACGAGTACGTGCACTGA

Protein sequence:

>DPOGS203877-PA
MKEKSKNAARSRREKENAEFLELAKLLPLPSAITSQLDKASVIRLTTSYLKMRQVFPDGLGDAWGAAPPPPQPRELSIRELGSHLLQTLDGFIFVVSPDGKIMYISETASVHLGLSQVELTGNSIYEYIHQADHEEMSAVLSLQHPHTYAGPPAVGYPVGGTWSPNVDVECERAFFIRMKCVLAKRNAGLTTSGYKVIHCSGYLRARRFGDGTAPLGLVAVGHSLPPSAVTELKLHSNMFMFRASLDMRLIFLDARVASLTGYEPQDLIEKTLYHYIHGTDVLHMRYSHCTLLTKGQVTSRYYRFLTKSGGWVWMQSYATIVHNSRSSRPHCIVSVNYVLSDVEEKNLVLNIEQGPPKASPEPQPPAAKAPHPAGEDFGDGYGYPEYSLPVIPSYDAHEDYQNGYQEMFYENYAEPEVVNYVYPQNQRPFSASSSSCSSVESSEVNQYNYTNLISFYGHGAQGQRQAEGFSSFAKNPSAAPDGFAGVIVDNTQFHSNEYVH-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: