MonarchBase - Protein-coding gene

DPOGS214939
Transcript	DPOGS214939-TA	2298 bp
Protein	DPOGS214939-PA	765 aa
Genomic position	DPSCF300280 - 139395-154845
RNAseq coverage	429x (Rank: top 28%)

Annotation
*Heliconius*	HMEL015594	2e-148	70.77%
*Bombyx*	BGIBMGA004821-TA	0.0	77.97%
*Drosophila*	MTA1-like-PA	0.0	52.44%
EBI UniRef50	UniRef50_D6WR60	0.0	55.89%	Putative uncharacterized protein n=2 Tax=Tribolium castaneum RepID=D6WR60_TRICA
NCBI RefSeq	XP_975498.2	0.0	55.89%	PREDICTED: similar to MTA1-like CG2244-PB [Tribolium castaneum]
NCBI nr blastp	gi\|189239491	0.0	55.89%	PREDICTED: similar to MTA1-like CG2244-PB [Tribolium castaneum]
NCBI nr blastx	gi\|189239491	0.0	56.05%	PREDICTED: similar to MTA1-like CG2244-PB [Tribolium castaneum]

Group
Gene Ontology	GO:0003677	2.7e-17	DNA binding
	GO:0005515	2.9e-12	protein binding
	GO:0006355	1.1e-06	regulation of transcription, DNA-dependent
	GO:0043565	1.1e-06	sequence-specific DNA binding
	GO:0008270	1.1e-06	zinc ion binding
	GO:0003700	1.1e-06	sequence-specific DNA binding transcription factor activity
KEGG pathway
InterPro domain	[52-122] IPR001025	2.7e-17	Bromo adjacent homology (BAH) domain
	[231-287] IPR009057	2.9e-12	Homeodomain-like
	[230-279] IPR001005	1.2e-07	SANT domain, DNA binding
	[357-393] IPR000679	1.1e-06	Zinc finger, GATA-type
Orthology group	MCL10660		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS214939-TA
ATGAGGGAGAACAATCGAAAATATCAGGAGCTTCGCGATTTACCACCGGGTACCATCGGCGGTCGCGCGCATGCCTGTTTTCTTAGGTCGCGCCCGACGCTGCCTTCCGATGTGGCAATGGAGGAGGAATCTACGGAGCTGCCTGGTTCTGACGGGCTCGCGCCCAAACAGCGGCACCAGGCGAAGCAGCGCGAGCTGTTCCTGTCGCGGCACGTGGAGACCCTCCCAGCCACGCACATCCGCGGCAAGTGTACCGTCACGCTGCTCAACGAGACGGAGTCGCTGCTCAGCTATCTCAATAAGGATGACGCATTTTTTTATTGTTTAGTATTTGATCCTTCACAAAAGACTTTATTAGCAGATAAGGGAGAAATCAGAGTTGGAAGTAAATATCAGACTGAAGTAACTAATTTATTAAAAGAAGGTGAGATGATTTCTTTAACTAGTTATGATGAAAGTAACAAGATCGACCAATTCCTGGTGGTGGCTCGGTCTGTGGGCACCTTCGCCAGGGCATTGGACTGCAGCTCCAGTGTTAAACAGCCCTCGCTACACATGTCCGCGGCGGCCGCCAGCAGGGACATAACTCTTTTCCACGCCATGGACACGCTGCACAAGTCCGGGTACAGCATAGAGGCTGCTCTGTCGTCGCTGGTGCCGGCCTCCGGGCCTGTGCTGTGTCGCGACGAGATGGAGGAGTGGTCGGCCTCAGAGGCCAACCTGTTCGAGGAGGCGCTCGAGAAATACGGCAAGGACTTCGCTGATGTACGGAAGGACTTTCTGCCGTGGAAGACGCTGAAGAATCTGGTGGAGTACTACTACATGTGGAAGACGACGGATCGCTACGTGCAACAGAAACGGGTGAAGGCTGTGGAGGCGGAGTCCAAGCTGAAGCAAGTGTACATTCCCAATTATAACAAACCGAATCCAGCGTTGTTGTCGAGCGGCGCGGCGGCTATCACGAGCGCGGCGGCCCCCCCGCCTCCGGGGCCCCGCCCGGCCGGCGTCGCCAACAAGGGAGCCGTGCTGAACGGAGGAACCAACGGCACAGCGGCCGCACCCACCATGTGCGCCTCGTGTCAAGTGACAAATTCAAACCAGTGGTACGCCTGGGGACCACAGCATTTACAGTACAGATTATGTGGCGCTTGCTGGCAGTACTGGAAAAAATATGGAGGACTTAAGACGGCGGGAGTGTTCGGCGAGAGCGAGGCGGAGGCGGGGCGCGGGGTGCGGGCGGAGGCCGACGACACAGCACTGTCCGTGTCGCACAGACCGCACCGGTGCTCCGTGGTTAACTGCGCCAAGGAATTTAAACTGCGCGCTCACCTGGCCCGCCACATGGCGACTGCTCACGGCGGCGCGGGCGAGGGCGCTCGGCCCGTCATGAAGACCCGAGCCGCCTTCTATCTCCGCGCCTCGCCCTTCACGAGACTCGCGCGCCGCCTCGCCCGCGCCCTCCGCAGACCCAGGCACTACGCGCGCTCACCCTTCTCACCGATCAACCTGCACCAGGTCAAACACGAGTGTACGATAGCGATGGCGGGCGGCGTCGGTGGTGTGGGCGGTGTGGGCGGCGTGGTCCCGGCGGAGGTCCGAGGCGTCGCTCGTGCCCGCGGGCCCGTGGGCGCGGTAGCGGCCCGACTCGCCGCCGCTCTGGGCACGTCCGCGCCTCGAGCCCAGGACTGGCTCACCCTCACCCCGCGCGAACGTCTGCCCACACCCAACCACGTCGCCTTCCCCAAGCCGCCCAAGGCCCCAGATGGCAGCCTCATGTACGAGCGTGTGGTGTCCCGCGCGGAGCTGGAGGCGCGCCGCAGCGAGGCGGCCGCGCCGGCTCTCAAGCGGCGCGCCTACGACGACATCAACGGCCTCGACAGAGGTTGTGGTGGTAGCGCGCCTCCCGCCAAGCGACCCAACAAGCATCCGGCGCCCATGCAACGTCCATCACGCGAACAGTACGCGGCCATGTGCGCGCGAGCCCAGGCCACGGGACAACCTCTGCCCGCACACGTTTTTGCACACGTGAACGGCAAACCGACGAACCTGACCGGCCGCGGCGGTCGTCGCCACGTGATCTCGTGGATGGACGCTCCGGACGACCTCTACTTCAGAGCCACCGAGACCGCCAAAGCCGCCCGACGGACGCTGAGCTGCGGCGAGCTGAGACGCGGCGCCCGCGCTCCGTGGCGCGTGATGCGCGGGGCGGTGGCCGGCGTGGTGCTGGGCGCGGCGGCGGCGGCGGGCGGCAAGGCGGGCGCCGCCTCCGCCCCGCTGCAGCTGGTGATCCTCGACTGA

Protein sequence:

>DPOGS214939-PA
MRENNRKYQELRDLPPGTIGGRAHACFLRSRPTLPSDVAMEEESTELPGSDGLAPKQRHQAKQRELFLSRHVETLPATHIRGKCTVTLLNETESLLSYLNKDDAFFYCLVFDPSQKTLLADKGEIRVGSKYQTEVTNLLKEGEMISLTSYDESNKIDQFLVVARSVGTFARALDCSSSVKQPSLHMSAAAASRDITLFHAMDTLHKSGYSIEAALSSLVPASGPVLCRDEMEEWSASEANLFEEALEKYGKDFADVRKDFLPWKTLKNLVEYYYMWKTTDRYVQQKRVKAVEAESKLKQVYIPNYNKPNPALLSSGAAAITSAAAPPPPGPRPAGVANKGAVLNGGTNGTAAAPTMCASCQVTNSNQWYAWGPQHLQYRLCGACWQYWKKYGGLKTAGVFGESEAEAGRGVRAEADDTALSVSHRPHRCSVVNCAKEFKLRAHLARHMATAHGGAGEGARPVMKTRAAFYLRASPFTRLARRLARALRRPRHYARSPFSPINLHQVKHECTIAMAGGVGGVGGVGGVVPAEVRGVARARGPVGAVAARLAAALGTSAPRAQDWLTLTPRERLPTPNHVAFPKPPKAPDGSLMYERVVSRAELEARRSEAAAPALKRRAYDDINGLDRGCGGSAPPAKRPNKHPAPMQRPSREQYAAMCARAQATGQPLPAHVFAHVNGKPTNLTGRGGRRHVISWMDAPDDLYFRATETAKAARRTLSCGELRRGARAPWRVMRGAVAGVVLGAAAAAGGKAGAASAPLQLVILD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: