MonarchBase - Protein-coding gene

DPOGS202118
Transcript	DPOGS202118-TA	3027 bp
Protein	DPOGS202118-PA	1008 aa
Genomic position	DPSCF300150 + 308626-317515
RNAseq coverage	65x (Rank: top 67%)

Annotation
*Heliconius*	HMEL002385	0.0	83.12%
*Bombyx*	BGIBMGA006961-TA	0.0	67.84%
*Drosophila*	CG43284-PB	2e-77	49.31%
EBI UniRef50	UniRef50_E1ZWS3	1e-157	48.59%	Myelin transcription factor 1 n=2 Tax=Formicidae RepID=E1ZWS3_CAMFO
NCBI RefSeq	XP_001606059.1	1e-159	52.70%	PREDICTED: similar to CG32778-PA [Nasonia vitripennis]
NCBI nr blastp	gi\|345494043	2e-158	52.70%	PREDICTED: hypothetical protein LOC100122454 [Nasonia vitripennis]
NCBI nr blastx	gi\|332022634	0.0	44.50%	Myelin transcription factor 1-like protein [Acromyrmex echinatior]

Group
Gene Ontology	GO:0005634	5.4e-17	nucleus
	GO:0006355	5.4e-17	regulation of transcription, DNA-dependent
	GO:0008270	5.4e-17	zinc ion binding
	GO:0003700	5.4e-17	sequence-specific DNA binding transcription factor activity
KEGG pathway
InterPro domain	[684-714] IPR002515	5.4e-17	Zinc finger, C2HC-type
Orthology group	MCL10814		Insect specific

Nucleotide sequence:

>DPOGS202118-TA
ATGTCAGACAGAAACGAAGACAAATACGAAGAGGACAGAGAAGCGAAACGTAGGCAGGCTGAAATAATCTCAGTTAACAAGCAATCTCTTTACAACGCTTACAAAGCTGCCACAGCTTCATTGCCGTATTCGACCCAATCCGCCTTCAAGCCACCAGCGGAAGTGAAACACAAGATCCACGGCTCCAGTTTTCCCAGCGAGCCATTCGGTGGCTATTCTAATGATCACGAGAAGAGTGCGATTCATAAGGGTTCGAAGCAGTACACGGTGCTGCAGCCAGCCGCTGCTGGGTCAAGGGCTGCTACAGCGTTGCAGGAGGCTCGCACTGTACCATCAGCTCAACCGGCGCGAGACTTGCGACCCATCAACCCTCTCTCCCCACCAGCCGTCCGAGGTACAATGATCCTTGGCTCGTCTCGTCCCCAACTTCTTAACGACACCAAACTTCGCTTTATGAATGACTTAAAAGTTTGTTTCAAGAAGGCAACAAGTGTCCGACTCCTGGTTGCAATGGGCAGGGCCACGTTACAGGCCTCTATACGCATCATCGAAGTATTGGCGTTGCACGAGACAATCTTAAAGTGTCCGACGCCGGGGTGTAACGGACGAGGTCACGTCAGTTCTAACCGCAGCACTCACCGCTCTCTCTCTGGCTGTCCGACGGCCGCTGCACGCAAAGCAGCAGCTCGCTCCCAACGAGGCCGACCACCGGTTCAATTGCCCGCACCGGCTCCTGTGACTCAAGTGTCAGCCAGCACGTCAGATAGCCACACTTCAGACGGTTCCCGCGATCGGGTTCCAGCGGCGTCGCCGCAAACTCCGGCCGTGAAGCGCGAAGCCCCCGAACTGCTGGTGCCGAAGCGTGAGGCCGCCGAGCCCGAGCGCGACTCCCCCGGCATGGAGACGCGCCACGCCGGCTACGGCGCGCCGCCCGATCAGCGCTCACCATACGAACGACCGCCTGACGACCACGTACGGTCATACAGTCAAATGAACGAAGCTCGGTACGGATACGAAGCTAGGTGCTATGAGGGCGCCCCAGCTTTTGAGAGATATGACCCAGCTCAATGCCCTCAGAGGCCTTACGGTTGGGAAGAAGAACGATACCATGACCCTCATTTGCCAACGCCAATGAAAACGGACCAATCAGAACAGGAAACTAATTCTGGACCTATATATCCTAGACCAATGTACCATTACGAAGCTGGCGGTGTAGGCGCCGTGGGCGGGGTGGGCGCTATGGGCCCAGGCGTTCCCCCCGGCTTCTCCGCTATCAATCTCTCAGTGAAGATAGCCGCAGCTCAGGCTCAACGTCCTCGAAGTCCCACACCCAGGGATCCTCGTGATCCGCGTCCGGCTATAGATCTATCCACATCTAGTGGCAGTCCACAGGGTCCATATGCGTCACCGGTATACACGAGCGCCGGTGGTGGCAGTGGGGGCGGTGCACGGGGAAGCCCGCAGCCGGGCGCTTCGCCCCAACTTACGGCAAGTCCCCAAGTTCCCAGTCCACAAGGCCAGACCCTCGACCTTAGTGTGTCCCGTTTACCACATAGTAGAAGTTTTCCGGGTGGTGTTTCATACAGTCGAGAATCAACGCCGGATAGCGGTGGAAGCCATCCATATCTTGAAGCATACCATCGCGACACAGCCGCAGGGTACGGTGGTGTAAGCCCTCACCCGGTAGCCGGATACGGTCTTGCGCAGCCGGATTACGCAGCTGCTGCTGCCGCTGCCGGATACGGTGGCTATCAGTACCAATGCGGGGCATACCCACCCCCGCCCGCGTACCCCCCGCACGCGCCGCCGTATTCACCACCGTGCTATATGCCGCCGCCGCACGCACCGCACGACAAGCCCAAGGATAGCTATCACCGCGACGACTTTTACGGGAAACATGGTTACCGTATTCGGGAGTCGAAAGAACTGATCCACTGTCCCGTCCGAAGCTGCGACGGATCCGGACACGTGTCTGGCAACTTTGCAACTCACCGCAGTCTGTCCGGGTGTCCTCGTGCTGATCGCTCTCAACTGCAGCCACATTCTCAAGAACTGAAGTGTCCCACACCAGGTTGCGACGGCTCCGGGCACGTTACCGGGAACTACTCCTCCCATCGATCACTATCAGGTTGCCCCAGGGCTAATAAACCGAAAAGCAAGCCCAGGGATGGCCAAGATTCTGAACCGCTCAGATGCCCTATACCGGGCTGTGATGGATCTGGGCATGCCACAGGAAAATTCTTATCACACAGAAGCGCGTCGGGCTGCCCTATTGCAAATCGGAACAAAATGCGGGTTCTAGAAAGCGGCGGCACAGTTGAGCAGCACAAAGCGGCAGTGGCGGCAGCGGCATCCGCTATTAAATTCGATGGCGTGAACTGTCCTACCCCGGGATGTGATGGATCGGGACATATAAACGGTTCGTTTCTAACCCATCGTTCGCTATCCGGCTGTCCCGTAGCCGGTGCAACCACACCGACGCCTCAACCAAAGAAACCGAAATATCCTGATGATATCACTCCGCTATACCCCAAGCCCTATTCAGGTATGGATATTAACATGCAGACAGGAAACGGCGAAGATTTAATGACACTGGAGCAAGAAATTACTGAACTCCAGCGTGAAAATGCAAGAGTGGAATCACAGATGATGCGTCTGAAATCGGACATAAACGCGATGGAGTCACACTTGAGCCATGGAGAAAGGGAGAATCAGCTCATCATTCATCGCAACAGCAATCTGAATGAATATTACGAAAGCCTTCGGAACAATGTGATCACGTTGCTGGAGCACGTTAAGATACCAGGAGGAGGTACGGTGCCCGTATCAACTGCCCCCGGAACTCCCGGAGCTGCACCCCCGACTGGCCCTGGTGATAAACCCGCCCACGATAACTTCGACTCTTATCTCACCAAGCTGCAGACCCTATGCTCCCCGGAAGGATACTGCCCCGATGAGAATCGACCGATCTATGAGACCGTTAAAAACGCGCTCCAAGACTTCACAGTGCTACCAACGCCGATATAA

Protein sequence:

>DPOGS202118-PA
MSDRNEDKYEEDREAKRRQAEIISVNKQSLYNAYKAATASLPYSTQSAFKPPAEVKHKIHGSSFPSEPFGGYSNDHEKSAIHKGSKQYTVLQPAAAGSRAATALQEARTVPSAQPARDLRPINPLSPPAVRGTMILGSSRPQLLNDTKLRFMNDLKVCFKKATSVRLLVAMGRATLQASIRIIEVLALHETILKCPTPGCNGRGHVSSNRSTHRSLSGCPTAAARKAAARSQRGRPPVQLPAPAPVTQVSASTSDSHTSDGSRDRVPAASPQTPAVKREAPELLVPKREAAEPERDSPGMETRHAGYGAPPDQRSPYERPPDDHVRSYSQMNEARYGYEARCYEGAPAFERYDPAQCPQRPYGWEEERYHDPHLPTPMKTDQSEQETNSGPIYPRPMYHYEAGGVGAVGGVGAMGPGVPPGFSAINLSVKIAAAQAQRPRSPTPRDPRDPRPAIDLSTSSGSPQGPYASPVYTSAGGGSGGGARGSPQPGASPQLTASPQVPSPQGQTLDLSVSRLPHSRSFPGGVSYSRESTPDSGGSHPYLEAYHRDTAAGYGGVSPHPVAGYGLAQPDYAAAAAAAGYGGYQYQCGAYPPPPAYPPHAPPYSPPCYMPPPHAPHDKPKDSYHRDDFYGKHGYRIRESKELIHCPVRSCDGSGHVSGNFATHRSLSGCPRADRSQLQPHSQELKCPTPGCDGSGHVTGNYSSHRSLSGCPRANKPKSKPRDGQDSEPLRCPIPGCDGSGHATGKFLSHRSASGCPIANRNKMRVLESGGTVEQHKAAVAAAASAIKFDGVNCPTPGCDGSGHINGSFLTHRSLSGCPVAGATTPTPQPKKPKYPDDITPLYPKPYSGMDINMQTGNGEDLMTLEQEITELQRENARVESQMMRLKSDINAMESHLSHGERENQLIIHRNSNLNEYYESLRNNVITLLEHVKIPGGGTVPVSTAPGTPGAAPPTGPGDKPAHDNFDSYLTKLQTLCSPEGYCPDENRPIYETVKNALQDFTVLPTPI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: