MonarchBase - Protein-coding gene

DPOGS205508
Transcript	DPOGS205508-TA	2937 bp
Protein	DPOGS205508-PA	978 aa
Genomic position	DPSCF300056 - 253722-262481
RNAseq coverage	428x (Rank: top 29%)

Annotation
*Heliconius*	HMEL011295	0.0	73.12%
*Bombyx*	BGIBMGA000140-TA	0.0	64.05%
*Drosophila*	CG7839-PA	2e-98	31.08%
EBI UniRef50	UniRef50_D6WGR9	4e-180	44.50%	Putative uncharacterized protein n=2 Tax=Tribolium castaneum RepID=D6WGR9_TRICA
NCBI RefSeq	XP_968241.1	0.0	44.52%	PREDICTED: similar to CCAAT/enhancer binding protein zeta [Tribolium castaneum]
NCBI nr blastp	gi\|270003174	1e-179	44.50%	hypothetical protein TcasGA2_TC002139 [Tribolium castaneum]
NCBI nr blastx	gi\|270003174	0.0	42.63%	hypothetical protein TcasGA2_TC002139 [Tribolium castaneum]

Group
Gene Ontology	GO:0005488	1.2e-11	binding
KEGG pathway
InterPro domain	[389-650] IPR005612	5e-35	CCAAT-binding factor
	[179-506] IPR016024	1.2e-11	Armadillo-type fold
Orthology group	MCL12154		Single-copy universal gene

Nucleotide sequence:

>DPOGS205508-TA
ATGAAGCACAAAAGATTCGAAGAGAACATTTTAGTAGACGAAGCGTATACGAATTACGGTAAAGTTGATAAAAATGCTGATGAAAAAAAAGGTTATGGTATAGCAAAACATTTCGCTGATACTCTAGAATACGCGGACAAAAAGAAATGGTATCAGCAGCTACCAGAAGAGCCTTCGACACAAGGATCGATAACGCAAGAAAAAATTGAAGAACTCCGTAAAGAAGCGAGTAGTGCTCTACATGGTGACACATTAGCTTATGAAACAAAATCAAGTAAAAGTGGTTCATCCGACCAACAGTGGGCTCGTACACTATTAACCAAAGGTACAATTGGAGACAGAGTGGCCGCAGCAACAATACTAATACAGGACAATCCGCTGTATAATTTGACGGCATTGAGGAATTTAATCAATAATGTGAAGCCAGCTAAGAAAAAGGATGGAATAGTTATAATAGATGCTGTATCGGAACTGTTAGTATCAGAGCTGCTCATCCCTGACACCAAGCTGCGCACCTTCCAGCAGCATCCTCTACATGTCATTGATGAAATCACATCGGGCAACAAACAGGCAAGACGGAATGTTCTAAAACTATGGTACTATGAGGATCAACTTAAAGAGTTGTACGGAACTTATGTGGAAGCATTAAACAAGTTTGCTCATGACACAGTGGACGCTAATAAGGAAAAGTCTATCAGTGCCATGTCTTACCTCTTGATGCATCATCCGGAGAGAGAAAAGATGCTCCTAACAAATATAATAAATAAACTCGGTGATCCGAGCCAGACGGTGGCATCGAAAGTGATCTACCATCTCTGTCAACTTCTATACAACCATCCGAATATGAAATCTGTTGTTTTAGCTGAGATAGAGAAAATGTTGTTCAGATCTAACATATCCCCACGCGCTCAATACTATGGAGTGTGTTTCCTGAACCAGTTCTTCCTTGGTAAGGATGACAGTCGGATAGCTGAGAACTTGATCAGAATATACTTCTCATTCTTCAAGGCTTCTATCAAGAAGGGTGAAATAGATTCTCGTCTCATGTCAGCTATCCTGACGGGTGTGAAGCGAGCCTATCCCTTTGCTGACAGGGAGCGGTTGGTTGAGGCCTCCCAGCATGTAGACGCTGTACACCGACTGGTCCACCTGGCCAACATCAACGTGGCGATCCATGCACTGGCCTTGCTGTATCACATCAGTGATGCTAACAAAGGGACATCCGACAGATACTACACAGCCTTGTACCGGAAACTGACAAATTCCAATATATTCAATACTACCCACTCTGCATTGTTCTTCTCTCTCATATACAAGTCGTTGAAGCAGGACAAGGATATAGACCGGGTGACGTCATTCATCAAGAGATTATTACAGCTGTCCTGCTACATGAGCCCTGGCCAGGCTTGCGGAATGCTCTTCCTCATCTCGCAAGTATTGAAGAGTGATGATAAGAGAGAGGCTGTAAAACTGGTCTTCAGTGAGATTAAAGAGGAAATTAAAGAAGAAAATGAAACTAAAAATAATGATGAAAATCCAGAAGAATTAATGCATTCAGAAGTTGAATTAGATGAGAGTAAGGAAGATGCTGAGGAAAATGTCAAACAGAAAAAAATTGATCTCTTAATAGGAGATAAGAAAGATTTATTAATGGATGATGAAGAAGAGACATATGTTGACCTCAAAATAGACGATGAAGGTAACATAAAGCCTAAGAAGAGGAATACGAACTCTGTGACTGGGTGGTTTCATGCTAGAGTTGACAAGAAAGATGTACAAGAAAAAAACGTTGAGAAACAGTTGAAGAAAGCTATTAATATTGGAAAGACGATAACCAGTTATAGTCCACTGTGCCGTGACCCTCGTTTCACCGGAGCACACCTGACGGCGATGGCTGAACTGACAATGCTGATGAAACATCATCATCCGAGTGTCAAGATGTTTGCTGAAAAATTACTGAATAATCAAATAATCCAATATGGCGGCGATCCTTTGAAGGACTTTTCCGGTATCCGTTTCCTGGATAGATTCGTGTTCAAGAATCCAAAGAAACGTGCCGAGGTCACTGATGGGGAGGTCAAAAAGGTTAAGGGGTCACATCCGAAGTTCGCTGTTAGAAAGAACTATACAGCTAAAGGCATCAGAAGTATCGCTGTCAATTCATCGGCATATTTGAATGAGGATGTCAAGAAAATTCCTGTCGATGAAAGATTCCTATATGATTTCCTTCAAAAGCGCCGAGCGGCTGCTGATAGTGATGAGGAGAGTGACAACGACTCGGTGACCAGCGAAGATTTTGAGACCTATTTGGATTCAGTCACTGGAACCAAAGCACAGGAATCCGATGAGGAGTTAGATTATTTGGGTGAATTGGAGTCGAGTAAACAGAAACGACCGAAGGAAGTTGATGATGAGAAAGATGAGGTGATGAGCGATGATCAAGATGAAGACGATGATAGCGATGGCGAACTCAATATATCCGGTGATGAAGACGAGCCAGTACTATCCGGAGACGAGGACGAACTAATGTTAGAAGACAGCGAAGAAGAAGACCAGATAGATATACCAGGAAAGAAGTCCAAAAAGGATGCTATTAAATTAAAAGGTCACGAAAATCTTGGGTCACTGTTTGCATCGGCCGAAGAGTTCTCGACGCTTCTAGAAGAGACGGCAGCGAATAAAAAACAAGGTTCAAGCCAAGCGGTATCAAACACAGACAATTCAAGCACAAAACAACTGGCTTGGGAGGAAAAACGCGATAGGTGGATCAAAGGATACAATAAGAAGATATTGGGACATAAGAGCAAGGGCAAAAAATTCAATAGCAAAAATAACAAAAATGTCAAAGGCACAAAAATGGCTGATAAAAATATTGGCGGGAAACGAAAAGGCGGAAAAACTGACGGCGCCGGCGGAAAGAAGAAGAAAACAAAATAA

Protein sequence:

>DPOGS205508-PA
MKHKRFEENILVDEAYTNYGKVDKNADEKKGYGIAKHFADTLEYADKKKWYQQLPEEPSTQGSITQEKIEELRKEASSALHGDTLAYETKSSKSGSSDQQWARTLLTKGTIGDRVAAATILIQDNPLYNLTALRNLINNVKPAKKKDGIVIIDAVSELLVSELLIPDTKLRTFQQHPLHVIDEITSGNKQARRNVLKLWYYEDQLKELYGTYVEALNKFAHDTVDANKEKSISAMSYLLMHHPEREKMLLTNIINKLGDPSQTVASKVIYHLCQLLYNHPNMKSVVLAEIEKMLFRSNISPRAQYYGVCFLNQFFLGKDDSRIAENLIRIYFSFFKASIKKGEIDSRLMSAILTGVKRAYPFADRERLVEASQHVDAVHRLVHLANINVAIHALALLYHISDANKGTSDRYYTALYRKLTNSNIFNTTHSALFFSLIYKSLKQDKDIDRVTSFIKRLLQLSCYMSPGQACGMLFLISQVLKSDDKREAVKLVFSEIKEEIKEENETKNNDENPEELMHSEVELDESKEDAEENVKQKKIDLLIGDKKDLLMDDEEETYVDLKIDDEGNIKPKKRNTNSVTGWFHARVDKKDVQEKNVEKQLKKAINIGKTITSYSPLCRDPRFTGAHLTAMAELTMLMKHHHPSVKMFAEKLLNNQIIQYGGDPLKDFSGIRFLDRFVFKNPKKRAEVTDGEVKKVKGSHPKFAVRKNYTAKGIRSIAVNSSAYLNEDVKKIPVDERFLYDFLQKRRAAADSDEESDNDSVTSEDFETYLDSVTGTKAQESDEELDYLGELESSKQKRPKEVDDEKDEVMSDDQDEDDDSDGELNISGDEDEPVLSGDEDELMLEDSEEEDQIDIPGKKSKKDAIKLKGHENLGSLFASAEEFSTLLEETAANKKQGSSQAVSNTDNSSTKQLAWEEKRDRWIKGYNKKILGHKSKGKKFNSKNNKNVKGTKMADKNIGGKRKGGKTDGAGGKKKKTK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: