MonarchBase - Protein-coding gene

DPOGS206053
Transcript	DPOGS206053-TA	1593 bp
Protein	DPOGS206053-PA	530 aa
Genomic position	DPSCF300028 - 949253-962042
RNAseq coverage	620x (Rank: top 21%)

Annotation
*Heliconius*	HMEL017948	2e-67	65.05%
*Bombyx*	BGIBMGA003900-TA	1e-69	57.42%
*Drosophila*	angel-PA	5e-40	37.31%
EBI UniRef50	UniRef50_D2A3E6	1e-81	43.51%	Putative uncharacterized protein GLEAN_07970 n=2 Tax=Tribolium castaneum RepID=D2A3E6_TRICA
NCBI RefSeq	XP_975263.1	1e-82	43.51%	PREDICTED: similar to carbon catabolite repressor protein [Tribolium castaneum]
NCBI nr blastp	gi\|91080695	2e-81	43.51%	PREDICTED: similar to carbon catabolite repressor protein [Tribolium castaneum]
NCBI nr blastx	gi\|270005856	2e-79	40.92%	hypothetical protein TcasGA2_TC007970 [Tribolium castaneum]

Group
KEGG pathway	tps:THAPS_10811	2e-28
	K12603 (CNOT6, CCR4)	maps->	RNA degradation
InterPro domain	[168-527] IPR005135	6.4e-41	Endonuclease/exonuclease/phosphatase
Orthology group	MCL12441		Single-copy universal gene

Nucleotide sequence:

>DPOGS206053-TA
ATGGTTTTTGCTCTTTGTGTAAAAAAATACGCTATGGCTTTATTTACATGCATTAATGCTGCTGCAGCTATGCTGAAATTGACTCACAGTTTTTGCAGATATACAAGACTCACCTGTGAGGACATAAATCATAGTAATTTTTTTGTGAAAAACTACTCACAGTTTAGTAAAGGAAAGATATGTGTTACATGGGACAAACAACAGACACAGCTAGCTTCGCAAGTTTATTTTGGTGTTTGGTCTCAACGTTTGGTGAACATAAAAAAGGGATTCAGTCTCAAAAAAACATTTATAAACTCAAATGTAACAAGGAGACGTAAACCAATGAGTGATTCATACGAACCCTATCAACATGCCAAATATCAAATTCCCGCAGATGAATGCACAAGTCAATCTAACCAATTTAGAAAACAACCAAGTGAAAAGACGAAGAGACCTCTTAAAATACCTAACGACTTTCGGCTTTGGGAGCCAGTGGGAAAGAAAAATTCTAACAATGGAGGTAATTTCAGGTTCCGTGTGGTCTCATACAATGTCCTAGCCCAGTATCTACTAGAATACCATCCATACTTATACACAGACTGCACTCCAGGAAATCTTAAATGGAAAGTACGAGCTGCAAAATTATATGACGAAATACTCAGTCTATCACCTGATATTATTTGCCTTCAAGAAGTGCAAGTGTCTCATTTAAAAAGTTTTTATTCAAAATTCGAGGACATGGGGTATTTTGGTATATTCAAACAGAAAACTGGTCATCGTCAAGACGGGTGTGCTATTTACTTCAAACATAGCCTATTTGATTTACAAGATCACAACAGTGTGGAGTACTATCAGCCTGAGATGCCAATATTGAATCGTGATAACATCGGCCTGATGGTTAAACTCGCTCCAAAATCCTCTTCAAATACTCCAATAGTAGTGGCCACGACACACCTCTTGTACAACCCGAAACGAACGGACGTTAGACTGGCACAGATGCAGGTCCTGCTGGCGGAGATAGACAGATTCGCATATACAAAGAATGGTTTAGGGGAGGGCTATTTACCTATAATAATTACAGGAGACTTTAACTCAACGCCAGATAGCGCTGTAGTGCAGTTACTGGACAGAGGACATGTTAGTGTATCATCGTTGAGAGACAATTCGGACTGGGAGAGAATCGGCGTCACTGATAACTGCCAGCATTTGGCGGTTTATTTGAACAGGCAGAAGGGAGTTAGCACAGATTTCAGTATGGTTAAGATACACAATTCGGACTACAAGAATAGTGCTCAAAACATACAGCACGAGTCCAAATACCGTGAGATGTTCAACAGTGACGACGTCTGCCATCCCCTCCGGCTGGCCTCCGTATACGACACCATGAAGAACGGTCTCAGCTACGAGGCCACCACTTACCAAGACCTGTGGATTACTGTTGATTACATTTACTTTAGTTACTGCAGTTCTCTCCGGCTAGTGGAACGTCTTCGTTTGCCGACTGAGGCTGAATGTGAGGTCCTCGGCCGTTTGCCAAACGATAAGTACGGCTCCGACCACCTCGTGTTGGCTGCGACCTTCGAATTGAAGACCTCCAAGTCCTCCCTATGA

Protein sequence:

>DPOGS206053-PA
MVFALCVKKYAMALFTCINAAAAMLKLTHSFCRYTRLTCEDINHSNFFVKNYSQFSKGKICVTWDKQQTQLASQVYFGVWSQRLVNIKKGFSLKKTFINSNVTRRRKPMSDSYEPYQHAKYQIPADECTSQSNQFRKQPSEKTKRPLKIPNDFRLWEPVGKKNSNNGGNFRFRVVSYNVLAQYLLEYHPYLYTDCTPGNLKWKVRAAKLYDEILSLSPDIICLQEVQVSHLKSFYSKFEDMGYFGIFKQKTGHRQDGCAIYFKHSLFDLQDHNSVEYYQPEMPILNRDNIGLMVKLAPKSSSNTPIVVATTHLLYNPKRTDVRLAQMQVLLAEIDRFAYTKNGLGEGYLPIIITGDFNSTPDSAVVQLLDRGHVSVSSLRDNSDWERIGVTDNCQHLAVYLNRQKGVSTDFSMVKIHNSDYKNSAQNIQHESKYREMFNSDDVCHPLRLASVYDTMKNGLSYEATTYQDLWITVDYIYFSYCSSLRLVERLRLPTEAECEVLGRLPNDKYGSDHLVLAATFELKTSKSSL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: