MonarchBase - Protein-coding gene

DPOGS201959
Transcript	DPOGS201959-TA	1524 bp
Protein	DPOGS201959-PA	507 aa
Genomic position	DPSCF300384 + 30453-34084
RNAseq coverage	52x (Rank: top 70%)

Annotation
*Heliconius*	HMEL002059	4e-46	85.71%
*Bombyx*	BGIBMGA011215-TA	3e-171	67.93%
*Drosophila*	Patr-1-PA	4e-40	31.17%
EBI UniRef50	UniRef50_D2A5J1	4e-54	34.95%	Putative uncharacterized protein GLEAN_15163 n=1 Tax=Tribolium castaneum RepID=D2A5J1_TRICA
NCBI RefSeq	XP_001809160.1	7e-55	34.95%	PREDICTED: similar to protein associated with topo II-related 1 [Tribolium castaneum]
NCBI nr blastp	gi\|189238286	1e-53	34.95%	PREDICTED: similar to protein associated with topo II-related 1 [Tribolium castaneum]
NCBI nr blastx	gi\|189238286	4e-53	34.88%	PREDICTED: similar to protein associated with topo II-related 1 [Tribolium castaneum]

Group
KEGG pathway	tca:100142489	2e-54
	K12617 (PATL1, PAT1)	maps->	RNA degradation
InterPro domain	[43-333] IPR019167	1.4e-34	Topoisomerase II-associated protein PAT1
Orthology group	MCL14537		Insect specific

Nucleotide sequence:

>DPOGS201959-TA
ATGTTAGAGACGTTTCTATCGTTCGTCCCGGCGGGCGGAGGGTGCGCACCCCTCGCACCCTCGCGGCGGCCGTGCGCCGTTCGTCTGCACCCTCGCGAACGTCCGACTCCCGTCGTTGACGGGGAGCTGGATGAGTATGCAGGTCTAATGACGGCCAGAGAGAAACAATGGCTCATCAATATCCAGATGTTGCAGCTGAACACCGGAACACCTTACATACATGACTTCTATTATACAGTTTTCCTCGAGAGACAGGCAAGCAAGGAAAAGGAAGGTGTGAAGGAGGCTCATAAGGCCAATCAACAGAACCATCCCTTCTACAGCGGAGGCAAGCAGGAAGACAGTCACGCCATGAGACAGAGAGAGAGGCACAACTCGCACAGACACAACTCCACCGGAGAAGATCCCAGGACATATGTCCCTACACAGTTTGAGAACTCCCTGGGGAAACTGCAGTGCGGTAGCGTGACGGCTCCGAGGAAAATTATAGACGTGGAAGTCGTGGGGGCGGAGCCCGAGCAGCGAGCGAGCAGGGCGCCCTCTGTGGCCAGCAACAACCCCGCTGAGGTTCCGCGCGAGATGAGAAGGACCAAGCAACTGCTTCTGGATATTGAGGCGTTGTATCTCATACTGCTCAGACTGGAAGAGCTCAACGATCCCTTGGCAATATCTAACGCTTTAATATTGAAGGAAAGAGAAGAGAAGCAGAAGCAACTGGAAGCAGCACAGAAGGAAGCAGAAGATGACGATGATGGAAACTTATTCCTTAAGAATATAGAATCTGTACAGAGACGACCCAAGCAGGAGAGTCCCAAGAGCGAGAGTATCGATAAGAGACAGGTGGTGAACCTGACCACGAACCAGAAACCTCAACCGGCCAAGAACCTGCTGGATGAAGACAAGGAGGACCTGCTCAATAAGATGTTCTCCGGACTCCTGCACGGAGAGAGAGTGCCGCAGATACTGGCGGTTAGGAAGGGGAAGTCGTTGCTAGCTCGTTTCCTGGCCCGCACCCCCGAGACTCACCCCCGTCTTCGTCCTCTATGGTCGAGGGTGCTCCGCTGTCTGCCGACCGCTGCTCGCCGCGACGAAGGCGGCGCCCTAGTGTCCCTGGAGCCCCACTTCCGGCGCTACGCTCTCGCGGCGCCCGGCTGGCCGGCGGTGGCGGAGACCTGCGCCGCGCTAGCGGAGGCCCTGGACCCCGCCCGCGGCCACCACGCGCTCGACACGCGACTGACTCTGAGCTGCGTCTGCGCGCTCACCGAGAAAGCGATGATGCTGGTGGGGGTGTCGGAGTCGTCCGGCGGCGAGCGGCAGTGGTACAGGTTCCTCAAGACGGTGGCGAAGGCCCTGAGACACGCGCCGAGCGTCGCCCCGCCCACCCGGCCCGTGGCGGAGGCCCGGCTCTCGGCGCACCTGAAGCGGCTGGAGGCCCGCGCGGGGCTCGAGATCCTGCAGAGAGGCGCCACCATCGAGCTGTCCGCCAAGGACGCCGCGGAACACCTCGTGAGGCACCTCTGCTGA

Protein sequence:

>DPOGS201959-PA
MLETFLSFVPAGGGCAPLAPSRRPCAVRLHPRERPTPVVDGELDEYAGLMTAREKQWLINIQMLQLNTGTPYIHDFYYTVFLERQASKEKEGVKEAHKANQQNHPFYSGGKQEDSHAMRQRERHNSHRHNSTGEDPRTYVPTQFENSLGKLQCGSVTAPRKIIDVEVVGAEPEQRASRAPSVASNNPAEVPREMRRTKQLLLDIEALYLILLRLEELNDPLAISNALILKEREEKQKQLEAAQKEAEDDDDGNLFLKNIESVQRRPKQESPKSESIDKRQVVNLTTNQKPQPAKNLLDEDKEDLLNKMFSGLLHGERVPQILAVRKGKSLLARFLARTPETHPRLRPLWSRVLRCLPTAARRDEGGALVSLEPHFRRYALAAPGWPAVAETCAALAEALDPARGHHALDTRLTLSCVCALTEKAMMLVGVSESSGGERQWYRFLKTVAKALRHAPSVAPPTRPVAEARLSAHLKRLEARAGLEILQRGATIELSAKDAAEHLVRHLC-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: