MonarchBase - Protein-coding gene

DPOGS201958
Transcript	DPOGS201958-TA	3003 bp
Protein	DPOGS201958-PA	1000 aa
Genomic position	DPSCF300384 + 20428-30052
RNAseq coverage	535x (Rank: top 23%)

Annotation
*Heliconius*	HMEL002059	1e-71	45.07%
*Bombyx*	BGIBMGA011215-TA	0.0	57.35%
*Drosophila*	Patr-1-PA	5e-41	31.17%
EBI UniRef50	UniRef50_D2A5J1	2e-53	33.91%	Putative uncharacterized protein GLEAN_15163 n=1 Tax=Tribolium castaneum RepID=D2A5J1_TRICA
NCBI RefSeq	XP_001809160.1	4e-54	33.91%	PREDICTED: similar to protein associated with topo II-related 1 [Tribolium castaneum]
NCBI nr blastp	gi\|189238286	9e-53	33.91%	PREDICTED: similar to protein associated with topo II-related 1 [Tribolium castaneum]
NCBI nr blastx	gi\|189238286	2e-53	33.40%	PREDICTED: similar to protein associated with topo II-related 1 [Tribolium castaneum]

Group
KEGG pathway	tca:100142489	1e-53
	K12617 (PATL1, PAT1)	maps->	RNA degradation
InterPro domain	[304-826] IPR019167	9.3e-36	Topoisomerase II-associated protein PAT1
Orthology group	MCL14537		Insect specific

Nucleotide sequence:

>DPOGS201958-TA
ATGGCAGATTCTTTTTTCGGGATCGATACTTCGTCATCGAACTTAAATGACGACGAGGGTGGCGGGGAGCCTTCGGAAGACGAGTATGATGCCCTCAACGATGAAACATTTGGACAGGATTCTGAAGAGTTTGACTGGGAGTATGAACACGAACAGCTGGCCGGACAGCTGGAGAGCAGTCGACGGAATGCAGCACTTGACGACGCTGACTCCAGGCTTGAGGCATCTCTCTCTCAGCTAGTGTTGGATGAAACGGATGCTCCACGAAGCCTCGGGTCCAGCGTCTGGAGACATGACGTTCCGTTTCCCACACCAACAACGCCGGTACAACAGCCAGCCCTCAAGAATGTGTGCACAGTGGAGGAACTGGAAAGACAGCTGCGACAGAACCAGCAACAGACGTACACACAGAACTACTTTCAACCGCGGTTTCCACCTGTTATCCTGCAACGGCCTCCAGGTCTACAGGCACCACTTCCGATACCGTTCGCACCACAGCAATCTATGGCACATAATATGAATCAAATGAACCAGCCGTTGAATAAAATGATTGGACAAAACTCACAAATCAACCAAATCGGCCAATCGAATATGATGAATCATATGAACCAGAACATAAATCAGATTGGTTCTAATATAAATCAGATGAATCAGAATGTAAATCAGATGGGTCAAGGTGTTAATCACATGGGACAAAATGTTATGGGTCAAAATCAAATGGGACAAAATGTTATGGGTCAGAATCAAATGGGGCACAATGTGAACCAATTCATGCAAAATTCAAACCAGATGAATCAGTTTCAAAACAACCAAATGGCACCGGCGATGATGAACCAAATGCATAACATGAATCTTCATCCCATGAATCAGAACAATCAAATGATTCAAAACCAAATGGGTCAAAACATGAATCAGATGGTACAAAACTCTGGGTCTAACATGAATCAAATGAATCAGGGGGGTCAAAACATGAATCAAATGGGCCAAAATATGAATCAAATGGGTCAAAATATGAACCAAATGGGTCAAAATATGAATCAGATGGGTCAAAATCAGATGATCCCAAACGGTAACCAGTTTGGTATGAATCAGTTCCAACAAATGATGGGTCAGCCTCGAATGATGGCGCCGCCCCCCGGCATGAATATGCCAAGACAAAATTTTGGCAATAATATGAATCAATTTAATACAAATTTTCGTGGACAAATGCAATCAAAAAACGATCAGCAAATATCACAACAGAACATGATTATGAACCACAATAAAAACCAGAACCAGGTAAAACCGAACCAGCTGTCACCGAAGCAGAAACCGGTACAGAATTTGAACCACATCCAGAATATGAACCAGGCTCAGAACAACAAGTTGCAGAAGAGTCGCGTATATAATAACAAGAGCTTAACATCTCAAAACCTGGTCCAGCTGATCCAGAACACGCATCCCATGTTGAACTTCAACAACAGCTTCCACAACGCCAGCCATCACCCCATCCTCAACAGAAACCATTTCAACAACCAGCTCATGAAACATCTCATGTTCGACAACAGGCAGAACGGGAATTTTGGCAACACAACCAGCAGAGCGAACACCTCAGTTGACGGGGAGCTGGATGAGTATGCAGGTCTAATGACGGCCAGAGAGAAACAATGGCTCATCAATATCCAGATGTTGCAGCTGAACACCGGAACACCTTACATACATGACTTCTATTATACAGTTTTCCTCGAGAGACAGGCAAGCAAGGAAAAGGAAGGTGTGAAGGAGGCTCATAAGGCCAATCAACAGAACCATCCCTTCTACAGCGGAGGCAAGCAGGAAGACAGTCACGCCATGAGACAGAGAGAGAGGCACAACTCGCACAGACACAACTCCACCGGAGAAGATCCCAGGACATATGTCCCTACACAGTTTGAGAACTCCCTGGGGAAACTGCAGTGCGGTAGCGTGACGGCTCCGAGGAAAATTATAGACGTGGAAGTCGTGGGGGCGGAGCCCGAGCAGCGAGCGAGCAGGGCGCCCTCTGTGGCCAGCAACAACCCCACTGAGGTTCCGCGCGAGATGAGAAGGACCAAGCAACTGCTTCTGGATATTGAGGCGTTGTATCTCATACTGCTCAGACTGGAAGAGCTCAACGATCCCTTGGCAATATCTAACGCTTTAATATTGAAGGAAAGAGAAGAGAAGCAGAAGCAACTGGAAGCGGCGCAGAAGGAAGCAGAAGATGACGATGATGGAAACTTATTCCTTAAGAATATAGAATCTGTACAGAGACGACCCAAGCAGGAGAGTCCCAAGAGCGAGAGTATCGATAAGAGACAGGTGGTGAACCTGACCACGAACCAGAAACCTCAACCGGCCAAGAACCTGCTGGATGAAGACAAGGAGGACCTGCTCAATAAGATGTTCTCCGGACTCCTGCACGGAGAGAGAGTGCCGCAGATACTGGCGGTTAGGAAGGGGAAGTCGTTGCTAGCTCGTTTCCTGGCCCGCACCCCCGAGACTCACCCCCGTCTTCGTCCTCTATGGTCGAGGGTGCTCCGCTGTCTGCCGACCGCTGCTCGCCGCGACGAAGGCGGCGCCCTAGTGTCCCTGGAGCCCCACTTCCGGCGCTACGCTCTCGCGGCGCCCGGCTGGCCGGCGGTGGCGGAGACCTGCGCCGCGCTAGCGGAGGCCCTGGACCCCGCCCGCGGCCACCACGCGCTCGACACGCGACTGACTCTGAGCTGCGTCTGCGCGCTCACCGAGAAAGCGATGATGCTGGTGGGGGTGTCGGAGTCGTCCGGCGGCGAGCGGCAGTGGTACAGGTTCCTCAAGACGGTGGCGAAGGCCCTGAGACACGCGCCGAGCGTCGCCCCGCCCACCCGGCCCGTGGCGGAGGCCCGGCTCTCGGCGCACCTGAAGCGGCTGGAGGCCCGCGCGGGGCTCGAGATCCTGCAGAGAGGCGCCACCATCGAGCTGTCCGCCAAGGACGCCGCGGAACACCTCGTGAGGCACCTCTGCTGA

Protein sequence:

>DPOGS201958-PA
MADSFFGIDTSSSNLNDDEGGGEPSEDEYDALNDETFGQDSEEFDWEYEHEQLAGQLESSRRNAALDDADSRLEASLSQLVLDETDAPRSLGSSVWRHDVPFPTPTTPVQQPALKNVCTVEELERQLRQNQQQTYTQNYFQPRFPPVILQRPPGLQAPLPIPFAPQQSMAHNMNQMNQPLNKMIGQNSQINQIGQSNMMNHMNQNINQIGSNINQMNQNVNQMGQGVNHMGQNVMGQNQMGQNVMGQNQMGHNVNQFMQNSNQMNQFQNNQMAPAMMNQMHNMNLHPMNQNNQMIQNQMGQNMNQMVQNSGSNMNQMNQGGQNMNQMGQNMNQMGQNMNQMGQNMNQMGQNQMIPNGNQFGMNQFQQMMGQPRMMAPPPGMNMPRQNFGNNMNQFNTNFRGQMQSKNDQQISQQNMIMNHNKNQNQVKPNQLSPKQKPVQNLNHIQNMNQAQNNKLQKSRVYNNKSLTSQNLVQLIQNTHPMLNFNNSFHNASHHPILNRNHFNNQLMKHLMFDNRQNGNFGNTTSRANTSVDGELDEYAGLMTAREKQWLINIQMLQLNTGTPYIHDFYYTVFLERQASKEKEGVKEAHKANQQNHPFYSGGKQEDSHAMRQRERHNSHRHNSTGEDPRTYVPTQFENSLGKLQCGSVTAPRKIIDVEVVGAEPEQRASRAPSVASNNPTEVPREMRRTKQLLLDIEALYLILLRLEELNDPLAISNALILKEREEKQKQLEAAQKEAEDDDDGNLFLKNIESVQRRPKQESPKSESIDKRQVVNLTTNQKPQPAKNLLDEDKEDLLNKMFSGLLHGERVPQILAVRKGKSLLARFLARTPETHPRLRPLWSRVLRCLPTAARRDEGGALVSLEPHFRRYALAAPGWPAVAETCAALAEALDPARGHHALDTRLTLSCVCALTEKAMMLVGVSESSGGERQWYRFLKTVAKALRHAPSVAPPTRPVAEARLSAHLKRLEARAGLEILQRGATIELSAKDAAEHLVRHLC-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: