MonarchBase - Protein-coding gene

DPOGS201081
Transcript	DPOGS201081-TA	3669 bp
Protein	DPOGS201081-PA	1222 aa
Genomic position	DPSCF300185 + 79382-86733
RNAseq coverage	274x (Rank: top 39%)

Annotation
*Heliconius*	HMEL017885	0.0	69.20%
*Bombyx*	BGIBMGA001390-TA	0.0	64.47%
*Drosophila*			%
EBI UniRef50	UniRef50_E2C2S8	7e-64	32.13%	Tumor suppressor p53-binding protein 1 n=2 Tax=Formicidae RepID=E2C2S8_HARSA
NCBI RefSeq	XP_321661.4	5e-50	37.91%	AGAP001466-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|307196038	2e-63	32.13%	Tumor suppressor p53-binding protein 1 [Harpegnathos saltator]
NCBI nr blastx	gi\|307196038	2e-67	24.76%	Tumor suppressor p53-binding protein 1 [Harpegnathos saltator]

Group
Gene Ontology	GO:0005622	1.5e-23	intracellular
KEGG pathway
InterPro domain	[949-1117] IPR001357	1.5e-23	BRCT
Orthology group	MCL20676		Insect specific

Nucleotide sequence:

>DPOGS201081-TA
ATGGAGGATTCCAGTGATAACATTATCACTTTTAATTCATCAGCAGGAGATTCAGAGACGAAGACAGAGGTGCCCGTAAGTCCCGACAAACCCAAGGATATATCTCAGAACCTCTTCCCCGAGAGTCCGGTGTATGAACCTGATGATGAAGTAAAATGCATTGAGGATGACAGCAATATGAATGATCAGGTCGAAAAAGATGACAACCCCGTCCACGCTAAACGGAAACTCTCAGAGGAAACATGTGATAACAACGCTAAAATACTTAAACTGGATCTGACGGAAGACGAAGTTACTGTGACGACGCAGACCTTGGACGACGAGGTGTCGGAAATCAATGATGTGGGAAACCAGAATGAGGAACTACCCTCGACATCGCGCGCGCGGACGCCAGTGCGGTCGAGTCCTGGGAGGAACAAGAGAAGCAACAGCGTCGAAGTCACCCCAAAAACCCCAAAATCTCGATCCGCCAGTGTCGAAGTCGTCGCCAAGAACCCAAGAACCCCAAAATCTAGATCCGCCAGTGTCGATGTCGCCCCTAAGACCCCAAAAACCCCAAAATCCAGGTCCGCCAGTGTTGACTTATCTAAAGCTCAGACGCCCCGCAGAGTACCGTTAGATTTATTAGCAGAAAAAGACGATGACGTCATTATACATTCCGATGACAGTTCAAGCCGACTGAGCGTGGAGTTCGTTAGAGAACTACCAGCGCGGAAACTACCGGACACCATCCCAGAAGAAAGCGGCTCCGAACTCAACGATTCGCAGAACTTCCATTTAATTCTGTCGCCGGTCGAGAACTATGACCCGAATGATAACGAGAAATCGAATGCAGACACGAACTACGATACTGAGAAAGTGACCGGCAAAGAGAGGGAAGTTATTGATGCTGGGAAGGTTGCGACTAGAAGCGGCTACAACTACTCCGAGATGAGCAGCGTCACATCTCAGGCACCAAACGACTGTAAGGAACGTGCGACGGACCAGGAGAGCACGGATAGCATAGGGTCGATGGGCCTCGACAGCCCCGAACCAGTTGCTAGCGTCGCTTCCAAGCTCATATCCAAGCTGTCTAACGGAAACTCATCCACACCGACGGACGTCAACGATCCGGCTCAAGAAATAACCCCCGATATGTGCAAGCTGAATGGGAACAAGGGGAAACGGGGGAAAAACGAATCGTTCAGGGTCAGCAACACGACGACGCCGTCCACCATCTCGCCTTTGCAGAACGGACATTCCTTGCCTATAAGCACACCCCTGATACCTGTTTTCGACGTACATGTCAGTCACAACGAGGACTGCGAGTTCCTGTCGCTGTACGTCGTTAGAACCGACAACGACGTGGGCATGGACATGTGCAGGGAGTACCAAAGAATATCGAAGAGGTTCACCATAGATCCTTACTTAGGCGACGTGTCGGTCAGTAACTCCCCGTCCAGCGTCACGAGCGGCGGACTCATGAGTTTGCCGAACAGAACCTCCTTCGCCTCGACTATTAGTTCAACGTCATCATCCAGCACTCGCACCAGTGACGGAGCCTTCGTGGTCCCCCCACCTCCGAGGAAATCCGTATCCAACCCTACAACCACCGTAAAAGGTTACGAGGCACTGATGAAAAAACTGCAAGACATATTTTCGCACATCAGAGACGCGTCCATAGAAGCGAACCGATCTCTCAACGACGACAAAATATCCGTCGGCATTCAGGCTTCCATATCCGAAGCTACCTTCAGCAACGGCAACGCGAGTCCAGAAGAGGTCAGCAAGTGTGACAAAGCGACGCCGAAGAGCTCGCTCAAAAAGACACGAGTGAGAGGACGAAGGCCGATAGCGGGGAAAACTAAGAGAGCCTTGCTGCCCACGCAACACGAAGAAGCGGAGTACATGCAGGGAATGAACTCACCGGAAATGATTCCCAGCAACGGAGACACCGGGAAGATATCACCGAAAGAGGAAAAGCCCGCTGTTGTCGGAACACCGAAGTCGGTTAGCAAGTTAAAACAAAAACGTAGACCTCCCTCCCCGCGGCCGGCGACTCCGGTCGAGAAGGCGATCGCGAAGCCCGAGTACCCCGGCTTTGCACCGGACACGGTAGTCCTGGCCAAATGGGTGGACAAGAGATACTATTCCGGAAAAGTACTAGAGATCACCGAACCCAACAAGTATCTGATCAAGTTCGACGACGGTCAGAGCAAAGTCCTCCTGGACGACTTCATAATATTCGGCGACATGAAGAAGCTGCCGCTGCAAGGACAGTCGGTGTACGCGCTGGTCGACGAGGAGTTGAACTACGAACCGGGACTGGTGCTGGGGGTGGAGGAGAACGGTAGCGGCACGGTCACCTACAGATGCACCACCGACGGGGACACGATAGTAGTGGTGACGGCGAGCGAGTTATATCTCACCGAAGACCAGGCCAGGTCGCTCAAGGAGTCCAGGGCCAGGTCACCAGCAACGCCGACCACGCCCAGGCGGAGACATCACAGAGAGCTAGACCTCGATAATATTATACAGGGTCCTCGCAGTGCAAGAAGTCGAGACAAAGGCAGCTCCAGTGCAAGAAAACGAGTGGCGTCACCCAAAAGTCCCAAAGCATCTACCTCAGGTGTTAAAACGAAGAGCATAGCTCGCAAGCGTCTGGCTAGCGAAAGTAGCGAGTTGAGTGAGAACAGCAACTCGGCGCCGGCCAGGATCGAGGAGGTCGCTGGGGTGGAGCCCGAGGTGCAGCGGACGCCGAGGAAGATAGACGGAGTTAAGGCCGGACCCCTTCAGTTGAAGGGAGCGGCCAAACAGAACATTGGGAAGAAGAATTCTAAGCTGACGAAGTTTGAAAACGATGAAGATACTATCTCAGCGCTGGGGCCCATCCCCACCGACAGCAAGATGTTCGCTGGCTATTGTTTCCTTCTAACATGTACGGAACCACCGAAGAAGAATAGAGTGACGGACAGGAAGGAGAAACAGATGAACCAGGACAGCCGGCATTACTCCTCGGAGGAAGACGGCGAGAGCACAGCCGCTGGGACGGACACGGAGGACCTGGTGTTCTGTGAACGACCCTACAACAAGGAACGACTGCGGGAACAGCTGGAAACAGCTGGAGGAGTTGTTTACAGTCATTTCGACGACGTGCCAAAGACGAAGTACCCGCAATGCTACCTGATATCGCCCCGTCCCTGCCTCACCGCTAAGTACATCTCCTGCCTGGCCGCGGCGATAAAGGCCGTGTCCCACGACTGGGTGATACAATCTTGCATGGTGGGTCACCTGCTGGATGTGGACTCGTTCGTGCTGCCCACCGGCTGGAGCTTAAAGAAGTCATCATTCGTTAATTGGACGACATCATCTGGCAAAAGAAACACGACCTTCAAGGACAAGATAATACTCCTGTGCGGAGATCAAGATACATTTGTTAAGTTCTGGGAGCGCGTCTGCACGTTGGCCGGCGCTACGACAAGAATTGTCAATGAAGATAACTTAAATATGACCGGGGCCATTGCCCTGGTGACCGAGTGGGACTGTCCTCATGAAGTACAGAATAAAGCGAACCAGGATAACATACCGCTGGTGTCGACGACCTGGGTGGTCCAGTGCCTGATTGAGGGCAAGGTCGTCGCCCCCACCGCCTTGGACAAGTTCTCATTTATGTACGCGGAGCCCGAATGA

Protein sequence:

>DPOGS201081-PA
MEDSSDNIITFNSSAGDSETKTEVPVSPDKPKDISQNLFPESPVYEPDDEVKCIEDDSNMNDQVEKDDNPVHAKRKLSEETCDNNAKILKLDLTEDEVTVTTQTLDDEVSEINDVGNQNEELPSTSRARTPVRSSPGRNKRSNSVEVTPKTPKSRSASVEVVAKNPRTPKSRSASVDVAPKTPKTPKSRSASVDLSKAQTPRRVPLDLLAEKDDDVIIHSDDSSSRLSVEFVRELPARKLPDTIPEESGSELNDSQNFHLILSPVENYDPNDNEKSNADTNYDTEKVTGKEREVIDAGKVATRSGYNYSEMSSVTSQAPNDCKERATDQESTDSIGSMGLDSPEPVASVASKLISKLSNGNSSTPTDVNDPAQEITPDMCKLNGNKGKRGKNESFRVSNTTTPSTISPLQNGHSLPISTPLIPVFDVHVSHNEDCEFLSLYVVRTDNDVGMDMCREYQRISKRFTIDPYLGDVSVSNSPSSVTSGGLMSLPNRTSFASTISSTSSSSTRTSDGAFVVPPPPRKSVSNPTTTVKGYEALMKKLQDIFSHIRDASIEANRSLNDDKISVGIQASISEATFSNGNASPEEVSKCDKATPKSSLKKTRVRGRRPIAGKTKRALLPTQHEEAEYMQGMNSPEMIPSNGDTGKISPKEEKPAVVGTPKSVSKLKQKRRPPSPRPATPVEKAIAKPEYPGFAPDTVVLAKWVDKRYYSGKVLEITEPNKYLIKFDDGQSKVLLDDFIIFGDMKKLPLQGQSVYALVDEELNYEPGLVLGVEENGSGTVTYRCTTDGDTIVVVTASELYLTEDQARSLKESRARSPATPTTPRRRHHRELDLDNIIQGPRSARSRDKGSSSARKRVASPKSPKASTSGVKTKSIARKRLASESSELSENSNSAPARIEEVAGVEPEVQRTPRKIDGVKAGPLQLKGAAKQNIGKKNSKLTKFENDEDTISALGPIPTDSKMFAGYCFLLTCTEPPKKNRVTDRKEKQMNQDSRHYSSEEDGESTAAGTDTEDLVFCERPYNKERLREQLETAGGVVYSHFDDVPKTKYPQCYLISPRPCLTAKYISCLAAAIKAVSHDWVIQSCMVGHLLDVDSFVLPTGWSLKKSSFVNWTTSSGKRNTTFKDKIILLCGDQDTFVKFWERVCTLAGATTRIVNEDNLNMTGAIALVTEWDCPHEVQNKANQDNIPLVSTTWVVQCLIEGKVVAPTALDKFSFMYAEPE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: