MonarchBase - Protein-coding gene

DPOGS214746
Transcript	DPOGS214746-TA	3387 bp
Protein	DPOGS214746-PA	1128 aa
Genomic position	DPSCF300022 + 678318-687773
RNAseq coverage	735x (Rank: top 18%)

Annotation
*Heliconius*	HMEL012076	88.67%
*Bombyx*	BGIBMGA004740-TA	78.99%
*Drosophila*	pic-PA	62.34%
EBI UniRef50	UniRef50_Q16531	64.14%	DNA damage-binding protein 1 n=82 Tax=Coelomata RepID=DDB1_HUMAN
NCBI RefSeq	XP_001607743.1	68.39%	PREDICTED: similar to DNA repair protein xp-e [Nasonia vitripennis]
NCBI nr blastp	gi\|307186138	68.97%	DNA damage-binding protein 1 [Camponotus floridanus]
NCBI nr blastx	gi\|307205760	69.12%	DNA damage-binding protein 1 [Harpegnathos saltator]

Group
Gene Ontology	GO:0005634	2.3e-81	nucleus
	GO:0003676	2.3e-81	nucleic acid binding
KEGG pathway	nvi:100114761	0.0
	K10610 (DDB1)	maps->	Ubiquitin mediated proteolysis
			Nucleotide excision repair
InterPro domain	[780-1087] IPR004871	2.3e-81	Cleavage/polyadenylation specificity factor, A subunit, C-terminal
Orthology group	MCL13132		Single-copy universal gene

Nucleotide sequence:

>DPOGS214746-TA
ATGGCTTATCATTACGTAGTTACCGCACAGAAGCCTACAGCAGTTATATCATGTATCACAGGAAATTTTACATCACCTACGGATCTGAACCTTCTAGTGGCGAAGGTGTCTCGCCTGGAGATGTACCTAGTAACTCCAGAGGGACTGAGACCTATGAAGGAGGTTGGGCTGTATGGGAGGGTGGCTAAGATGAAATTATTTAGACCACCGTATGAGCAAAAAGATTTAGTATTCATACTGACGGCTCGTTACAATGCTATGATACTGGAATGGAGGACAGGGGCTAACGGGGAGCTGGAGGTAGTCACCAGAGCTCATGGCAATGTTGCCGACCGTATCGGCAAACCATCGGAGAACGGAATTCTGGCAGTCATAGACCCACAAGCCAGAGTGATCGGACTCAGGCTATATGATGGATTATTTAAAATAATACCACTGGATAAAGATTCTACTGAGCTCAAAGCTGCTAGTTTAAGATTAGAAGAGCTGAATGTGTACGACTTAGAATTTCTGCACGGATGCTCAAATCCAACATTAATTTTAATTCATCAGGATCTCAATGGAAGACATATTAAGACCCATGAGATTAATTTAAGGGACAAAGAATTCATGAAGATACCATGGAAGCAGGACAATGTGGAGACAGAGGCTTCAATTCTCATTCCAGTTCCAAGTCCACTTGGTGGTGCTATTGTGATTGGTCAAGAATCTATTGTGTATCATGACGGACAAAGTTATGTAGCAGTTGCACCGCCACAGATAAAGACCCCTATCAACTGCTACTGCCGCGTGGACGTTCGCGGTCTGCGCTACTTGCTGGGCGACATCGCCGGCCGCCTATTCATGCTGTTGTTGGAACTGTCGGAGCGAGATGGCACAGCCTCTGTCAGGGACCTCAAAGTTGAACTGCTCGGTGATATCCCGATACCCGAGTGTATGACTTATTTGGACAACGGCGTGGTGTTCGTGGGGTCTCGCTTGGGGGACAGCGCCCTGGTCCGGCTGGCCGCGGTGAGGGACGACGCCTCGCAGTACGTGCAGCCCATGGAGACCTTTACCAGCCTCGCGCCCATCGTCGACATGTGCGTCGTGGACCTCGAGCGCCAGGGACAGAACCAACTCATCACGTGCTCCGGTGCGTTCAAGATGGGTTCGCTGCGTATAATACGGAACGGGATCGGCATCCAGGAGCAGGCGTCCATAGACCTGCCCGGCATCAAGGGCATGTGGGCGCTCACACTCGGCCAGGGACCGCACCACGACACCCTCGTACTGTCCTTCGTGGGACAGACTCGTGTGCTGACTCTAAACGGCGAGGAGGTGGAGGAGACAGAGATAAAGGGTTTCGTGTCGGACAGACAGACATTCTTCACCGGGAACGTGTGCCACGACCAGCTGATCCAGGTCACCGACGAGGGTATACGACTCATAGGACGCGGGCCGGGTGGCTGGAACGGAGTCGCCGCCTGGGCCCCCGCAGGCCGAGCGGTGTCCGTGGTGTCGTGTGGAGAAACGCGGGCCGTGGCCGCCGCTGGGCTGAGGATATACCTCGTGGCCATAAAACAGGGGGCGCTGGAATTGATTTCTGAGGTGTGCATGAACGAGGAGGTGGCCTGCCTGGACCTGGGCCCGGGAGGCGAGGAGGCCCTGCTGGGTGTTGGGCTATGGACTGATATATCCGTCAGAGTGCTCAAGTTACCGGACCTCCGACCACTCCACACGGAGAAACTCTCTGGAGAGATAATCCCGCGCTCTCTTCTCATCTGTGTGTTGGAGGGCGTGTGTTATTTGCTGTGCGCGTTGGGTGACGGCTCTATGTTCTACTTCACCGTAGACCCGGACAGCGGAGTGCTCACCAACAAGAAGAAGGTCACACTTGGCACGCAGCCCACAGTACTCAGGAGCTTCAGATCGCTGTCAACGACCAACATCTTCGCGTGCTCTGATCGTCCAACAGTTATATTTTCGTCCAACCACAAGTTGGTTTTCTCCAACGTTAATCTCAAGGAAGTGGCCCATATGTGTTCACTCAACGCCGTGGCTTATCCCGACAGCTTGGCTCTAGCCACGGACAGCACAGTGACCATCGGTACCATAGATGAAATACAGAAGCTGCACATCCGAACCGTGCCCCTGGGGGAGACGCCCAGACGCATCGCGTACCAAGAAGCTTCGCAGACGTTCGGCGTGATCACGATGCGCGTGGACAAGGTGGAGTGGACGGGCGGGTGCGGCTCGCTGGTGCGGCCCTCGGCCTCCACGGCCGCCGCTTCCGCCTCGGCCGCCGCCCCGCCCTCCAAGCACGCGCCCGCCCCGCTCGACCTCGAGCTCCACAACCTGCTCATACTGGACCACCACACCTTCGAGGTCCTCCACGCTCATCAACTGCTGGCCAACGAGTTCGCCATGTCGCTAGTGTCGTGCAAGCTGGCCGACGATCCCAACCACTACTACGCTGTGGGCACCGCCATACTCAACCCCGAGGAGTCGGAACCCAAACAGGGGAGGATTCTCTTATTCCACTGGTGCGAAGGAAAACTCACTCAAGTTGCTGAAAAAGAAATCAAAGGAGGTTGTTACACGTTGGTGGAGTTCAATGGAAAGTTACTAGCATCCATAAATAGCACTGTTAGATTATTTGAATGGACTTCGGAGAAGGAGTTGAGATTAGAATGCAGTCACTTCAACAATATTGTGGCCCTGTACCTCAAAGTCAAGGGCGACTTCATACTTGTGGGAGATCTCATGAGGTCCATGTCTTTGTTGCAGTACAAGCAGATGGAGGGTTCCTTTGAAGAGATAGCTCGTGACTACAGCCCCAACTGGATGACGGCCGTCGAGATCCTAGATGACGACACCTTCCTCGGGGCCGAGAACAGCTTCAACCTCTTTGTATGCCAAAAAGACAGCGCGGCCACGACCGATGAAGAGAGGCAGCAGATGGGCTACATGGGTCAGTTCCACGTCGGTGACATGGTGAACGTGATGAGGAGGGGCGCTCTGGTCGCTCAACTCGCAGACACCGCCGCGCCCGTCGCCCGACCCGTCCTGCTGGCTACCGTCTCCGGCGCTATATGTCTGGTTGTGCAATTATCACAGGAACTATTTGATTTCCTTCACCAACTAGAAGAGAGGCTCACACACACCATTAAATCGGTGGGCAAGATCCCTCACTCGTTCTGGAGATCCTTCAACACTGATATCAAAACTGAACCAGCCGAAGGGTTCATCGACGGTGACCTGATAGAAAGTTTCTTAGATCTCTCCAGAGACATGCAGCAAGAAACCCTGCAAGGATTACAGATTGACGACGGCGGTGGCATGATGAGAGATGCCACAGTTGATGATCTCATCAAAATAGTGGAGGATCTCACCAGGATACATTAG

Protein sequence:

>DPOGS214746-PA
MAYHYVVTAQKPTAVISCITGNFTSPTDLNLLVAKVSRLEMYLVTPEGLRPMKEVGLYGRVAKMKLFRPPYEQKDLVFILTARYNAMILEWRTGANGELEVVTRAHGNVADRIGKPSENGILAVIDPQARVIGLRLYDGLFKIIPLDKDSTELKAASLRLEELNVYDLEFLHGCSNPTLILIHQDLNGRHIKTHEINLRDKEFMKIPWKQDNVETEASILIPVPSPLGGAIVIGQESIVYHDGQSYVAVAPPQIKTPINCYCRVDVRGLRYLLGDIAGRLFMLLLELSERDGTASVRDLKVELLGDIPIPECMTYLDNGVVFVGSRLGDSALVRLAAVRDDASQYVQPMETFTSLAPIVDMCVVDLERQGQNQLITCSGAFKMGSLRIIRNGIGIQEQASIDLPGIKGMWALTLGQGPHHDTLVLSFVGQTRVLTLNGEEVEETEIKGFVSDRQTFFTGNVCHDQLIQVTDEGIRLIGRGPGGWNGVAAWAPAGRAVSVVSCGETRAVAAAGLRIYLVAIKQGALELISEVCMNEEVACLDLGPGGEEALLGVGLWTDISVRVLKLPDLRPLHTEKLSGEIIPRSLLICVLEGVCYLLCALGDGSMFYFTVDPDSGVLTNKKKVTLGTQPTVLRSFRSLSTTNIFACSDRPTVIFSSNHKLVFSNVNLKEVAHMCSLNAVAYPDSLALATDSTVTIGTIDEIQKLHIRTVPLGETPRRIAYQEASQTFGVITMRVDKVEWTGGCGSLVRPSASTAAASASAAAPPSKHAPAPLDLELHNLLILDHHTFEVLHAHQLLANEFAMSLVSCKLADDPNHYYAVGTAILNPEESEPKQGRILLFHWCEGKLTQVAEKEIKGGCYTLVEFNGKLLASINSTVRLFEWTSEKELRLECSHFNNIVALYLKVKGDFILVGDLMRSMSLLQYKQMEGSFEEIARDYSPNWMTAVEILDDDTFLGAENSFNLFVCQKDSAATTDEERQQMGYMGQFHVGDMVNVMRRGALVAQLADTAAPVARPVLLATVSGAICLVVQLSQELFDFLHQLEERLTHTIKSVGKIPHSFWRSFNTDIKTEPAEGFIDGDLIESFLDLSRDMQQETLQGLQIDDGGGMMRDATVDDLIKIVEDLTRIH-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: