MonarchBase - Protein-coding gene

DPOGS213985
Transcript	DPOGS213985-TA	1932 bp
Protein	DPOGS213985-PA	643 aa
Genomic position	DPSCF300417 + 15887-20105
RNAseq coverage	401x (Rank: top 30%)

Annotation
*Heliconius*	HMEL011697	4e-116	40.38%
*Bombyx*	BGIBMGA008208-TA	4e-41	31.52%
*Drosophila*	XRCC1-PA	2e-39	28.90%
EBI UniRef50	UniRef50_D1ZZU6	1e-53	31.13%	Putative uncharacterized protein GLEAN_07398 n=3 Tax=Pancrustacea RepID=D1ZZU6_TRICA
NCBI RefSeq	XP_975029.1	4e-54	31.19%	PREDICTED: similar to DNA-repair protein XRCC1 (X-ray repair cross-complementing protein 1) [Tribolium castaneum]
NCBI nr blastp	gi\|270005349	4e-53	31.13%	hypothetical protein TcasGA2_TC007398 [Tribolium castaneum]
NCBI nr blastx	gi\|270005349	6e-62	31.72%	hypothetical protein TcasGA2_TC007398 [Tribolium castaneum]

Group
Gene Ontology	GO:0005634	3.1e-29	nucleus
	GO:0003684	3.1e-29	damaged DNA binding
	GO:0000012	3.1e-29	single strand break repair
	GO:0005622	3.9e-20	intracellular
KEGG pathway	tca:663907	1e-53
	K10803 (XRCC1)	maps->	Base excision repair
InterPro domain	[1-147] IPR008979	2.6e-35	Galactose-binding domain-like
	[1-145] IPR002706	3.1e-29	DNA-repair protein Xrcc1, N-terminal
	[338-423] IPR001357	3.9e-20	BRCT
Orthology group	MCL16977		Patchy

Nucleotide sequence:

>DPOGS213985-TA
ATGCCTCGAGTTAAAATTGATTACGTTGTGAGCATGAGCAGTGAGGACCCTGAAAATCCGGCAAACAATTTATTATCGTGGGAAATAAATAAAAAGAAATGGCTTTGTAAGACGGGGGAGACCTCTTGTTCAGTAGTTCTACAGCTGACTAAGGCTGTCCAGATAGAATCGATCACGATTGGAACATACCACACGTCTATGTTAGAGGTGTTAGTAGGATCATCAGAGAAGCCCAATGAAACCTTTGAGGTGTTAGTCCCGAGTTGTGTGCTGTGTTCTCCACGAGAGGCTCGCGGAGCACCAGTTGAGAGAGTGAAGAGCTTTACACGAGATGAACTGACATCTGTCCGACAGAGACGCTGGGACCGATTGAGACTAGTCTGCTCACAACCTTACAACAGACACTGCAAGTATGGAATCTCATTTGTTCATATCTTTGAACCGGAAAGTCCAACTCTGTCCGGTCACACAGCCTTGTCCATCTCTCGCACGTTCCGCCTCGAGGAGCTTGGTTCAGAGGATGAAGAGTTCCGTCCTGGGGAACTGTTCCATAAACACAAACAAGACCAGAAAACACATAATAGTACTGACGCACAAATCAGACAAGCTACGTCGCGGGCACTGAACAACATAGGCGACTCCTCCACCAGATTAACAAAGACGCCAATATCGAAAACTAGCAACAGACCGTCTGATCAAAGCTCGAATTATTCCACTCGAGAAAAGAGGAGTCTCATGTATACAGAGGATGACGAGCAACCACACCAGAAAATAGATAGAGTTATAGAAAGACATGGGAGAGAGAAACAGAGAGAAGATGGAAAAAAGAAAACTGACCAGGAGGCCAAGAAGAAGAAGACCGGCAGTAAGAGAGAAGAAAGTAAGGAAGATGAGAAGAACAAGGAGACAAAACATACAGACAATCGGACTCAGGACCAGACACATACTACATTAATGAATTCCACTAAAAGGAAACACTCCCAGGAAGCCCCATCCCGGGCTCCGGCCCGTCCCCTGTCTTCTCTTCTGTCGGATGTGGTGTTCTCTATTTCGGGATACGTGAACCCGCGTCGAGCGTCGGTCCGCGCGGCCGCTCTCCGGATGGGTGCGCACTACACGCCCGACGTCACCGCCGACTGCACACATCTCATCTGTGCCTTCCCCAACACTCCAAAACTCCGCCTGGTGCGGGGAAGTGTGGCCGTCGTCAAGGCCGAGTGGGTCGAAGACTGTCTGCGCTCGGGGACCAGGCTGAAGGAGACAACATACGACACGAGGGGAGGGGCGGGGGGGCGCCACCAGGACAGTGAGAGGACGGGAGACGGGGGAGGAGGAGGGAGGGGGCGATGTAGTAACGGTGACTCCGCAGAGACGGAGCATGACACGGACGACGAAATAGAACAAGTCATGCGACGACAAAAGAGAAAACGACTCAGTGAAGAGGAAGAAGAGGGAGGGGAGGAAGACCGGGATGTGATGTGCGACACGGACGAGGAGGACGGAGAACAGAGGCGGGAGGAGATAGACGCCCGTAAGGGCGTGTGTGTGCAGTCGCTGCCGACGTTCCTGGCGGGAGTGACGTTCTCCCTGTGCCCGGAGCTACCGGTGTGTGAGCGCGCGCTCCTGGAGCGGTACATCACAGCCTACGGCGGGGTGGTGCTGCAGGGGAAGAGGACGAAGGAGGCAAGGCGTGAGATTCACGAAGGCAAACTGCGGATGATGCGGATGGTAACAGTATGGTGTCGGCGGGAGGAGGATCGCGGAAAAAACTCTGGAACGGAGCTTGGTCAAGTAGGTCGACGAGCGCAGCACAACATTTTGACTGAACACTCTCTTCCGACTCCGTACGCAAGAAAGAAAATTGACGATAAGTTTATTACTGCCTGGAAACTTTTATTGGATGATAATATTCTGCGTCGTATAGAGAAGTAA

Protein sequence:

>DPOGS213985-PA
MPRVKIDYVVSMSSEDPENPANNLLSWEINKKKWLCKTGETSCSVVLQLTKAVQIESITIGTYHTSMLEVLVGSSEKPNETFEVLVPSCVLCSPREARGAPVERVKSFTRDELTSVRQRRWDRLRLVCSQPYNRHCKYGISFVHIFEPESPTLSGHTALSISRTFRLEELGSEDEEFRPGELFHKHKQDQKTHNSTDAQIRQATSRALNNIGDSSTRLTKTPISKTSNRPSDQSSNYSTREKRSLMYTEDDEQPHQKIDRVIERHGREKQREDGKKKTDQEAKKKKTGSKREESKEDEKNKETKHTDNRTQDQTHTTLMNSTKRKHSQEAPSRAPARPLSSLLSDVVFSISGYVNPRRASVRAAALRMGAHYTPDVTADCTHLICAFPNTPKLRLVRGSVAVVKAEWVEDCLRSGTRLKETTYDTRGGAGGRHQDSERTGDGGGGGRGRCSNGDSAETEHDTDDEIEQVMRRQKRKRLSEEEEEGGEEDRDVMCDTDEEDGEQRREEIDARKGVCVQSLPTFLAGVTFSLCPELPVCERALLERYITAYGGVVLQGKRTKEARREIHEGKLRMMRMVTVWCRREEDRGKNSGTELGQVGRRAQHNILTEHSLPTPYARKKIDDKFITAWKLLLDDNILRRIEK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: