MonarchBase - Protein-coding gene

DPOGS204491
Transcript	DPOGS204491-TA	4152 bp
Protein	DPOGS204491-PA	1383 aa
Genomic position	DPSCF300002 + 1265486-1278774
RNAseq coverage	858x (Rank: top 15%)

Annotation
*Heliconius*	HMEL011864	93.71%
*Bombyx*	BGIBMGA007835-TA	83.31%
*Drosophila*	sick-PB	62.36%
EBI UniRef50	UniRef50_Q9VIQ9	62.36%	Protein sickie n=32 Tax=cellular organisms RepID=SICK_DROME
NCBI RefSeq	XP_002064963.1	52.39%	GK14929 [Drosophila willistoni]
NCBI nr blastp	gi\|195433937	52.39%	GK14929 [Drosophila willistoni]
NCBI nr blastx	gi\|281365233	50.18%	sickie, isoform E [Drosophila melanogaster]

Group
Gene Ontology	GO:0000166	3.8e-05	nucleotide binding
	GO:0017111	3.8e-05	nucleoside-triphosphatase activity
KEGG pathway	dpo:Dpse_GA10476	0.0
	K01516 (E3.6.1.15)	maps->	Thiamine metabolism
			Purine metabolism
Orthology group	MCL10709		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS204491-TA
ATGGCAGTGACAACGTCTCCAACGACTTTTTATGGATCTCCAATCCACGATGGATTTGCAACTATTCGTGCACCCAGGAGTCGAATAAAGATAAGAAATCTAGTTGAACCAAATACCACATCTAACCTACCTCAAAGGCATTCCGAATATTTTACATTAAATAGATCAGCCAAAAACAACTTCTTAGAGAGCAGTTGCGGAGTGCAGTATGCAACTAATGGGTCACAAAGTATATATGTAGATAAACCTTCAAGAATAAGTTTTACTGAATCTATTTATGCCAAAGTATCTCCACCGCCTTCAAATAGGACGTCTCCGGCAAAATTTCTTAATGGTAGACAGAAAGAAGAAAGCCATTATGATTCTATAGATACTAAGCCTCGTAGGAGATTAAAAAGCCTAGAATTACCGAAAGAGACAGATCAAGAGAATGAGGAAAAAGTTATGATTGCTAGTTTCTTGAATAACGGCGAAGTGAGTCCGTATGAAATGTATATAGCTAACCAGGATACCGCAGAACAACATTCCGTCCGCACGAACACTACTGGATCATCCGTTGACTATAGAAAGAGAAATAGCGACCGGGATAACTGCTCGGAATCATCTTCATACGTAACCGATAACGACAGACCGATATCAAGTTACAGTGATAATTCTACGATACCATCCACCGACACGGAAGACGTATTAAAGGAATTACCGAGCAAATCAAGATTTCATAAATCACCCCAAAAGTATGCGACGTTAAATTTAAGGCGGCCAAAGTTTATAGATCTTAAGCCGCCGGGAGTAAACGATAACCCGTTTTGCGGCAGCCTACATCGAAATAAATTGGGATATCACTCAGAACCAAGCACTCCTTTATCTGGAGACAGTAATGATTTCACCGGCACTAAAAATTTTCAAAGTGGAGTTGAACAAATACCTAAAATGCCGTTACAGTATAATAGAAATGGCTTTAAAAGATCTGTTAGCGAATCAAATGGTTTCTCGAAACGATTAAATTATCGTCATTCCTTCAGTGCAGATTACAAACCACAGTCTGTCGTTAGACGACCTCATAAATGCTGTGAATGTGTAACCGGCGTACCAGCAGAAGATGATATCGATACTTCGCAAACTTCAAGAACTTTAGGAACATTATACGAATCTCAAGACCCAAAAGTTGGATGTCAAACAATCCTTAGATCGAAACCGCCTGTGCCTTGGTGGGAATTGGCAATAAAAAAATCTCGCTACAAGAGCTGTCCTATTTTAGAAGAGGCTCATGTCGTGTCCGCCTTTGAACAAAGTTTATCGAATATGACCCAGAGGCTGCATCAGCTGACGGCAACTGCAGAACGCAAGGATTCTGAGCTAACTGAGCTTCGGCAAACAATTGAGCTGCTTCGGAAGCAATCAATCCAAGCGGGTTTGACGACGGCGCACATGCAGTCCATGGGCATCCGAGCTGATGGCGTCAATGTTACCGGCCAGGAACCACCTCAAAATCAAACTCAACAGTCATCACCACAGAGATTGGCTCAAGGCAATGGTGCTATTACCCGCCACCTCTCTACAGATAGTGTCTCCAGTATTAATAGTTTGAGCAGCGGCTCATCAGTTCCTCACGATAAGAAACACAAGAAGAAAGGATGGTTACGGTCGTCGTTCACGAAAGCATTTTCGAGAAATGCCAAGATATCAAAAACAGCAAAGCATTCGTCCCTCGGGCAGCTGTCGTCACAGGACAGCTCATCGGGATCACACCATTATGATGACCCGCACACGATCCGAGAAGGAAGCAACGAAAATAGTCTCGAACATTCTCACGAAGTTCTTGACAATAGCAAAGATAAAACTACATGCCCTCCAGCCGTCGAAGAACAGACCAAAGAAAAAGCTGACCAAGCCGGTTTAGTGGATGAACTAAAACGGCAATTAAGAGAAAAAGACTTGGTGTTAACAGATATAAGACTGGAAGCGCTCAGCTCAGCGCATCAACTAGAAAGTCTCAAGGACACCGTAATCAAAATGAGGAATGAAATGCTGAATCTGAAACAAAACAATGAGCGGTTACAAAGGTTAGTGACATCTCGGTCGCTGGCCGGCAGTCAGAGCTCGTTAGGTACAGGCGGCTCCGCGGTTGAGGACCCCAGACGGTTCAGTCTGGCTGACCAGGCTACCATGCATCAGGCGGCTATGGACATTCACTCACAACCTTTAGATTTAGATTTCAACTGTATGACGTCTACACCTTCTCGTGATCTATCTAAAAAAGGATCACCCAAGTCTAGTATGATGGAACCAATATACGGTAATAAAGCTGTTTGCGAACTAAACGAAAACAGTGAAGCCTTACTTGGAGCGCTAAATGGTGCTAGTGATATGTTTAGTAATGGTTTAAGCGGCGGAGAAAGGATAAGCGGAGATTATGATATCAATACCGTTTTACCACCACCCAAGAGCCGAGAGCTGGCGATAGGGGAAAGTTACTCAGATATCGGTGTCGCTGATAGTCAAGGCGATACAACGGACGGTAAGAAAATTGCGATAGCTGTGTATTTGGGCCAACCGGAAACATTCCAAAGATATTTCGAGGAAGTGCAAGACACGTTAACCGAATCAGAATGTAGATTTTATGCGAAACAGAGCGCCAACGCTTTTAATAACCATTTCGATAAACAGCCCAGCTTCGATTCACCGAGGATGTCACAGAATCACAGTCCGGAAATAGAAACGCTGGATTACCAACAAACTATAAACAAATCCAACACCAATAGCCTCAAAAGCAATAAATCTACGCACAGTAATTCCTATAAGAACGTATATAATAGTGATTCGACAATAAATTGCAATGAGTTTACTATTGCGTTTACATATATATCTGGCAAAACAACTTGGCAGAATTTAGATTATATAGTTAGGAAAACGTTTAAAGACTACCTGTCGAGGATAGATCCTGGCACGAATCTTGGTCTCAACACCGATTCGATAACGTCCTACCATTTGGGAGAAGCGACGAGAGGTCCGGAGATATGTTTCCCTGAACTACTGCCTTGTGGCTATATAATTGGAACTGTAAATACTCTATACATTTGTCTGCAAGGAGTAGGGAGCTTAGCTTTTGATAGCCTTATACCAAAAAATATAGTTTATAGATACGTTTCGCTTTTGTCGGAACACCGGAGGGTAATTCTTTGCGGCCCGAGCGGTACTGGAAAATCATACTTGGCAGCTAAATTGGCGGAATTTTATGTACAAAGGACGCAGCGAAGAGGAAATCCAGTAGAAGCCGTAGCTACATTCAACGTGGATCGGAAGTCGTGCAACGAATTGCGCGCGTACCTTGGGAACATCGCAGAGCAGTGCAGTGGAGCTGCAGCTGGAGAGGAGGCGCTGCCTGCCGTTGTAGTGCTCGATAATCTGCAACACGCCTCGGCTCTCGGGGACGCCTTTGCGGGTCTTTTGCCGCCAGACAACAGGAACATGCCAGTCATTATAGGTACCATGTCACAAGCAACATGCAATACGACAAATCTTCAGCTACATCATAACTTTAGATGGCTGCTGACCGCCAATCACATGGAGCCAGTTAAAGGGTTCTTAGCAAGATATCTTCGTCGAAAACTATTTTCTCTGGAACTGAGACTGGGTCGCCGCGAGCCAGCCCTTGCAGCGGTTCTGGAATGGCTGCCCGGTGTGTGGTCAACCCTTAATGCCTTTCTGGAAGCGCATTCCTCGAGTGACGTTACCGTCGGACCTCGGCTGTTCCTTGCTTGTCCCATGGACTTAGAAGCTAGCCAGGCTTGGTTTGCGGATGTATGGAACTACAGTATAGTTCCGTACGCATCGGAGGCTGTACGCGAGGGAGTTGCACTGTACGGACGGCGACGACACGCCGCCGTGGACCCTCTACAACACGTCAAGACAACCTATCCATGGAGAGAACCAAACCATTCACATACGTTACGACCGATATCAGTGGAAGACGCAGGTATTGAAGAATCGAATCAAGATGTAACCACTACCAACAATCAAGATCCACTGTTGAATATGCTAATGCGGCTACAGGAAGCAGCTAATTACAGCGGTAACCAAAGTCAGGATTCCGACAACGCTAGCATGGACTCAAATCTAACACATGACAGCTCCATGGGCAACGAGCTTTAA

Protein sequence:

>DPOGS204491-PA
MAVTTSPTTFYGSPIHDGFATIRAPRSRIKIRNLVEPNTTSNLPQRHSEYFTLNRSAKNNFLESSCGVQYATNGSQSIYVDKPSRISFTESIYAKVSPPPSNRTSPAKFLNGRQKEESHYDSIDTKPRRRLKSLELPKETDQENEEKVMIASFLNNGEVSPYEMYIANQDTAEQHSVRTNTTGSSVDYRKRNSDRDNCSESSSYVTDNDRPISSYSDNSTIPSTDTEDVLKELPSKSRFHKSPQKYATLNLRRPKFIDLKPPGVNDNPFCGSLHRNKLGYHSEPSTPLSGDSNDFTGTKNFQSGVEQIPKMPLQYNRNGFKRSVSESNGFSKRLNYRHSFSADYKPQSVVRRPHKCCECVTGVPAEDDIDTSQTSRTLGTLYESQDPKVGCQTILRSKPPVPWWELAIKKSRYKSCPILEEAHVVSAFEQSLSNMTQRLHQLTATAERKDSELTELRQTIELLRKQSIQAGLTTAHMQSMGIRADGVNVTGQEPPQNQTQQSSPQRLAQGNGAITRHLSTDSVSSINSLSSGSSVPHDKKHKKKGWLRSSFTKAFSRNAKISKTAKHSSLGQLSSQDSSSGSHHYDDPHTIREGSNENSLEHSHEVLDNSKDKTTCPPAVEEQTKEKADQAGLVDELKRQLREKDLVLTDIRLEALSSAHQLESLKDTVIKMRNEMLNLKQNNERLQRLVTSRSLAGSQSSLGTGGSAVEDPRRFSLADQATMHQAAMDIHSQPLDLDFNCMTSTPSRDLSKKGSPKSSMMEPIYGNKAVCELNENSEALLGALNGASDMFSNGLSGGERISGDYDINTVLPPPKSRELAIGESYSDIGVADSQGDTTDGKKIAIAVYLGQPETFQRYFEEVQDTLTESECRFYAKQSANAFNNHFDKQPSFDSPRMSQNHSPEIETLDYQQTINKSNTNSLKSNKSTHSNSYKNVYNSDSTINCNEFTIAFTYISGKTTWQNLDYIVRKTFKDYLSRIDPGTNLGLNTDSITSYHLGEATRGPEICFPELLPCGYIIGTVNTLYICLQGVGSLAFDSLIPKNIVYRYVSLLSEHRRVILCGPSGTGKSYLAAKLAEFYVQRTQRRGNPVEAVATFNVDRKSCNELRAYLGNIAEQCSGAAAGEEALPAVVVLDNLQHASALGDAFAGLLPPDNRNMPVIIGTMSQATCNTTNLQLHHNFRWLLTANHMEPVKGFLARYLRRKLFSLELRLGRREPALAAVLEWLPGVWSTLNAFLEAHSSSDVTVGPRLFLACPMDLEASQAWFADVWNYSIVPYASEAVREGVALYGRRRHAAVDPLQHVKTTYPWREPNHSHTLRPISVEDAGIEESNQDVTTTNNQDPLLNMLMRLQEAANYSGNQSQDSDNASMDSNLTHDSSMGNEL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: