MonarchBase - Protein-coding gene

DPOGS203916
Transcript	DPOGS203916-TA	3315 bp
Protein	DPOGS203916-PA	1104 aa
Genomic position	DPSCF300005 - 689783-696447
RNAseq coverage	167x (Rank: top 51%)

Annotation
*Heliconius*	HMEL010370	0.0	52.44%
*Bombyx*	BGIBMGA000494-TA	0.0	42.11%
*Drosophila*			%
EBI UniRef50	UniRef50_F1R2R4	7e-10	35.71%	Si:dkey-39n1.3 n=5 Tax=Danio rerio RepID=F1R2R4_DANRE
NCBI RefSeq	XP_002742202.1	2e-10	38.71%	PREDICTED: restin-like [Saccoglossus kowalevskii]
NCBI nr blastp	gi\|293341395	2e-09	34.69%	PREDICTED: centrosomal protein 350kDa [Rattus norvegicus]
NCBI nr blastx	gi\|270003200	1e-18	29.78%	hypothetical protein TcasGA2_TC002404 [Tribolium castaneum]

Group
KEGG pathway
Orthology group	MCL26557		Lepidoptera specific

Nucleotide sequence:

>DPOGS203916-TA
ATGGATGCATCGGCATCCAACAAAACGAATCCCGAAAATAATTTATATGATCTTTATTTGAAAATTGAAAATCCCATCTACTCGGCTCGAGTTCCATATAATAAACCTGTAGTGAAATATACGCGCCTACCAGACTTCGATCTCAACACTAAAGAATCAACAAAAAGCGCTAAAAGTATAAAAAGTGCTGGGTCATCACCTAAATTTAGCTTAAGTAAAAAGTTATTAAACCCAAAGGAAAATGAAAAGGAGTGTACTCCCAAGAAAAACAAATTAAAAGAATACATCAACATTAAGGCACCACCAAAAACTGTTTTGGATAAGACAAAAAGAACTAAATCTCCACCTAATTTTAATCGTAACAAAATGTCTCTTATCAAAGATATTAAAGACAAGGTTAGACCGGTTTCTGTAATACATGTGCCACTTGATGATCATTTTCGCAAACGTGATATTGGAACTGAGGCTTCAGAGGTCATCATGAATCAAGCTGTACATTCTATTAATAATGTCACTACAGCGGTTCAGGCAGTTCCAGATGTGACATTTAAGGATGTAGAAATTTCAACAAATTTTACACCAGAGAAAGTGAATCAAATGACATCTGTTGATGAAGTGATAAGCAAATTAGGTAGTGAATGTAAGGATATCAAAGATACTTACGATAGTCTTGAAATACCAAATGTAAGCTTAATAAATAGTAAAACTGACTCGTCCAAAGACCTAGACATTGAAAAAAAAATTAATAATATACCGAACAGTTATGTAAAAGAAGAAAAAGAACATGATACTGATATTGTTAGAACGCCTAATATTGATAATGCTTCTTCGAATGTTAGCGATAAAGATAAAGACACTGTATACCATAAAAGTACATCATACATTATTGGTCGAGCTACCTTAACTTATACAACAAGACAGAAAATAAATTTTCACCTAGTAGAAAATAACGAAGTTTTGCACTCTAGGATCTCACCACGTTCATTAAATTATCCTTTGAACGTTGTTTCCGTACTGAAAAAGGAAATATCGAATCAGAAATACAATAACGATGACAAACTAAACTACAATAGCCAAGATAGTAAATCTGACGATGAAACAGAAACTCGTCTTACTCCTATTAACCGTTCTTATGCTCTCAAGAGTGAAAAATTAGTAAAACCATCAGATATAATTAGTACAATAAAACTTAATAACAATTTGTTACATAGAGACCTCTGTGGACAGTTTCAACGAGAACTTAATTTCATTGATTCATTTTTCGAGTCTCTTCAGTATTTAGATAGCTGTTCCTTATCTGATAGAAGTATAACAGAAAAAAAGGTTGAAAACTGGATTAGCGGCGGTGCCAATGAAGTGAAGAACTTTGAATTTGGATCATTTTTGTCACAATTCGAAAATGAATTTAATATTGACAACCCTAAAACAATGGCGTCCGAGAGTCTTTGTCTGCTCAATTTCCTCATTCAAAATGAGCAAATTAAAGCAGAATATCTATTGGATGCTTTGAAAATGCGTGAAGACGCTTTGAAACATTTTACGAAGTCGCAAATTTTGTGGTTGGAAGATAAGAAAAAACATGATCACACCGACATACCGACACTGAAAAAGAAACAAAGAGGTGCAATCATAAAACTTCAACACGAATGTGGTGAAATGCAGCGCATGCGAAAGGCTCTGTTGGCGTTGTCGGAACAACGTAAACTGGCATTGAAGAAAACAAAGAAGAACATAGAACTTAAATTAAGGAATAGCTCTGATGTGGAACAAATTATATTGGGAAAAAAGAAATTAAGACGTAATGTTTCTACAGATCGTAACAATGCACCTCTTAAATGTTTTGAATTGTCTAGCAGCGGCTGCGATGATAGCACTACATCGAGGCCCAAGTCAAACGCATCCATTGTACTGAACGACTTAAAGGCAGTGACGAGCGCCGAAAAGTGCGTTCAAACAGGTGAAAGCCTCCCCCTTACATCAGACCAATCAACGAACACCTTCGACGAGAATTTTGTAGTTGTTGATGGTAGCTACTTGAACATCGTTTTCCAAAATCTATCACCTCAGATCTTCAGCGCCGGTAAACAGTACGAAGTGAACAAGGACGCCCTGAAGAATATAGTCGATAAAAGTAATATGCACAATATTAATCAAAATAACGAAGTAGCGCTTGAAGAGTTTATGGATCATATAAAGAATCACGAGTTGGAATCGAGTTCACCGTCCACTGCGAGAAGTTTAGTGGATGAATTCGACCAGATTTACAAGACCTATTCCGATGATGATATCTCATACGAAGTCGGCCGTGCTCTTGTGGACGACATCAAAGAGGTTCAAGTTTCACCTGAAGCTGGAAACATCAAAAATGATGTTAAGACATTGGCTGTTCCGAGTGGGGGAGTTGATCGTTCAGTGTCCGTTGACGAATGCTGTAGTTGTGAGCCATTAGTAGCTAGTGTTGGGATTCAGGTGTCCAAAGGCAAGGAAGTGGCTCAAACTAGTGTGACGGGACCATTACCTATACCAGCTGGTGCTGCTTCCACTGATGATGTATCATCTGAAGTAGCCACTTGGTTGACGCAGAGATCATCGGTGAAGTCCACCGGTGCGAGCAGTTCGAGTAGTCAATCTCATAATCCTAGCATTTCGTCATTATCATCACCAGTTCAGTACGAGGCTGAAGAATTACGTCGTCAACAACTAGCCATTGAACGAGAGATTAAAGCATTAGAACAACAACAGTGTCAATTGTTGGCGTTGCGTGAGATACCGGACAAACCCCCACCACCGTACACGCCACCAACAGAACCACGACCGTTAAAATCTCTAAACAAGTTCATAGCTGATGACATCAATGAACAGAAAATACACAAGTTGCTTTTCCAACCTGGCAAGCAACTCGGCGAAACAGATGTATTTGAAGTATTTGTCAAAGACTTCTGCCAAGAGTCCATTGAAAGACAGAAGTTGGATAGAAGCGACAAATATTGGGACACATGCAATATGATACCGGTTAAACCCAAGCCGGACAAAGAGAAATTAGTAAAGAAAGCTGCTGCTGACCTAAAAGAAGTCTTGTCGGATGTACCACCTACCGTTGTTTCAGGTGTAGGAGCGAGGAGGTCAGACCACATAGATGATATATTGTTTGCCGAGTGGCGACGTTGTGAACCAGAGTGGACTTCGTTGCACGCAGACGAAGTGATTGTTAAAAATCAGGTGTTTGAAAGCATTTTTCAGAAGATACTATCAGAAACTGTCGACGAATATAAAAGAACTGTGCTCAGTAAACCAAGTGATGGATCTGTGCCATGA

Protein sequence:

>DPOGS203916-PA
MDASASNKTNPENNLYDLYLKIENPIYSARVPYNKPVVKYTRLPDFDLNTKESTKSAKSIKSAGSSPKFSLSKKLLNPKENEKECTPKKNKLKEYINIKAPPKTVLDKTKRTKSPPNFNRNKMSLIKDIKDKVRPVSVIHVPLDDHFRKRDIGTEASEVIMNQAVHSINNVTTAVQAVPDVTFKDVEISTNFTPEKVNQMTSVDEVISKLGSECKDIKDTYDSLEIPNVSLINSKTDSSKDLDIEKKINNIPNSYVKEEKEHDTDIVRTPNIDNASSNVSDKDKDTVYHKSTSYIIGRATLTYTTRQKINFHLVENNEVLHSRISPRSLNYPLNVVSVLKKEISNQKYNNDDKLNYNSQDSKSDDETETRLTPINRSYALKSEKLVKPSDIISTIKLNNNLLHRDLCGQFQRELNFIDSFFESLQYLDSCSLSDRSITEKKVENWISGGANEVKNFEFGSFLSQFENEFNIDNPKTMASESLCLLNFLIQNEQIKAEYLLDALKMREDALKHFTKSQILWLEDKKKHDHTDIPTLKKKQRGAIIKLQHECGEMQRMRKALLALSEQRKLALKKTKKNIELKLRNSSDVEQIILGKKKLRRNVSTDRNNAPLKCFELSSSGCDDSTTSRPKSNASIVLNDLKAVTSAEKCVQTGESLPLTSDQSTNTFDENFVVVDGSYLNIVFQNLSPQIFSAGKQYEVNKDALKNIVDKSNMHNINQNNEVALEEFMDHIKNHELESSSPSTARSLVDEFDQIYKTYSDDDISYEVGRALVDDIKEVQVSPEAGNIKNDVKTLAVPSGGVDRSVSVDECCSCEPLVASVGIQVSKGKEVAQTSVTGPLPIPAGAASTDDVSSEVATWLTQRSSVKSTGASSSSSQSHNPSISSLSSPVQYEAEELRRQQLAIEREIKALEQQQCQLLALREIPDKPPPPYTPPTEPRPLKSLNKFIADDINEQKIHKLLFQPGKQLGETDVFEVFVKDFCQESIERQKLDRSDKYWDTCNMIPVKPKPDKEKLVKKAAADLKEVLSDVPPTVVSGVGARRSDHIDDILFAEWRRCEPEWTSLHADEVIVKNQVFESIFQKILSETVDEYKRTVLSKPSDGSVP-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: