MonarchBase - Protein-coding gene

DPOGS204490
Transcript	DPOGS204490-TA	3471 bp
Protein	DPOGS204490-PA	1156 aa
Genomic position	DPSCF300002 + 1228875-1260440
RNAseq coverage	472x (Rank: top 26%)

Annotation
*Heliconius*	HMEL014689	0.0	78.10%
*Bombyx*	BGIBMGA007834-TA	0.0	87.18%
*Drosophila*	sick-PB	7e-60	42.49%
EBI UniRef50	UniRef50_F4WXJ5	1e-72	36.27%	Protein sickie (Fragment) n=1 Tax=Acromyrmex echinatior RepID=F4WXJ5_ACREC
NCBI RefSeq	XP_967205.2	9e-79	56.34%	PREDICTED: similar to neuron navigator 2 [Tribolium castaneum]
NCBI nr blastp	gi\|189241497	2e-77	56.34%	PREDICTED: similar to neuron navigator 2 [Tribolium castaneum]
NCBI nr blastx	gi\|189241497	7e-136	37.75%	PREDICTED: similar to neuron navigator 2 [Tribolium castaneum]

Group
KEGG pathway
Orthology group	MCL17381		Insect specific

Nucleotide sequence:

>DPOGS204490-TA
ATGGGTAATACAAATTCGGGGCAAGGACATTCACGTCATCACAACAAGAGTAGGAAATCGAGGAGTTTGCCAACTTCGCCAGAAGTGAGAAGACAAGTCTCTGTGCTGCAGACGTCTATCCCTCTGCCGGCGTCTGCGGCGGCGGTGAGACGCGCTCCACCCGACAAACGACCTCTGCCAGCGACCCCTGTACACGGAAAGAGTGGGCTCTCAGCGAGCTCAAGTCGGTCAACAAGTCCTCTTGGTCAAGGAGCAGTAAGTTTTATACCTCGGGCGCCTGCATCTTCTTCAGGTTCCAGACCTAATTCGTCGTTACTTGTACCCGGTAGCAAAATTCCTTCGGCCTTATCCCAACCTCAACATTCGCAAAACATAACTCATCAAAATGGTGCTCCAAATAAACAGTCCATGCTAGATAAGTTAAAACTCTTTAATAAAGACAAAGTTAGTAGTGAAAAACAAAGCAGCAAAAGTACCGCGGTATCAAAACGTACAAGTTCATCAAGTGGATTCTCATCAGCAAAAAGCGAGCGATCTGATTCTAGTTTGAGTCTAAACGAATCTGCGAATGCTACAAACACACATATCAAATCATCTAGTTTGATAGGACCTAAAAGTGTCAGACCACACAATGATACATTAACAAAAGATAGATCTGGTAAAAACGTGAAATCTAAACTAGTAAATTCGAAGATTGTGAAGGAATCATCGACAACTTTAAATAAAACAAATGTCAAATCAAGTAATGAAAAGTCAAGAAGTAGTCCGAAATTACCTGCGCGTGACAAAGAATCGAGGTTAGCTGCTCCAAAGTCGGTTAGTAATACGAAACTAAATCAAATAGAAGACCATTCAAAAAGTCCGAAGTCGAGACTGGAGTCGAAAATGGTGAAGTTGTCTGGGAGTCAAATGAAACTGTCTGAACGAACTGAGAATAGTGACGTTAAAACTTATGAGAATACAAAAAATCATTCTCATCAAATACAACCACCTTCACCAACTAGTGCTTCCCAAGTGCCTCTTCAAAATCAGACAGGTATTCCTAAACCTACTGCAGCAGTAAAAGGGACAACGAAAATATCAAAAGATGAAAAACACGGTATCCATAAAAGTACAAATAGTCAATTAAGTCCTATTCAAAGTAATTCTAGCTTAAACTCTACCAATAATGTTAGTGCTCTTCCTAAGGAAGTAAATCAGAAACAAACTCTCGCTGTCTCTCCTATGCCTGTTATAAACAGTGGAAATCAAAATCCACCATCCCAAATGTCTGAGAGTTCGCATTCAAATTCAACACATAGTACCACTGGCCAACAATCTAATTCTAGTGATGGCAGTGTCATATACCGCCCATCAAGTGAATCGGGATCCGAAATTTCAAAAGGAAGCAATTTAGTGTGTAACAAAAGAATAGATATGAATACAACATATATCAATGACGTAATAAATGAAGCAGAAATATCAGAAAAAGAAGCTGCACAAAAACGAACTACTGATAAACCTAGTCCCAAGCCAATATTTGATGCTAATAAAACTCTTACGGAATATGATAAGAACGATAGTCGTTCTAGTACCCCGTCTCATTGTAGGGATAACTCCCTAGGAGAAGATGAAAACCCTTTAATGAATGTTCTACCGATGAGACCTTTACTCAGGGGATATAATAGTCATTTAACTTTACCAATGAGAACAACTGGGTTGGCGCAAAAAAATATACCTGGATATCCCCATCATGCAAATACTGTCAAAGCTAATTTTGGTAGGGACAACATGGCATTGCGTGAGCGAATAAATTATGGGCCTGGATTTTCTAACCCTGACTATTGTGACCTTGATATTGCCTCTGGTTACATGTCCGACGGGGATTGTCTGAGGCGAATAAATGTAAATGAAATGGACTGTGAACGTAATAATGATATTATGGACGGATATATGTCAGAAGGTGGAGCATCTTTATATGGCCGGAGAATGAATTATCAACAATCATCACAGTTCCAACAACTTGATGAGAGACGTGGTCGTAGAGGCATGGAAGGCGGAAGCGGTGTGGTGTACCGAGTGGTAGGCCGTAATCGCAGTAAGGCTGACTGCGGCCAACAAACCGAACGCCAACCGCCAGCCCCCAGACAAGATACCACCTGGAAGAAATATACCGACTCCCCTGGTGTTGGAACTCCACCTTCGAACCAGCCAACACCAGCTCCACCAAGTCCATCTCATGGTAGGAAAGGCGAACGACGTGCTGGACACCATTCGCCACAACATCACAAGAGAGAAAAGCTCACTGCTGCCCAACAGTTGGGAATCGCGCCACATCCTCAATATCCAGCTTCAAGCCAATCAAGTCAACATTCGTCAAGAAGTGGAGGATCGCAGTTACAGTCACCTAGTGGTTCATCGCGACCGTCCAGTGGGAATGGTAGTTGTTCCAACAAAGCCAAGGTCCCACAGAACTTTGGTTACGTCAAAAGACAAAACGGCCAGCCACCTCCGCCACCTCCAAATGGACCTCCACAACATGCACACGGTGGAAGAACAGCTCAAGTATCAGCAGTGCCCAGAACAAAAGTTAAAGTTTCTGGCGGAACACAAACATGTACTCAAGACCTCCAAATACACAAGAATGGCATAGGTCCGAAGTCCTTCTCCCTCCAAGGCACGGCGGCGGCACAGCTCTCTGCATCAGTTCGTGAGAGACTCCTCGGCTCACAGTCACTACCAAAGCCAGGGACACATGAATTCGCCGCCCTCTTTCATCATCATAGGCCGTCGCCGAGGGGAGGTATGAAGATCAGCGATGGAAGTCTCTCCGATACACAAACGTACTCCGAAGTGAAATCCGACTACGGCATACCATACGCTCCATGGCTGAGACATAGTAATACATACACAAGTGGAAGGCTGTCTGAAGGCGAGTCTATGGAGTCGCTAACGTCGCTGCACTCCGCGCAACACACACAATCCCCTAACTCACGCAGCTCACTCACACATAACAAGCTCATCATGCATCGAGACGCACAGAGTACGAGATTGAACAGGAGCAACAGCATCAGGTCAACGAAATCCGAGAAACTATACCCGTCAATGCTTCAAAGGTCGTCCGAGAGTGACTATGAACCGTACTACTGTTTACCAGTTCAATATGGACCGAGTGGACAAGGTATAAGTTACGGCGTGTCCGAGCCGCCGTCTCCGTCGCCGCGATCAGCTCTGAGCCCAACACATGCGCCTGCCATCCACACGCCGAGACACTCACACCATTATCCCAAGAAAAATGACGACGTTCACGGTTCAACGGCGTCTCTGGTATCAACGGCGTCATCACTAGCGGCCGGCGCGGGATCAGACGAGAGACATAATCATGAGGTTCGAAAGTTACGGAGAGAGCTGGCCGACGCGAAGGAAAAGGTGCACACCCTGACGACGCAGCTGACCACCAATGACGAGGTGGTCTTTACTGAATCGGCTTAA

Protein sequence:

>DPOGS204490-PA
MGNTNSGQGHSRHHNKSRKSRSLPTSPEVRRQVSVLQTSIPLPASAAAVRRAPPDKRPLPATPVHGKSGLSASSSRSTSPLGQGAVSFIPRAPASSSGSRPNSSLLVPGSKIPSALSQPQHSQNITHQNGAPNKQSMLDKLKLFNKDKVSSEKQSSKSTAVSKRTSSSSGFSSAKSERSDSSLSLNESANATNTHIKSSSLIGPKSVRPHNDTLTKDRSGKNVKSKLVNSKIVKESSTTLNKTNVKSSNEKSRSSPKLPARDKESRLAAPKSVSNTKLNQIEDHSKSPKSRLESKMVKLSGSQMKLSERTENSDVKTYENTKNHSHQIQPPSPTSASQVPLQNQTGIPKPTAAVKGTTKISKDEKHGIHKSTNSQLSPIQSNSSLNSTNNVSALPKEVNQKQTLAVSPMPVINSGNQNPPSQMSESSHSNSTHSTTGQQSNSSDGSVIYRPSSESGSEISKGSNLVCNKRIDMNTTYINDVINEAEISEKEAAQKRTTDKPSPKPIFDANKTLTEYDKNDSRSSTPSHCRDNSLGEDENPLMNVLPMRPLLRGYNSHLTLPMRTTGLAQKNIPGYPHHANTVKANFGRDNMALRERINYGPGFSNPDYCDLDIASGYMSDGDCLRRINVNEMDCERNNDIMDGYMSEGGASLYGRRMNYQQSSQFQQLDERRGRRGMEGGSGVVYRVVGRNRSKADCGQQTERQPPAPRQDTTWKKYTDSPGVGTPPSNQPTPAPPSPSHGRKGERRAGHHSPQHHKREKLTAAQQLGIAPHPQYPASSQSSQHSSRSGGSQLQSPSGSSRPSSGNGSCSNKAKVPQNFGYVKRQNGQPPPPPPNGPPQHAHGGRTAQVSAVPRTKVKVSGGTQTCTQDLQIHKNGIGPKSFSLQGTAAAQLSASVRERLLGSQSLPKPGTHEFAALFHHHRPSPRGGMKISDGSLSDTQTYSEVKSDYGIPYAPWLRHSNTYTSGRLSEGESMESLTSLHSAQHTQSPNSRSSLTHNKLIMHRDAQSTRLNRSNSIRSTKSEKLYPSMLQRSSESDYEPYYCLPVQYGPSGQGISYGVSEPPSPSPRSALSPTHAPAIHTPRHSHHYPKKNDDVHGSTASLVSTASSLAAGAGSDERHNHEVRKLRRELADAKEKVHTLTTQLTTNDEVVFTESA-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: