MonarchBase - Protein-coding gene

DPOGS200161
Transcript	DPOGS200161-TA	3321 bp
Protein	DPOGS200161-PA	1106 aa
Genomic position	DPSCF300128 + 192082-200721
RNAseq coverage	301x (Rank: top 37%)

Annotation
*Heliconius*	HMEL005834	0.0	76.04%
*Bombyx*	BGIBMGA002912-TA	0.0	73.60%
*Drosophila*			%
EBI UniRef50	UniRef50_D6X1B4	2e-102	43.47%	Putative uncharacterized protein n=3 Tax=Tribolium castaneum RepID=D6X1B4_TRICA
NCBI RefSeq	XP_972982.2	7e-103	43.47%	PREDICTED: similar to Nck-associated protein 5 (NAP-5) (Peripheral clock protein) [Tribolium castaneum]
NCBI nr blastp	gi\|270013063	7e-102	43.47%	hypothetical protein TcasGA2_TC011613 [Tribolium castaneum]
NCBI nr blastx	gi\|242022892	5e-118	33.09%	conserved hypothetical protein [Pediculus humanus corporis]

Group
KEGG pathway
Orthology group	MCL17974		Insect specific

Nucleotide sequence:

>DPOGS200161-TA
ATGGCTCTAACGCCGCGCTCGAATTCCGTAACCAATGCATCAGCGTCGCACTACCAAAGCCAACTCTCAGTTCTGTCTGCTGAGAACGAGCGTCTCCGTGAAGAACTGACAGCGCTGTCGGCTGGCGTCCGTGACTCTGAACACGAAAAGAGGCTAGATGATGTGGCGCAGCAGGTCGTGCGAGCTTTACTCTCGCAGAAGAGTGTTCGTGAGGAGTTGGGCTGCGCTCGCGCACGTATCCGCGAGTTGGAAGCTCAGAACCGAGCGTTGAGTTCGCTCCTCGTACGACAGCTGAGACCACAACCGAGACCCTCGCCAGCCACACCGCTCACACCACACACCAATAGGGACCTCCAAGTACACCTGGTGGATGTCGGTTCGTGCGGCTCGTTGGTATCGTTCAGGGACTCCCCTCCCCCCGCGCCGCCGGCTCCTCAACCTCACCCCCTCAGCCAGGACGACAAGCGGAGACATCAAATACTAGCTGATATCTGGACTGAGCTGAAGGGTCTGGAGGTGACTCCCGCCAACTTAGCGCGCGCGTTGTCCGCGGTGGACCCCACGTTGTGGGCACCGCCGGCGAGGCCCGCGACGCTCAGCCTCAGCGTGCTCCAACCCACCGAACAGACACAAAGTGCTACGAGGGGGAAAGCGACGGAAGAGGAAACCGGCGAAGCGGGCGTCGAGTCACCGGAAAGCGGGGCGAAGGACGAGGGTTACTCGACGATGTCTAGCGACGTGCAAGCTGACGCGTCACGACAGAGTGACCACGTGGGCGACCCCCTGCCGGACCTCAACGAAGCCTCCGACGAAACGGACAACCAGACCATCGTTTCCATCAACCCCAGAGAACCCCGGCGTCGCGCCAGACTGATAGCTGAGGCTGATTATATATATTTTCCTATAGGTGTAGCATTCGCTGGTATAAGAGGCAGCTACCCGCCCTCGCGGCCGGTGTTACCTTTCCAGCACGTCGTGAGAAGTTTCTCAGACTCTCATTTGTGCTTAAAGTTATTGACCAGCACGTCGTGTCCTCCGAGCTGCTTGGAAACACCATCGCCGAGCTCGGGCATCTTAGTTTTAGATCTGAAACCTGCTCCAGAGAGGCCACTGAGACGGCCAGCTGTAGCGTCTACCACGAGCTCTGAGAGAGTGTCGTGGGGCAGCACCATCGATGAGCGTGCTGACGTCTCACAGTACGACGCTGATTACGTTCAGCATTGGCTAGAATTAGACGACGCCAGATCTGCACTGCAACAAAGACATAGGGATCTCGCAGACTTGGAGTACGATAGAGCGGAATTAGAAGACTGGAGTCTGTCACTGTCGTGTGAGGATCTTAGAGACAGACAATCTCCGTTTGCGGAGATAACTACCCCCGGACAGATATCTCATTCAACATTACCAAGCATCAGGGAAGACGATGCGCTAGAGCTGGAGGAGGACGTCGGTGATTGTTTGTGGAATGACTGCGGATTCGCGACGGTTGAAATCGATGAATGCAGAATAGGCGACGAAGTTGAAAACTCAGAGAAAAGATGGGAGTACACGGGAACACATTCCCCGGGCGGATCCTGGTCCAGCGCATCCGATGCTCCTGAAAAGCGATCTAGTACAGCTTTGAGTGAAGACGGCGACTGCGCTAACATAGGACTCGATTTTACGAGGGATTTTTACAGACTCGTCAAATATGAAAGCACGAAGAGTTTAGCATCCAATTCATCGAAAGGTGTCACAGCTCAGGATCCAGCAAACCATTTAAGAATAACGGATGTTCAGACTGTGGGTTTGCAGGATCGTGAACAGGCACTTCAGAATGTTCTCAATTTTATAGCAGAACAGCAGAAGTACTGTCGTGACAGAGAAGAATCCGATTCTATGTCTTCTCGTCCTGTGTCCGAAATACGCGAACTTCCACCTCCGTACGCCGCCGCTGATTTTGACGACGAGTCCGTAGATCCCCGCAGTGAAATATCAGAAGACAGGCAGAGACCGGATTCCTTTGGCAGTTTTTCTGAAAACGATTCATGCGACGTCATCCCTCTAGACAGAACGAGACTCCCCGTTTGCGAAAATATATCCGAGCCGAGATCGACACCTAGATTCATAGAGCGCGAAGATCCTTACGTGGAATCTGAAGACTACTACGACAGGTCGCGCGTCGAAAATGCGGAAAATGAAATCGATGCTCACCATCTTTTAAAGGTACAGCGAAAAAATGAAATTAATAGAAATATTGACATCAATAACTTAGCCGACATAGAGCCGCCGAGCTCGGAGAAAGACGACGAAACTTGTGATAACGAATCTAGTCGAACCTTAGAACATAACTCGGCGTTGAAAGACAATACTGTCAACATCACGTCGAGCAAAGAAGGGTCTAGCGAAAGAGAGACGGAGGCGTCCCTCGCCAAGTCCAGCAGTCTTCATAGCGCTGTGGAAAGTGAAATATCCGTCGTCGACGAAACGTTGACTATTTGTAGAAGAACGTCACTCGGCACCGTGCCCGAAGAAGAGGAGAGCTCCTCGCCCGAGACGAGTTCTCCGCAAATGACTGAATCAAACACAACGAGCACGTCGACAGCTGAAACTGTGATAGTTAGTAATAAGAATGAGAGTTTCAACAGAGAAGTCAGGCGCAGAAACGACAAAAGCCGGATACCGACTCTGACGGGCGGCAAGCGACCGCCGTCCTCACCGCACAAGGCGAGGTCGAAGATCCCAGTCTCGGACAGAGGCAAACCAACCCAAAAACAAGCGACGCCGCCCCCAGAACCCATCATCGTGAAGCAAGAAAACACACTGAGCTTTCACGAAGCTGCTACCTCGAAGGAGGTCATAGAAGAACTTAACAGGATGATTCGCCAAAGCGAAGGTGCAGCGACAACGACCGACGTGAAGACCGAAGAGGGCCAAGAGAAACCGTACGGACAAAAGGATAGTGCGTTATGGGCGCCCACGGGTTGGGTTCATGTCGAAAAAGACATCGACTTCAGTGACCCAAAGGCGCGCGCTAATCTTCTGGACGTGATGCTGGCCTCAAGTGACTCGTCTCCATCGTCCTGCGGCTCGTCGCCGGCGGAACAGCCGCCCTACTCCCGCCTCCACCGCCTCCACCGCTCAAGACGACAGAAGACCGCGGCTGCGCTGCGAGTCCGCGGCCTGGGAGCCCTACGGCACGCCAGGCACCGCCGCCCCTCCATACTCGGCCGCGACGGCTTCTTCGTCCGCTACGCCGAGCCCGAGAAGGCCGCCGTCGCCACGTTCGACTTCCTCGATGAGCTCTCGGCCGGATCCTCGCCTGACTCCAAACACAAGTAG

Protein sequence:

>DPOGS200161-PA
MALTPRSNSVTNASASHYQSQLSVLSAENERLREELTALSAGVRDSEHEKRLDDVAQQVVRALLSQKSVREELGCARARIRELEAQNRALSSLLVRQLRPQPRPSPATPLTPHTNRDLQVHLVDVGSCGSLVSFRDSPPPAPPAPQPHPLSQDDKRRHQILADIWTELKGLEVTPANLARALSAVDPTLWAPPARPATLSLSVLQPTEQTQSATRGKATEEETGEAGVESPESGAKDEGYSTMSSDVQADASRQSDHVGDPLPDLNEASDETDNQTIVSINPREPRRRARLIAEADYIYFPIGVAFAGIRGSYPPSRPVLPFQHVVRSFSDSHLCLKLLTSTSCPPSCLETPSPSSGILVLDLKPAPERPLRRPAVASTTSSERVSWGSTIDERADVSQYDADYVQHWLELDDARSALQQRHRDLADLEYDRAELEDWSLSLSCEDLRDRQSPFAEITTPGQISHSTLPSIREDDALELEEDVGDCLWNDCGFATVEIDECRIGDEVENSEKRWEYTGTHSPGGSWSSASDAPEKRSSTALSEDGDCANIGLDFTRDFYRLVKYESTKSLASNSSKGVTAQDPANHLRITDVQTVGLQDREQALQNVLNFIAEQQKYCRDREESDSMSSRPVSEIRELPPPYAAADFDDESVDPRSEISEDRQRPDSFGSFSENDSCDVIPLDRTRLPVCENISEPRSTPRFIEREDPYVESEDYYDRSRVENAENEIDAHHLLKVQRKNEINRNIDINNLADIEPPSSEKDDETCDNESSRTLEHNSALKDNTVNITSSKEGSSERETEASLAKSSSLHSAVESEISVVDETLTICRRTSLGTVPEEEESSSPETSSPQMTESNTTSTSTAETVIVSNKNESFNREVRRRNDKSRIPTLTGGKRPPSSPHKARSKIPVSDRGKPTQKQATPPPEPIIVKQENTLSFHEAATSKEVIEELNRMIRQSEGAATTTDVKTEEGQEKPYGQKDSALWAPTGWVHVEKDIDFSDPKARANLLDVMLASSDSSPSSCGSSPAEQPPYSRLHRLHRSRRQKTAAALRVRGLGALRHARHRRPSILGRDGFFVRYAEPEKAAVATFDFLDELSAGSSPDSKHK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: