MonarchBase - Protein-coding gene

DPOGS205523
Transcript	DPOGS205523-TA	1893 bp
Protein	DPOGS205523-PA	630 aa
Genomic position	DPSCF300056 + 21945-25563
RNAseq coverage	607x (Rank: top 21%)

Annotation
*Heliconius*	HMEL003799	0.0	79.03%
*Bombyx*	BGIBMGA000075-TA	0.0	65.12%
*Drosophila*	CG42671-PF	2e-16	29.24%
EBI UniRef50	UniRef50_D6WH86	1e-22	30.11%	Putative uncharacterized protein n=1 Tax=Tribolium castaneum RepID=D6WH86_TRICA
NCBI RefSeq	XP_001811450.1	2e-23	30.11%	PREDICTED: similar to CG18490 CG18490-PB [Tribolium castaneum]
NCBI nr blastp	gi\|189235871	4e-22	30.11%	PREDICTED: similar to CG18490 CG18490-PB [Tribolium castaneum]
NCBI nr blastx	gi\|189235871	7e-28	29.16%	PREDICTED: similar to CG18490 CG18490-PB [Tribolium castaneum]

Group
KEGG pathway
Orthology group	MCL26604		Lepidoptera specific

Nucleotide sequence:

>DPOGS205523-TA
ATGAGTGTAAGTGTCGAAGACGTTTCGAGTCCTTTATCTGAAGGACAGAGCAGTGCTCTGGATGATGAAACGAAATCCGAAGCTGAGAATAAAAGCGAGGATGTTGAGGCAGGTCAAAAATCGGAGCCCACTACCCCGAAGCCACATCCTATGGCCTTCACGATTGACTTTGGACAGGCGAAACAATTCGATAATCGCAGACTGGAGGAGCTAGCTAAGAAGTCACAGGCTAGACATCAAAGAGTTCAATCCATGTCCGCAGGTCAATCGAGACAGAGTCCTATATCTCATAGACCACCTATGAGCGGCAAACTACCCAGAAAAGCTCAGGGTTACAATTCAGAAGGCTACTTCTCGTCAGATCAGGAAGACAGTGGTGTCTCGAGTTCCGTTAAACTCCGAAGTAGCCCATTAGTTGGTGCTGATAGACCGAATATAACAAGCCCTATAACAAACAGACTAATTCGATCGCCAGTAAACGAAAGTAAACTTATGTCCAAAAGTCCTATAGTTGATAGCATAATGTCCAGAAGTGATAACTACACGCACACTCTTAATCTACCCTTGAAAAACGCTAATAGTTCCTACTTGAGAGACGTCCATAGATCGCCAAGTTACGGTAATATCAATTGCAATAAACTGCCCATGGATATCATTGACGCCAGCCCCGAGGGCGCAATGTTGACTGACATCTCTAGTCCCGAATTAGACATTCTCACCCCCGATAATGGGTTGTCAACCCCTGAACATTCAAAGAGTCCACTACGAAAGAGCAGGGCTTCGTCAGCGACCCCAGATTTATTGTTCAGGAAGTGCCCCCAAAAATCCGAACCGCTGTATATTGATGATGAAGTTGATGGAGAGTCAAACCATTCATCAACAGGTACATACACAATTGAGTGTGATAATTATACTGAAGAACAGAAAGCTAGAATGAGTATCGACAGAACTTTTGGTGTGGAACAGCCAAAAACTGTGCCAGATACATTGAAATGTACTTCAGTCGACCGGGATCCTGAAATAATATTTGACTTCCCAAATCCTAGAGTCATAACAAAAGAGCCGAGACGAGATGTCTGTCTCCGTAATCCAGTGACAAGCAAAGCTGATAATGTACAAAATAAATTATCAAATGATCGGAATGTTCTGGAAATATCATGCTGCTATGAATCTCCCAATGATGATCTGGCTCTCCAAACATCAAAACAAATCAAATCTACAAGAAGCTATTTGGAGAAGATAAAGAATAGAGTTAGAACAATAACGGAGAAGACATTCTCCAAGTCACCACCAAAGTTCGAAGAAGATGCTGATCTCGGTACATTCACATCCGTCACAACTTCTGGGGTACTCAGCTCGAAGTATCCAATCAAAGTGGAAATGCCAAGTAGAAGGCGCTGTAGTCTGACAAAATCGGAAATCGATCGGACAGATTACATCCACAGGTTGTCGAGGGAATCCTCAGTGCCTGTAAATTTACCAAGCAACAAGAACATTCTAGAAGACACCAAATTCGAGAGCACAGCACTCAAAAACGCCCAGAAAGCCCTGAAAGATGAAGTCAATCTAACATCAGATCCGTTGGTCGGCAAACTGTCCTATCTAAGCTTGAACAGGTGCAAGGGTGACAAGACCTGGATTCAGGATTGGGCGGACAGCGTCAAGAAATACAACAATAATGTGCTGACAGATGAAGCAGATCTCAATGCCACCTTCTCCATAGATGACCGTCCTCCGATCAGCCCAAGATTGATACCAACAAAACCCCGAAGTCCGCATGGAACACCAACAAAGATCCCGAGCCCCGTAGGGACTCTTCTACACCGTAGAACCCCGGGCAAGAAATGTGAAGAATTGAGAATATTCACAATGTTCATACCCTTGGACGGATAG

Protein sequence:

>DPOGS205523-PA
MSVSVEDVSSPLSEGQSSALDDETKSEAENKSEDVEAGQKSEPTTPKPHPMAFTIDFGQAKQFDNRRLEELAKKSQARHQRVQSMSAGQSRQSPISHRPPMSGKLPRKAQGYNSEGYFSSDQEDSGVSSSVKLRSSPLVGADRPNITSPITNRLIRSPVNESKLMSKSPIVDSIMSRSDNYTHTLNLPLKNANSSYLRDVHRSPSYGNINCNKLPMDIIDASPEGAMLTDISSPELDILTPDNGLSTPEHSKSPLRKSRASSATPDLLFRKCPQKSEPLYIDDEVDGESNHSSTGTYTIECDNYTEEQKARMSIDRTFGVEQPKTVPDTLKCTSVDRDPEIIFDFPNPRVITKEPRRDVCLRNPVTSKADNVQNKLSNDRNVLEISCCYESPNDDLALQTSKQIKSTRSYLEKIKNRVRTITEKTFSKSPPKFEEDADLGTFTSVTTSGVLSSKYPIKVEMPSRRRCSLTKSEIDRTDYIHRLSRESSVPVNLPSNKNILEDTKFESTALKNAQKALKDEVNLTSDPLVGKLSYLSLNRCKGDKTWIQDWADSVKKYNNNVLTDEADLNATFSIDDRPPISPRLIPTKPRSPHGTPTKIPSPVGTLLHRRTPGKKCEELRIFTMFIPLDG-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: