MonarchBase - Protein-coding gene

DPOGS213612
Transcript	DPOGS213612-TA	1362 bp
Protein	DPOGS213612-PA	453 aa
Genomic position	DPSCF300033 + 847264-849369
RNAseq coverage	97x (Rank: top 62%)

Annotation
*Heliconius*	HMEL013687	1e-112	78.14%
*Bombyx*	BGIBMGA011801-TA	0.0	83.44%
*Drosophila*	CG32085-PA	2e-174	76.62%
EBI UniRef50	UniRef50_UPI0001791727	6e-157	58.72%	UPI0001791727 related cluster n=1 Tax=unknown RepID=UPI0001791727
NCBI RefSeq	XP_971494.1	0.0	72.21%	PREDICTED: similar to AGAP012123-PA [Tribolium castaneum]
NCBI nr blastp	gi\|307202150	0.0	67.58%	F-box/LRR-repeat protein 16 [Harpegnathos saltator]
NCBI nr blastx	gi\|91092916	0.0	72.21%	PREDICTED: similar to AGAP012123-PA [Tribolium castaneum]

Group
KEGG pathway
Orthology group	MCL14881		Single-copy universal gene

Nucleotide sequence:

>DPOGS213612-TA
ATGTCGTCGGTGTCAGCGCAAGGAGTGGTCGAGCGCGCTTCCGCGGAGCTATCCCGCCGCATAACAGGACTGGGACTTCGAGGTCGTAAACGTTCGCCGGGAGTCGTCGAGAGAGTAGCCAATGCCTTGTGCGGGCCTGCCACCACCGCCCCACCGAGGATACCCCGCCGGAGACGACCCTCGCCGAGACCGCTTGTGTGGAGCCAATTTATTATAGAGGAGAGATTCCTGGAGAAGTTCTTTCTGTATTTCAATGGCAGCGAAAGAAGAACCCTTGCTCAAGTCTGTACTAAATGGCGTGATGTCCTGTATTCTTCTCCCCGTTGGTGGAATGGCCTAGTCGCTGTTCTGGATTGTAGGGAACTACGATCTGAAACTGGTTGTTGCATGCAAAGATTTTACAATTCGGTTGTGAGGAGGGGTATCCGAGGATTTGTACTAATATCTGCAACAGATGATGATATAAATGAATTAATAAAACAGTTTCCGCTCTCAGCTCATCACATACATGCTATTGGTTTAAAAGGATGCACAATAACCGATCGAGGTTTAGAATCAATACTCGATCATTTACAGGTTCTCTTTGAACTAGAACTAACAGGCTGTAATGAAATAACTGAAGCTGGTCTCTGGGCTTGCTTAACTCCTAGGATTGTATCACTTACACTTACCGACTGCATTAATATTGCTGATGAGGCAGTGGGTGCGGTTGCTCAGCTGTTGCCGTCGCTATATGAGTTCTCATTGCAAGCATACCATGTGACCGATGCAGCACTCGGTTATTTCTCACCAAAACAAAGTGCCTCACTCAGCATCTTAAGATTACATAGTTGCTGGGAGCTTACTAACCATGGCGTCGTTAACATTGTGCATTCTCTGCCGAACCTGACAGTGCTGTCCCTCAGTGGATGCAGCAAGGTCACTGATGAGGGTGTGGAACTCCTGGCTGAGAATCTGCCGCGTCTACGAAGCCTCGATCTCAGCTGGTGTCCGCGGGTCACTGACAACGCGCTCGAATACATCGCCTGCGACCTGAACCAGCTTGAAGAACTCACGTTGGACCGATGTGTGCATATAACGGATATCGGCGTGGGCTACATTAGCACAATGCAGTCGTTGGCCGCGCTGTTCCTGCGCTGGTGTTCTCAAGTGCGGGACTTTGGTGTGCAGCATCTGTGTGGCATGCGAAGTCTGCAGCTACTGTCGCTCGCCGGTTGTCCGCTTCTCACATCCGGTGGCCTCTCAAGCTTGATCCAATTGAGGCAGCTACGAGAACTCGAACTGACAAATTGTCCGGGAGCATCCCCTGAACTGTTTGACTACCTTCATGAGCATCTACCGCGTTGCCTCATCATAGAATAA

Protein sequence:

>DPOGS213612-PA
MSSVSAQGVVERASAELSRRITGLGLRGRKRSPGVVERVANALCGPATTAPPRIPRRRRPSPRPLVWSQFIIEERFLEKFFLYFNGSERRTLAQVCTKWRDVLYSSPRWWNGLVAVLDCRELRSETGCCMQRFYNSVVRRGIRGFVLISATDDDINELIKQFPLSAHHIHAIGLKGCTITDRGLESILDHLQVLFELELTGCNEITEAGLWACLTPRIVSLTLTDCINIADEAVGAVAQLLPSLYEFSLQAYHVTDAALGYFSPKQSASLSILRLHSCWELTNHGVVNIVHSLPNLTVLSLSGCSKVTDEGVELLAENLPRLRSLDLSWCPRVTDNALEYIACDLNQLEELTLDRCVHITDIGVGYISTMQSLAALFLRWCSQVRDFGVQHLCGMRSLQLLSLAGCPLLTSGGLSSLIQLRQLRELELTNCPGASPELFDYLHEHLPRCLIIE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: