MonarchBase - Protein-coding gene

DPOGS204036
Transcript	DPOGS204036-TA	1263 bp
Protein	DPOGS204036-PA	420 aa
Genomic position	DPSCF300138 + 68625-71615
RNAseq coverage	240x (Rank: top 43%)

Annotation
*Heliconius*	HMEL004954	0.0	86.34%
*Bombyx*	BGIBMGA004784-TA	0.0	89.58%
*Drosophila*	cbc-PA	1e-159	61.85%
EBI UniRef50	UniRef50_D6WQN7	6e-170	67.55%	Putative uncharacterized protein n=2 Tax=Pancrustacea RepID=D6WQN7_TRICA
NCBI RefSeq	XP_623706.1	0.0	73.21%	PREDICTED: similar to CG5970-PA [Apis mellifera]
NCBI nr blastp	gi\|350421624	0.0	73.92%	PREDICTED: protein CLP1 homolog [Bombus impatiens]
NCBI nr blastx	gi\|350421624	0.0	73.92%	PREDICTED: protein CLP1 homolog [Bombus impatiens]

Group
KEGG pathway
InterPro domain	[227-418] IPR010655	9.9e-54	Pre-mRNA cleavage complex II Clp1
Orthology group	MCL13491		Single-copy universal gene

Nucleotide sequence:

>DPOGS204036-TA
ATGACTGAAGTGCAATTACAAGAGATTAAATTAGATCCCGATTCTGAACTTCGTTTTGAAGTTGAAACGAAAAATGAAAAAGTCGTTTTAGAGGTTAAGAGCGGCTATGCCGAGTTATTCGGCACAGAATTGGTCAAAGGCAAGCCCTATGAATTCCACACGGGAGCGAAAGTTGCTGTGTTCACGTGGCATGGCTGTACAGTGGAATTGCGAGGACGTACAGAAGTTAGTTATGTCGCCAAAGAAACTCCTATGGTTGTATACTTAAATGTACATGCAGCATTAGAACAGCAAAGGGTAGCGGCTGAACACGAAAATACAAGAGGACCGGTGACTATGGTTGTGGGTCCCGGAGATGTTGGTAAATCCACATTAACGAAGATACTCCTTAATTATGCGGTGCGGATGGGTCGACGACCTATATTTGTAGACCTGGATGTTGGCCAAGGACATATAAGTGTTCCAGGAACTATTGGTGCATTATTAGTTGAGCGTCCAGCCTCTATAGAAGAGGGTTTTAGTCAGCAAGCGCCGCTAGTGTACCACTTTGGTCACAAATCACCCGGCGACAACTTGGAGCTATACAACATGATTGTGTCACGTCTGGCTGAAGTTATCGCTGAGAGATGTGAAAATAATAAGAAAGCATCAACGTCAGGAGTGATCATCAATACATGTGGATGGGTGAAGGGAACAGGGTACAAAGTACTGACACATGCTGCCCAGGCTTTTGAGGTCGATGTTATATTGGTGTTGGACAACGAGCGTCTCTACAATGAACTGAAGAGGGACATGCCGAAGTTTGTGAAAGTTGTTTATTTACCAAAAAGTGGAGGGGTAGTTGAACGTTCCTCCACACAACGAGCTGAGGCCCGAGACGCTCGTATAAGGGAATACTTCTATGGAAATCGGACACCATACTACCCACATTCATTTGATGTTAAGTTCTCAGACCTTAAGATCTACAAGGTGGGCGCCCCCTCTCTGCCAGACTCTTGTATGCCTCTGGGTATGCGTTCGTCTGATGCTCTGACCCGCCTGGTGCCGGCCTGGCCGTCTCCGTCTCTGGCGCACCGGGTTCTGGCCGTGTCCTTCGCCCCATCACCAGACGACCACGTGCTCGCGACCAACCTGGCTGGATTCGTTTGTGTTACTGCGGTGGACATGGATCGTCAGACGATGACCATCCTATCTCCTCAGCCTCGCCCGCTGCCAGATACTATACTGCTTCTCTCAGACTTGCAGTACATGGACAACCACTAG

Protein sequence:

>DPOGS204036-PA
MTEVQLQEIKLDPDSELRFEVETKNEKVVLEVKSGYAELFGTELVKGKPYEFHTGAKVAVFTWHGCTVELRGRTEVSYVAKETPMVVYLNVHAALEQQRVAAEHENTRGPVTMVVGPGDVGKSTLTKILLNYAVRMGRRPIFVDLDVGQGHISVPGTIGALLVERPASIEEGFSQQAPLVYHFGHKSPGDNLELYNMIVSRLAEVIAERCENNKKASTSGVIINTCGWVKGTGYKVLTHAAQAFEVDVILVLDNERLYNELKRDMPKFVKVVYLPKSGGVVERSSTQRAEARDARIREYFYGNRTPYYPHSFDVKFSDLKIYKVGAPSLPDSCMPLGMRSSDALTRLVPAWPSPSLAHRVLAVSFAPSPDDHVLATNLAGFVCVTAVDMDRQTMTILSPQPRPLPDTILLLSDLQYMDNH-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: