MonarchBase - Protein-coding gene

DPOGS207363
Transcript	DPOGS207363-TA	1272 bp
Protein	DPOGS207363-PA	423 aa
Genomic position	DPSCF300188 + 454814-459072
RNAseq coverage	127x (Rank: top 57%)

Annotation
*Heliconius*	HMEL008869	0.0	91.02%
*Bombyx*	BGIBMGA013761-TA	2e-16	34.39%
*Drosophila*	CG4221-PA	7e-101	50.13%
EBI UniRef50	UniRef50_Q7QKJ7	8e-103	51.60%	AGAP003285-PA n=4 Tax=Pancrustacea RepID=Q7QKJ7_ANOGA
NCBI RefSeq	XP_307793.4	1e-103	51.60%	AGAP003285-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|312372308	1e-103	51.86%	hypothetical protein AND_20333 [Anopheles darlingi]
NCBI nr blastx	gi\|312372308	3e-105	51.47%	hypothetical protein AND_20333 [Anopheles darlingi]

Group
KEGG pathway
InterPro domain	[59-90] IPR022364	8.2e-08	F-box domain, Skp2-like
Orthology group	MCL14717		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS207363-TA
ATGTCAAGCGGGAGTTGCTCGGGGCCGGGTGTGTGTGGTGGGGCGAGACGTAGACCTCCCCCTCCTCCCGAGCCTGCACTGTCCTTGGCTGCAGACCTGAGTGAGCTGAGCCTCGACCAGGGCTACCACACCCTGGCTGACTGCGGCCCCCCTAGGAGGAGGAGGGATAACACGCTCACTGACGCTCTGTGGCTGAAGATACTGTCCTACCTTGAGGTGTCAGATTTATGCCGAATGTCCCGGGTGTCCAGACGATGGTCCCGTTTCGTGGCCAGGCTGACTGCCAGACCTGAACCCTGGAGGCGGGTACGGGCTTCTGGTCCCCTGGAGGTGGCTGCAAGGTGCGCGGGTGCAAGAGCTGGACCCTGTGTTGGTGCTGTTAGGGAATGGAGGTCCAAGACCTGTTCTGTGACGGTAGCCGGAGCACAGTTATTAGCGGCGACCTTCAGGAACTTAACTCATTTAGCTTTAACGAACTCAAATACAGTGGACGCAAGAGCTTTGGCCCCAATTATCACAGATTTGGTTGACCTGCGCCATGTTGATTTAACAGGCTGTCCAAACATGGACTGGCCAGAGTGGAATTGGCTGGAAAGTCGTCTTACAAACAGACGGCCCCCCATAGAGTATATAGACCTCACTGACTGCACCGCTGTCACCGACGCCGGCCTCTGCGCTCTGCTCCACACCTGCCCTTCATTACAGTACCTTTATCTCAGGAGATGTACTCTAGTCACTGATGCAGGAGTCCGATGGATACCTTCATATTGCGCTCTCAAAGAACTGAGCGTGTCTGATTGTACGGGGGTCACGGACTTCGGTTTATACGAACTGGCGAAATTGGGGCCAGCGTTACGATACCTATCCGTTGCTAAATGTTCTCAGGTATCAGATTCAGGGGTCCGAACTCTCGCACGTCGCTGTTATAAGCTACGTTATTTGAACGCCCGTGGCTGTGGGGCGCTGGGGGATGATGGGGCCGAGGCCATCGCCAGGGGCTGCTCCAGATTAAGAGCTCTGGACCTTGGTGCCACTGATGTATCGGAGGCCGGGCTGCAGATTCTTGCCAGATGCTGTCCGAATCTTAAGAAGCTGGCGTTGAGAGGCTGTGAACTCATCGGCGACGATGGTTTGGAAGCCGTTGCGTATTATTGTAGAGGTTTGACACAGTTAAACATTCAGGACACGCCGGTTACATTAAGAGGATACAGAGCTGTTAAGAAGTACTGCAAGAGATGTGTCATAGAACATACAAATCCAGGATTCTGTTGA

Protein sequence:

>DPOGS207363-PA
MSSGSCSGPGVCGGARRRPPPPPEPALSLAADLSELSLDQGYHTLADCGPPRRRRDNTLTDALWLKILSYLEVSDLCRMSRVSRRWSRFVARLTARPEPWRRVRASGPLEVAARCAGARAGPCVGAVREWRSKTCSVTVAGAQLLAATFRNLTHLALTNSNTVDARALAPIITDLVDLRHVDLTGCPNMDWPEWNWLESRLTNRRPPIEYIDLTDCTAVTDAGLCALLHTCPSLQYLYLRRCTLVTDAGVRWIPSYCALKELSVSDCTGVTDFGLYELAKLGPALRYLSVAKCSQVSDSGVRTLARRCYKLRYLNARGCGALGDDGAEAIARGCSRLRALDLGATDVSEAGLQILARCCPNLKKLALRGCELIGDDGLEAVAYYCRGLTQLNIQDTPVTLRGYRAVKKYCKRCVIEHTNPGFC-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: