MonarchBase - Protein-coding gene

DPOGS213153
Transcript	DPOGS213153-TA	3378 bp
Protein	DPOGS213153-PA	1125 aa
Genomic position	DPSCF300016 + 1239188-1246786
RNAseq coverage	147x (Rank: top 54%)

Annotation
*Heliconius*	HMEL010321	0.0	88.71%
*Bombyx*	BGIBMGA007911-TA	0.0	77.70%
*Drosophila*	CG42748-PG	2e-89	48.04%
EBI UniRef50	UniRef50_B4IIJ5	8e-135	38.93%	GM16161 n=9 Tax=Drosophila RepID=B4IIJ5_DROSE
NCBI RefSeq	XP_002043555.1	2e-135	38.93%	GM16161 [Drosophila sechellia]
NCBI nr blastp	gi\|195354133	3e-134	38.93%	GM16161 [Drosophila sechellia]
NCBI nr blastx	gi\|328789144	7e-166	42.74%	PREDICTED: hypothetical protein LOC725508 [Apis mellifera]

Group
KEGG pathway
Orthology group	MCL11549		Single-copy universal gene

Nucleotide sequence:

>DPOGS213153-TA
ATGGTTTCCATAGTGCTGTTGACGACAGAGGAGGTTTTACAAAGGAATGGCTTTTGGTACTGTCTTGATTCAATTTGGATCACGCAAGAATTGGAGCCCTTTCAAGAGGTGGAACCGGAACAGGTGTACGCTAAACCTATGCCGAGGGATATTTACTACGCCAGATACCCAGATATACCAAGAAGCGAATCCGAGGACGAGATTCCGTTAACCGTCAAAGGTTTTTGGAACAAACATGCAGAGTGGAAGTCTAGAATATGCATCAGAAACCTATGTTCCCAAAACAAAAACATGACACATTCAACTTTTAGTGCGAAATCTATTAATAACAATACCACTATTGACGTGAGCTGTAAAGCCGTGACTTCGAATGTTAAGAAAAAAAACCGTCCAGAAGCTTTGGATGATGATGAACGGATTCGTGATTTTTTTAACCGTCTGATAGAAAGTGTTCCGCCCCCGCCCGTACAGGATGTATCGGAATTTGCCAGCTCTATGTCTACTTCGCGATCAATTCAACACAATATAGAATGTATTGATCTACCCGACTACGCTGACTTTGAAAGCGATAGATTGCTTCAGCGTTTCGATGAGATCCCCGGTCCTTGTACTTCAACGTTAAAGAAAACTACGAACGGAACACATAACAGTTTCAGCTCTTCTGACTCTGATCAGGAATGGTACGAAACTATTTACGGAGTATCAGAATTGTTGGATCCTCAAGGATATCCGGGCAAGGGAAAACTTACATCGGATTCTGACTGTCTGATATCCTGGTCCGAGATACTCGAGATTTGCGGTCCAAGCAGCATTTACAGTTATTGTAACAGCACTGAAGAAACTGAAAATATAATAAGTCAGTCTCACCACATGATGAATAATTTATATGATATATCAGGTGATGACGACGAGGAAGCTTATGCCAAATTTTCTATTAATAAACTTCGACAAACAATAAACACGAAAGGAAAGATACAGGATTCGTCATCTATGGAAAATTTAAACTATGAGGAAAATGTCTTGCTAATGTCCATAGTTGAAATCAACCCCTCCTTGCATGAAACTTTCTACCGATTAGCTCCATCAGATAGTGACGAAGATTTGCCTCCGGAAAACGAATTGCAGAAGAATTCCGACCGTGTGCTCTCTGAGCACGAACTTCGGGTTCAAAGATCATTGCAGAAGCTCAATGTGCCAGAATGGTACAAAAACGCCCCAGCCCCACGCGAGGGCTTCCTTCTTCGGAAGCGGTTGTCCGACGCTTCATCAGCAGCTCGGTGGAGTGGTCTTAACTCGAAGACCACATCACTGGGCAGTCTCGGTGCTAACAACGCCCAGCCCCCGCCACCTCAGCTATCCCCTCACACAACCAGTTTCGGTAGATGGTCTACCAGTCGACTTAACTCGAATCAAACCTCCCCGTGTTCGTCTACCCGCAGCAGTGTCCGCGGCGCCAGTCCCCTGTGCTCGCCGTCTGCTCGTTCTTCTTTCAGCGCTCGTCAGCCCTACCTCGGCTGGAGGAGTCAGGAGAGACTCAACTCCACTCCACGAACGCCGCATGAGAGGCTAGCTTCTTCTCTTCTTCAGCAGTCCGCTTCGGCGAAAGCCGCAGAGGAGATACAGACGTCGATAAAGGAAGTGACGTCAGCGATCGTCCACTACGTATCAGGCTTAGAGCCGGCAAACGGTGACGTAGAGAGGCAACCCTCGCCGCGCTCCAGTCAGAAGTTGTACTGGCTCGAAAGCTCGTTTGTTGGTACAAAACCGCTGGAATCTCCTCAGACTCCGCTGGTGGTGTCGGAGTCCCTGCCCCCGGCCCACCCCCGGCCGCCCTCCTCCCTGCGCCTCGAGCACCGCGCGGCGCCCGACTGGCAGGATTCTCAGCGTTCTCTAAACCTGGGCGTAACTCGCCCGTCCCCGGGTTCAACGACCCTCGAAGACGTGCTGGATTCACTTCTGGGGCTTCCTTCTCAGCCCACCAGAGTTCCCACTCCTCAACCCAGCCCAAGGAAATCAGCGAGTCCATATTACTTGCTCAGCGGAAAGAGTCCTCGCTACGAGCAACTGGCTAGCAGCGGCCACAGCAGCATTTCGCCAGCTTCCCGTTTCCTCGGCACACCCAGTGAAGCCCCCAGCTCTCTCACCGACCCCAGCCCGGACCACGATCGACCAGGGAAGGATACAGTTGATACTCCTGCTATGCAGGAAACGAGGCGATCGCGGTCTCAGGGCGAGCACTCTCGCAGGAGGAGTGAGCCCTTTGCTCGTCCTAGTACATCCCTCGACCGCCGCACCAGTCTCGACGTTGCCGCCCTGCGCGAACAGAACCTCACCCATCACGACTCCAGAACCTCCCTCGCCTCACTCCAAACCGAAAACAGCACAGATGACACCTGCGTCAAGTGCAAGTATCCTAAATGTTCGTCCCGAGCCCCATTACCGGATGCCAAGAGGCATTACAAAACTTGCCACAACTGTACCACCATGTACTGTTCCAAAGAATGTAGACGAGCCCATTGGGAAAAGCACAGGAAGGTCTGTCTACACTCTCGTGCGAGCAGTTTGTGTAGACAAATTATATCGGCCGCGAAAGAGGATTCCGACTCTCTGCATCAAATCAGTACGATCGCTCATAAAGGATATCTGGCCCAAGGTAGAGGTGTTGTCAAAATCTTCTTCACGAGTCCAGAGGCGGCTGAGAAGTTCACCACGCACGGCTACCAGTACTTGAGCGAACCGGAATTCGTCAAATGGACTTCTCTGCAGCCAAATGAAATGGGTGCCGAACTATACACCGAGGTCGTAAAACTTTGCAAGGCTTACAATCCAGAAACGAGAGTAATTTTATACGTAGCGGTGTGTATCATTAGCGAAGTACCAACAAAAGGCGCCGTTAAATGGGAGAGACAGATGGTGTCCAGGTGTGCTAAACTTCGTTTAAGCAAAACGGTTTCATCGGCCATCCAAGAACAGAACAGAAAAAGAAATAGAAGAGACAGTAAGGGAACACCCGATGACCGCGAGACCTTGATACTGACTTCCAAATTAACGAACGCGGGGGAGAAGAACGCAGCGACAGCGCACAAGTTCAGGGAGATATGCTTCAGGAACATCCTGAACGAATTGGAGAGTCGCGGCGTGGTGATGAAGAAACATTTCCCCGAAGTGTACTCGCGGCTGGCGGCTTACGTGGACGGCACCAGCGACAGGTTCATACCTATGACGATATACCCGAAAGACGTCACCAGTGGACGGTCCTTCGTCTGCGTCATCATGCCGGACAACGACACGGAATGCGGAACTGCGATCGATAGCAAAGTGACTACAGTGGATGTTGGGGTGGATCGCTCCAAACACCAGCTCTCAACGCCGATGTAG

Protein sequence:

>DPOGS213153-PA
MVSIVLLTTEEVLQRNGFWYCLDSIWITQELEPFQEVEPEQVYAKPMPRDIYYARYPDIPRSESEDEIPLTVKGFWNKHAEWKSRICIRNLCSQNKNMTHSTFSAKSINNNTTIDVSCKAVTSNVKKKNRPEALDDDERIRDFFNRLIESVPPPPVQDVSEFASSMSTSRSIQHNIECIDLPDYADFESDRLLQRFDEIPGPCTSTLKKTTNGTHNSFSSSDSDQEWYETIYGVSELLDPQGYPGKGKLTSDSDCLISWSEILEICGPSSIYSYCNSTEETENIISQSHHMMNNLYDISGDDDEEAYAKFSINKLRQTINTKGKIQDSSSMENLNYEENVLLMSIVEINPSLHETFYRLAPSDSDEDLPPENELQKNSDRVLSEHELRVQRSLQKLNVPEWYKNAPAPREGFLLRKRLSDASSAARWSGLNSKTTSLGSLGANNAQPPPPQLSPHTTSFGRWSTSRLNSNQTSPCSSTRSSVRGASPLCSPSARSSFSARQPYLGWRSQERLNSTPRTPHERLASSLLQQSASAKAAEEIQTSIKEVTSAIVHYVSGLEPANGDVERQPSPRSSQKLYWLESSFVGTKPLESPQTPLVVSESLPPAHPRPPSSLRLEHRAAPDWQDSQRSLNLGVTRPSPGSTTLEDVLDSLLGLPSQPTRVPTPQPSPRKSASPYYLLSGKSPRYEQLASSGHSSISPASRFLGTPSEAPSSLTDPSPDHDRPGKDTVDTPAMQETRRSRSQGEHSRRRSEPFARPSTSLDRRTSLDVAALREQNLTHHDSRTSLASLQTENSTDDTCVKCKYPKCSSRAPLPDAKRHYKTCHNCTTMYCSKECRRAHWEKHRKVCLHSRASSLCRQIISAAKEDSDSLHQISTIAHKGYLAQGRGVVKIFFTSPEAAEKFTTHGYQYLSEPEFVKWTSLQPNEMGAELYTEVVKLCKAYNPETRVILYVAVCIISEVPTKGAVKWERQMVSRCAKLRLSKTVSSAIQEQNRKRNRRDSKGTPDDRETLILTSKLTNAGEKNAATAHKFREICFRNILNELESRGVVMKKHFPEVYSRLAAYVDGTSDRFIPMTIYPKDVTSGRSFVCVIMPDNDTECGTAIDSKVTTVDVGVDRSKHQLSTPM-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: