MonarchBase - Protein-coding gene

DPOGS207001
Transcript	DPOGS207001-TA	3246 bp
Protein	DPOGS207001-PA	1081 aa
Genomic position	DPSCF300001 + 1002045-1014361
RNAseq coverage	1154x (Rank: top 11%)

Annotation
*Heliconius*	HMEL008673	0.0	87.40%
*Bombyx*	BGIBMGA012921-TA	0.0	69.00%
*Drosophila*	Mhcl-PB	8e-148	48.17%
EBI UniRef50	UniRef50_B4GMK8	9e-174	44.93%	GL12404 n=8 Tax=Eukaryota RepID=B4GMK8_DROPE
NCBI RefSeq	XP_002000205.1	0.0	44.98%	GI10100 [Drosophila mojavensis]
NCBI nr blastp	gi\|322792325	0.0	49.49%	hypothetical protein SINV_06162 [Solenopsis invicta]
NCBI nr blastx	gi\|322792325	0.0	50.11%	hypothetical protein SINV_06162 [Solenopsis invicta]

Group
KEGG pathway
Orthology group	MCL10340		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS207001-TA
ATGCCTCACGTCAGTTCTCCTTCTCGTACTTTGGAAGGGAAGACCGGTAAGCCGATAAGCATTAAGATACCGGAACAGAGAACAAACGGCTCCAATGGTATACTTTCACCGAATTCAAATGGCCCTCTGTCGCCCCCGATACTGGATGCCACACCTAAGAAGCCACCGAAAGCCCCCCTGGGACGAGCTATACTGCCGGTGAAAAAATCTAAGACGCTTCCAATTAATTTTGAAGAAAAAGTCCCTCCTAAGCTATCTTCGGGATTTTTAAGTGGTAAGAAATTTGTTGTTACTAAACCACTCAAAGAGGTCAAAACAATACCACAACAAACGGAGAACGGAAACTATTTATCAACTCGATCTCTGAGTCCTGCTTGTAAGAGAAGTACATCGGTTACAATAGAAACAGGTTCGATCGCGGAGCTTGCTCGGAGACATGGCTCCAACAATATCCTTACGTCGCGATCACCAAGTCCCTCTTCCTACGGAAGTGTCAAAAGTTCTGGAAGCTACTACTCGACATGTAGCAGTAACAGCACATTCGTTCCATTATCCCGTTCATCGAGCTTAACTTCTACGCTCTATAACAGAACTCCTACTCCGCGAAGAATGTACCCACAGACCTCTGACAACTCGGATAATGTCGACCTCAAAGAACTGACGTCTAAAGAGCAAGCGCCCGTCGTCTTCGATGCGAATCTATCATTTGTGCTTGGTTGTAAGAAGCAGCCTGTACGACAAAAGTTCAAGCCGATAGCTGCTCATCTTGAAGAGGGAACCTCGTCCAATTACTTGAGTACTAAAATAGACAACTTTCTGAAAAGAACCGATCATGTTATGGATGAGTGGAGAAGAATGGGCCACAAAGATGAACCGGATCTTGAAATGTATTATGATGGAAAAAAGAGAAAAATTGGTAGATCAAAATCTGCTACAAATATTATGATAAAAGGGTTCACTCTGTTCAGTCGCAGCGGAAGCCGAGCTAGTAGCGTCTGTAGGTCCTCGAGGGGCATATCTGAAGATCGTACCACAGTTTCTGAAATGGATGAGTTATCAGAGGTTGGCGGTGAGTTGTCCGATGAGCGTGCGGCAGCAGCTCTAGCGACCGAACGAGCTGATGCAGAGGCTGCGGAGAGACTCCGGATTGAGAGAGACAATAGAGAATTGCTGGCTAACAACCAACGTCTACAACAGGCATCCGAACGCTTGGAGCTGGAACTCCTTCATTGGAGATCTGCGGAGAATGGTAACGCTGAGCCGTCAGACTCCGAGGGTTCGGAAGCGGACGGAAGTGCCAGCGGCGATAAGTACAAGAGGCGGTTCGAGAGGGCACACAGAGAGCTGCAGCTGCTCAGGGCCCAGCTGAGGAGACAGCACGAGGACGACCTGGAACAGCTGGTGACGGTCAAGAAACAGCTGGAAAAGAAGGTTCAAGATGCCTACGAGGAGGTCGAGGAACAGCGTGCGGTCGCTGCACAATGGAAACGCAAACTGCAAAAGCTCACCAACGATATGGCTGATCTGAGATCATTGCTTGACGAACAAACGTGTCGTAACAATCTCCTGGAGAAACGTCAGCGGAAGTTTGACGCGGAGCTCCACAGTGCCCAGGAGGAGTTGAAGAGAGAGAGAGCGGCCAAGGAGAGACTCTCCCGGGAGAGAGATCAGGCACACGCGGAGAAATACGCACTGGAACAGAGTCTATCAGAGGCTCGCATGGAGGTGGAACTTAAGGAGGAGCGTCTTCTGTCAGCGGCGAGGGAGTTGGAGGAGAGGGGAGGAGGGGACGAGGTGGCCGCTCTCAGGAGAACACGCGGCGAGCTGGAGAGACGAGTGAGAGACCAGGAGGAGGAGCTGGACGAGCTGGCCGGACAGATACAGTTATTGGAGAGTTCTAAGCTTCGCCTGGAGATGCTTTTGGAGCAGCAGCGGAAGGAGGCTCGCCTGGAAGCTGCCGCTAGAGACGACGAGATGGAAGAAACTAGAGCGAACGCCTCTAAGAAACTTAAAATGCTGGAGAGTCAGCTGGAGAGCGAGCATTCAGAGCGGTCGCTGCTCCTCCGAGAGCGACACGAGCTGGAGAGACGGCTGGCAGCGCTGGAGGAAGCCGCTCGCCAGGAGACACATGAACAGGGACAGCTGGTCATTAGACTTAAGAGGGATGTGAAACGTTACCGCGCCCTGCTGCGAGACGCTCAGACGATGTTGGAACAGAAGGAAAAGGAAGGTGGAGGGAAGACTCAGATAAGACATTTGAAAAACCAGGTGGAAGACTTGGAGTTGTCGCTCCGCGCTGCTAACAAGGCACGCTCGACAGCTGAGAGTGAGGCGAGCGAGGCGACCGCAGCCCTAGAGGAGACCGCGCGCGCCCGAAACGAGGCCGTGGAGAGAGCGCATGCCGCCACGAGGGACGCCGCCGCCGCACGCGCAGCCCTAGACGACGCTGAGGAGGAAGCCGCCGAGCTGCTGAAGAAGTATCGGGCGAGTACGAGCGCGCTGTGCGCCGCTCAGGCAGCCGCCCGCGAGGCTGAGTCCCGAGCGGAGGCTGCGGCTGAAGAAGCACGTCAGGCGCGAGAGAAACTCACTGAGATGACCACTAGACTGGCACACGCTGAGGCCGGTCACACACACGAACAACACGAAGCCGGCAGACGACTCGAACTCAGGAATAAGGAATTGGAATCGAGTCTGGAGTTAGAAGCGACGTCCCGGGCCCGTCTTGAGGGACAGTTGGCTAGACTGAGGGACTCTCACGAACAACTCGCCAGTGAACTTAGCGCAGCACGCGCCAAAGATCACCAGGCCGCGGAGGAAGTTAGAAAACTTACAAGACAACTGAGGGAATTGAAGGAAGAGAACGCAGCTCTGTCGTCTAAGCTGAGCGAGGTGTCGCGGGCTAAGAGCACGGCAGAGGCGGCAGCAGCGGCCGCAGCAGCGGAGGCCTCCGCCGCCCGGGACGAAGCTCGCCTGGCGGCACGTCGTGCGGCAGCCTTACAGGAAGCGATCGCGGGGGATCTCTCCAGCCCCGGGGACTCCAGGGACACTGACAGCGACAACGACAGTTACAGTTCTGACGAATCGATAGGGACGTTCCTCGCCAACCACAAGCTGAGCCCGTCAGTGCCTTCGCGTGCCAGTCTTCATCTAGACTCACAGAAATCCCAAAGCCCGGAAGGACGTCAGAGCAGGTCGAGCGTCGGTTCTAGCACTAAGTTGAGTCCAACGAAGGAATCGTTCGCATAA

Protein sequence:

>DPOGS207001-PA
MPHVSSPSRTLEGKTGKPISIKIPEQRTNGSNGILSPNSNGPLSPPILDATPKKPPKAPLGRAILPVKKSKTLPINFEEKVPPKLSSGFLSGKKFVVTKPLKEVKTIPQQTENGNYLSTRSLSPACKRSTSVTIETGSIAELARRHGSNNILTSRSPSPSSYGSVKSSGSYYSTCSSNSTFVPLSRSSSLTSTLYNRTPTPRRMYPQTSDNSDNVDLKELTSKEQAPVVFDANLSFVLGCKKQPVRQKFKPIAAHLEEGTSSNYLSTKIDNFLKRTDHVMDEWRRMGHKDEPDLEMYYDGKKRKIGRSKSATNIMIKGFTLFSRSGSRASSVCRSSRGISEDRTTVSEMDELSEVGGELSDERAAAALATERADAEAAERLRIERDNRELLANNQRLQQASERLELELLHWRSAENGNAEPSDSEGSEADGSASGDKYKRRFERAHRELQLLRAQLRRQHEDDLEQLVTVKKQLEKKVQDAYEEVEEQRAVAAQWKRKLQKLTNDMADLRSLLDEQTCRNNLLEKRQRKFDAELHSAQEELKRERAAKERLSRERDQAHAEKYALEQSLSEARMEVELKEERLLSAARELEERGGGDEVAALRRTRGELERRVRDQEEELDELAGQIQLLESSKLRLEMLLEQQRKEARLEAAARDDEMEETRANASKKLKMLESQLESEHSERSLLLRERHELERRLAALEEAARQETHEQGQLVIRLKRDVKRYRALLRDAQTMLEQKEKEGGGKTQIRHLKNQVEDLELSLRAANKARSTAESEASEATAALEETARARNEAVERAHAATRDAAAARAALDDAEEEAAELLKKYRASTSALCAAQAAAREAESRAEAAAEEARQAREKLTEMTTRLAHAEAGHTHEQHEAGRRLELRNKELESSLELEATSRARLEGQLARLRDSHEQLASELSAARAKDHQAAEEVRKLTRQLRELKEENAALSSKLSEVSRAKSTAEAAAAAAAAEASAARDEARLAARRAAALQEAIAGDLSSPGDSRDTDSDNDSYSSDESIGTFLANHKLSPSVPSRASLHLDSQKSQSPEGRQSRSSVGSSTKLSPTKESFA-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: