MonarchBase - Protein-coding gene

DPOGS202907
Transcript	DPOGS202907-TA	2538 bp
Protein	DPOGS202907-PA	845 aa
Genomic position	DPSCF300126 + 213489-227552
RNAseq coverage	334x (Rank: top 35%)

Annotation
*Heliconius*	HMEL004897	9e-142	71.23%
*Bombyx*	BGIBMGA004180-TA	6e-94	62.77%
*Drosophila*	key-PB	1e-08	31.71%
EBI UniRef50	UniRef50_E0VHH6	2e-20	24.45%	Optineurin, putative n=1 Tax=Pediculus humanus corporis RepID=E0VHH6_PEDHC
NCBI RefSeq	XP_002425570.1	3e-21	24.45%	Optineurin, putative [Pediculus humanus corporis]
NCBI nr blastp	gi\|242009598	6e-20	24.45%	Optineurin, putative [Pediculus humanus corporis]
NCBI nr blastx	gi\|154413468	2e-30	21.11%	viral A-type inclusion protein [Trichomonas vaginalis G3]

Nucleotide sequence:

>DPOGS202907-TA
ATGGCATCCAGTCCTGACAATGAAGACGACTCCCTCATCGTGATCCTGGGTACATCCCCCGGCGGCAGTATGGTTGAAAAAAGTAATGGCACAACAAATGGAGATCTAGAAAGATCACAAATAGAAGATGCTATGAGATCACTATCAAATGAAGCTAATATGGCTTTTAAGGCTCAATTTAATTTGGGTGAAAGTCCGTCACCAGCCAGTATGATGGTAGCGAGTACTATAATAACCGAGGACAGGAGTACAGAGGAGTTGCAAAAGAGATTCGGCGATTTATTGGACGAGAATTTTGTATTGAAGGAGACTTTGAAGCAAAACAACGACTCTATGAAGGAGCAGTTCATACTGATAGCGTCGTGTCAGGAAGATATGCTGAAGACACACCGACTGCACAAGGAAAAGTTTGATGAAACAAGGGAGCTTGTCGAGCGGCTTAGACAAGAAAATAAGCAACTCAAAATGGATATATCACGTCTGGCAGAAGGTGAACAGAACAGTATCGGCCAAAAAAAACTGTCAGGCTTCGAACTGGTCACATCAGTTGAGGAAGATACTATCGAGAAGCTGTCATCACAGTTAGAACTCGTCGAGAAACAGAGACGACAGTTGATAGTTGACAACGAGAAGCTGAGCTGGCAGAAGGAATCCCTAGAACATATAGTTGATTCCATGAACAAGGAGAGAGACGACGCCAAGAAAAAGCTACACAAGGTCGAGCTTCAACTCTCCACTATGGAGAACGATCATGCTCAGGAAGTGAGCAAACTGCACTGCATCATAAGTGACCTGCAAAACAAAATGAAGACGCAGAGTGTGAATACATCTCCAGAGGAGGTTTCCAAACGTGATGTGTACATACAGAAGCTGGAGGGCAAGATGTCCTTATTACAGAATGAATTGAAGAAAGCTCAGATAAAGATTCTTGACCTGGAAAATATTAAGTTGGAATTCAGCCAGCACAAGTCCAACGTGTCTGAGACGGTGAAAATGTACAAAGACCAGATCCAGGAACTAAAGGATAGAATTAAAGAGGTCCAAACGACGCCGTCACCAGCCAGTATGATGGTAGCGAGTACTATAATAACCGAGGACAGGAGTACAGAGGAGTTGCAAAAGAGATTCGGCGATTTATTGGACGAGAATTTTGTATTGAAGGAGACTTTGAAGCAAAACAACGACTCTATGAAGGAGCAGTTCATACTGATAGCGTCGTGTCAGGAAGATATGCTGAAGACACACCGACTGCACAAGGAAAAGTTTGATGAAACAAGGGAGCTTGTCGAGCGGCTTAGACAAGAAAATAAGCAACTCAAAATGGATATATCACGTCTGGCTGAAGGTGAACACAACAGTATCGGCCAAAAAAAACTGTCAGGCTTCGAACTGGTCACATCAGTTGAGGAAGATACTATCGAGAAGCTGTCATCACAGTTAGAACTCGTCGAGAAACAGAGGCGACAGAATACATCTCCAGAGGAGGTTTCCAAACGTGATGTGTACATACAGAAGCTGGAGGGCAAGATGTCCTTATTACAGAATGAATTGAAGAAAGCTCAGATAAAGATTCTTGACCTGGAAAATATTAAGTTGGAATTCAGCCAGCACAAGTCCAACGTGTCTGAGACGGTGAAAATGTACAAAGACCAGATCCAGGAACTAAAGGATAGAATTAAAGAGGTCCAAACGACGGTGTTCCAGCCCATCCGCGTGTCCGTGTCGGAGCCGTCGAGTTCGTCCGAGTTCCTCAACAATGTCAAGCTCTACGACCGCACGCTCAAGCACCTGGCCGACTACCTCAACTCGCTCAGTAACGGGCTATCTGATAGTCTAGCTCACACCCTGGGCGTGGTGTCCAGTATACAGGATGTTAAGATCGACCGCGGCTCAGTGGACAAGGTCAAGTGTGGAGTCGGGGAGCTCAAGACTCTCATAGCAACACAGCACTCTAACGTTGTGTCTAACGTAGCTCATGTCCGAAGCACGCTGTCCACGTTCGAAGGCATCTTTAAGGATCACAACGAACTGTTGAAGAGATCCGTCACCAACACCGACACGGTGCAGGCTCCGTGTGTGCAGCAGTTGACGGAAGCGCTCGTGGCTCGCGGCCAGCAGGTGTCCGAACTGCTGGAAGAGCTGGCAGCTGTGAAGGCACGCACCGACGACGCCGACTTACTGAGGGCCCAGGTCGACTTGTACAAAAGCGACTTCGAAGCTGAGAGGGAATCCCGAGAGAAGATGGCCAGCGAGAAAGAAAATCTCCTCGCAGACCTCAGAGTGGCTCAGAAGAAGATACAAGACTTGACAACACAGTTGGAGGAGCTTCGTGTTCTGAGTCCAAGCCTGCACAAGAGCATCACCAGCCCTCGCCCGCGGTCCGCCGGCAAGCCCGCCCCCACCACCACCGCCCGCACTGCCCCCGCCACCGCTGTCGCAGCCAACGCTGCCTTCAGGTGTCCTAAATGCATGATGTTCTCCAGCGACCAGTACAACCTCATGGAGGAGCACTTCGAATACTGTCTAGACGACTTTTAA

Protein sequence:

>DPOGS202907-PA
MASSPDNEDDSLIVILGTSPGGSMVEKSNGTTNGDLERSQIEDAMRSLSNEANMAFKAQFNLGESPSPASMMVASTIITEDRSTEELQKRFGDLLDENFVLKETLKQNNDSMKEQFILIASCQEDMLKTHRLHKEKFDETRELVERLRQENKQLKMDISRLAEGEQNSIGQKKLSGFELVTSVEEDTIEKLSSQLELVEKQRRQLIVDNEKLSWQKESLEHIVDSMNKERDDAKKKLHKVELQLSTMENDHAQEVSKLHCIISDLQNKMKTQSVNTSPEEVSKRDVYIQKLEGKMSLLQNELKKAQIKILDLENIKLEFSQHKSNVSETVKMYKDQIQELKDRIKEVQTTPSPASMMVASTIITEDRSTEELQKRFGDLLDENFVLKETLKQNNDSMKEQFILIASCQEDMLKTHRLHKEKFDETRELVERLRQENKQLKMDISRLAEGEHNSIGQKKLSGFELVTSVEEDTIEKLSSQLELVEKQRRQNTSPEEVSKRDVYIQKLEGKMSLLQNELKKAQIKILDLENIKLEFSQHKSNVSETVKMYKDQIQELKDRIKEVQTTVFQPIRVSVSEPSSSSEFLNNVKLYDRTLKHLADYLNSLSNGLSDSLAHTLGVVSSIQDVKIDRGSVDKVKCGVGELKTLIATQHSNVVSNVAHVRSTLSTFEGIFKDHNELLKRSVTNTDTVQAPCVQQLTEALVARGQQVSELLEELAAVKARTDDADLLRAQVDLYKSDFEAERESREKMASEKENLLADLRVAQKKIQDLTTQLEELRVLSPSLHKSITSPRPRSAGKPAPTTTARTAPATAVAANAAFRCPKCMMFSSDQYNLMEEHFEYCLDDF-

Group
KEGG pathway	xla:735069	2e-07
	K07210 (IKBKG, IKKG, NEMO)	maps->	Prostate cancer
			Toll-like receptor signaling pathway
			MAPK signaling pathway
			B cell receptor signaling pathway
			Pathways in cancer
			Shigellosis
			Chemokine signaling pathway
			Adipocytokine signaling pathway
			Chagas disease
			T cell receptor signaling pathway
			RIG-I-like receptor signaling pathway
			Apoptosis
			Small cell lung cancer
			Cytosolic DNA-sensing pathway
			Pancreatic cancer
			Acute myeloid leukemia
			Primary immunodeficiency
			NOD-like receptor signaling pathway
			Epithelial cell signaling in Helicobacter pylori infection
			Chronic myeloid leukemia
InterPro domain	[86-151] IPR021063	6e-08	NF-kappa-B essential modulator NEMO, N-terminal
Orthology group	MCL20413		Insect specific

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: