MonarchBase - Protein-coding gene

DPOGS216173
Transcript	DPOGS216173-TA	3357 bp
Protein	DPOGS216173-PA	1118 aa
Genomic position	DPSCF300155 + 284753-295879
RNAseq coverage	673x (Rank: top 19%)

Annotation
*Heliconius*	HMEL016561	3e-173	71.59%
*Bombyx*	BGIBMGA014159-TA	4e-169	58.16%
*Drosophila*	CG2247-PB	2e-20	24.75%
EBI UniRef50	UniRef50_UPI00022C9585	2e-104	50.86%	UPI00022C9585 related cluster n=1 Tax=unknown RepID=UPI00022C9585
NCBI RefSeq	XP_975618.1	5e-105	50.63%	PREDICTED: similar to conserved hypothetical protein [Tribolium castaneum]
NCBI nr blastp	gi\|350408186	8e-104	50.86%	PREDICTED: hypothetical protein LOC100740617 [Bombus impatiens]
NCBI nr blastx	gi\|270005259	4e-108	38.10%	hypothetical protein TcasGA2_TC007283 [Tribolium castaneum]

Nucleotide sequence:

>DPOGS216173-TA
ATGTCGGAAGAAATGGCGGTGGGTGATAACGCATCAAATGAGGAGCATAAAGTCGCCAGCGAAGATGTGGGCTCGGAGGGAATGGATTCTGCTGACGCTACAGAAGTTCCAGCTGTATTAAAAACTGCTGAGACAGAAATTAAACCAGAAATAAATGAAAATGCCGAAGACTCGGAATTGCAAGCAGAAATGGAGAGTGAAGAAAATGAAATTGAGGAATATAAAGAAATTGAAGAAAAAATGCAAGAAATAAACCAAGAAACTCAAGACGCAAGTGATGAAGCTGCTAGAGGTGTGAAGCGTAGACTGTCGACAGCATTCAGCGACGATGGAGAGGAGTTTAAAGGCTTTGATCAGTGTGAACCGAGCAGCCTGGACGACTACAGCAAAACTGTTGAGGATGGGAGACGAGTTAAACCGAGAACCTCAAGTGATAGCGATGGTTTCAAAGGTTTTGACCTTATAGAGCATAACAATCTGACAGGCTACTGTCAGGTTTTAGAACGGCTGGAAGCTGAAGTGCTAGCAGCTGCAAAGACATATACTCCTGTTCGACGTGTGATGGCATCACTTCAAAGAAGGATCGATGCAAGCGGGTGTACCAAGTGGTCAGAACATCTTGAGGCTGAGGTTTCTGAAGTTGTGAGGAGCTTCTCCACCGACGATGACTCCAAGCTGAGAAAGCGGACCGAAGGATCGAGACCCTCGTCGGCTTTGTCATCAAGATCTGACGGTGATGGCGGTGTGTCAACTGATAAACCTCAGCCTCAAGATGTTCTGACCACTTGGTACACCCGCTTGCATCGATCCTTCTTTGAAGTGATGCCATCACACGTCGGACAGGAGGATGCGAAAGTCCAGCGTCGTGTTGAGTCTCCAGTGCCAGCAGTCACACCGACCTTAGAGTCCAAGAGAACTCCAAAGCCCAAACCTCCGAAGGGAGCCAGCCCCGAGCCTGGGATGAAGTCACCCCCTGGGAAGTTAAAGGTGTCGCAGGTGAAGTCAATGGGCTCCAGGTTGAGTAGCAACGGTGCACCAGCTGCGAAACAGGTGAAGAAGACCCCACAACAAGCGGTCACACATGACAACAACAACATGGCCGCCTGGAAGAAACCTAGGGGCCCGCCGACGGTGCAGCCGCGGCCGGTGGCAGGGCAGCCGGGGACGACGACACCGCCGGCGCAGCTCGCACAGCACACACAGCCCGCGAGCCTCGCACAAGCCGCTCATCACGTGCAGCCTGTGCAACCAGCCCAGCACATACAGCCTATCCACCCCGCCCCCGCACCCGCCCACGCCCCGCATCAGATATCCGTTCCCCGGCCGCAGCTCACACCGGACAGAGATGTACCGCCTCCCTTACACCATCAGAACCGTCAGATCCAACAGCCGTGTTCCATGACGTGCGGGACGGGTGTGCCGTCGTTGGCCTGCGAGGCCTGCCTCTGTTTGTACCACCCGGCCTGTGTGGGGCTCCGTCTGCCGCAGGACACGTTCCTGTGTAAGAACTGTCGTAAGACTTCATCTCCGCCGGTGGAGCCCCCGCCCCTCACCCACAAGTCGGGCGTGACGTCACTACCGGCCGGAGCTGGCCCCGGGGCTCCGTGCTCGTCCAGCGCCAGGCGCCTTCCGGTCCCAGTCCCAGTACCAGTACCGAAATCGAGAAATGACAAGCGAGTGCTCTTGAGAATGAAGGTTGCGGGCGGCGGTCCTGATGGCGAGCGTGTGTGGTCCGTGGCCAAGCCGGGCGCTCCGGCCCCGGCTCCGCCCCCCGCTCCGCCCCACTCCGCGCCCACACCCCCTCCGTCCAATCCCCCCACCACCACCTGCCGGCCTTCATTACCACAGTCGCTGGTGGTGCTAAACGGCAGACGGTTCATAGTAGTAGCTAGAGCTGTGCATCATGATATTAAAGTACGCCGCGGAGTGTCCAACGGCGCTTCGCCCCCGCCGGCTGCGCCCTCGCCCGCTCTGAGACGAAGAGTCAAAAAAGACGACACCGATTACTTCACACCCTTCATAGAAAAGGCTAAGGCGAACAACTATAATGTAGCTGTACAGATCTTCCAGTACTTAGGCATGCGTGATGTAGCGCGCGCCGCCCGCACGTGCTCGCTGTGGGCGGAACTAGCCGCTACACCCGCACTATGGAGGCACGTACGGATGAAGAATTCGCACATCTTCCAGTACTTAGGCATGCGTGATGTGGCGCGCGCCGCCCGCACGTGCTCGCTGTGGGCGGAACTAGCCGCTACACCCGCACTATGGAGGCACGTACGGATGAAGAACTCGCACGTGAGTGACTGGGCGGGCCTGTGCGCCGCTCTCCGCCGCCACGGGACCCGCTGGCTCGACCTCCGCAAGATGTTGCTGCCACCAAATGACACGTTATTCTGGGATCAGTTCGCGGAACACATCGGCACCGTCGACACGCTCGAGAGACTAGAGCTATGTCGCTGTCCCGCCCGCGCGGTGGAGGCGTCCTGTGAGCGTGTCCCGGGTCTGCGCGCGTTGTCCGCGCCCGCCATACGGGACGCCAGACTCGACCCCGCGCCACTCGCCAGACTCACTAGACTGGAGCTGCTCAGACTCAAGAGCCTCACAGGTCTATCGTTGACGCGAGACCTCCGCCCCCTGGCCGGCCTCTCTAGACTCCAACACCTGTCGCTGACGTCCATCAAGGAGCTGGGCTGGTGCGCCTGTGAGGTGGTCGGACAGTTGGAACAGCTGGAGTCGCTGGAGCTGGGAGAGTGCTCCTTCGGCGGTTCCTTCGCCACGGCTCTCGGAAAACTGGTCAAGTTGCGGAAGTTAAGGCTGGAGCGAGGGGTGGCACATTGCGCCGCGCCGGCATTGCTAAGAGCACTGGCAGCCCTGCCCAAACTGACACGGCTGGAGTTAGTTAATTTCGATGTTAAGGTCGGCTTCGACGATGCTCTGGCGGAGTGTAAAAACATACAGAGACTGCTCATCATACCGACGTACGTGTCGCAGTCGGCCACCACCAACAAACAGGTTCTGAGCGGTGTGCTGCGATTGAAAGAGACCCTGACGCATCTCATGTGGGGTGTGACCATCGAGCTGCTGAGGGTCACGGAGCTGTTCATAGACCAGTGTGAGGCGGGCGACGGAGACACCAAGCGGCGGGACGTAGGGGAGTGCATACCCGTCCTCAAGCCGGTCCCCGGGTGTCGTCTGCCCGACGACCACCGCACCGTGGCCGGACCTCCGCAGGTTGAAATTCTACCCATCCCGACCCTCCAGCGGTTGCTGGCGGCTCAGCTGCCGCGGACCAAGCTCAAGCTGCTCCGGATCCCCTTCCACGCCACCTGGAGACAGTCGCTGGCTGATTTCCAATAG

Protein sequence:

>DPOGS216173-PA
MSEEMAVGDNASNEEHKVASEDVGSEGMDSADATEVPAVLKTAETEIKPEINENAEDSELQAEMESEENEIEEYKEIEEKMQEINQETQDASDEAARGVKRRLSTAFSDDGEEFKGFDQCEPSSLDDYSKTVEDGRRVKPRTSSDSDGFKGFDLIEHNNLTGYCQVLERLEAEVLAAAKTYTPVRRVMASLQRRIDASGCTKWSEHLEAEVSEVVRSFSTDDDSKLRKRTEGSRPSSALSSRSDGDGGVSTDKPQPQDVLTTWYTRLHRSFFEVMPSHVGQEDAKVQRRVESPVPAVTPTLESKRTPKPKPPKGASPEPGMKSPPGKLKVSQVKSMGSRLSSNGAPAAKQVKKTPQQAVTHDNNNMAAWKKPRGPPTVQPRPVAGQPGTTTPPAQLAQHTQPASLAQAAHHVQPVQPAQHIQPIHPAPAPAHAPHQISVPRPQLTPDRDVPPPLHHQNRQIQQPCSMTCGTGVPSLACEACLCLYHPACVGLRLPQDTFLCKNCRKTSSPPVEPPPLTHKSGVTSLPAGAGPGAPCSSSARRLPVPVPVPVPKSRNDKRVLLRMKVAGGGPDGERVWSVAKPGAPAPAPPPAPPHSAPTPPPSNPPTTTCRPSLPQSLVVLNGRRFIVVARAVHHDIKVRRGVSNGASPPPAAPSPALRRRVKKDDTDYFTPFIEKAKANNYNVAVQIFQYLGMRDVARAARTCSLWAELAATPALWRHVRMKNSHIFQYLGMRDVARAARTCSLWAELAATPALWRHVRMKNSHVSDWAGLCAALRRHGTRWLDLRKMLLPPNDTLFWDQFAEHIGTVDTLERLELCRCPARAVEASCERVPGLRALSAPAIRDARLDPAPLARLTRLELLRLKSLTGLSLTRDLRPLAGLSRLQHLSLTSIKELGWCACEVVGQLEQLESLELGECSFGGSFATALGKLVKLRKLRLERGVAHCAAPALLRALAALPKLTRLELVNFDVKVGFDDALAECKNIQRLLIIPTYVSQSATTNKQVLSGVLRLKETLTHLMWGVTIELLRVTELFIDQCEAGDGDTKRRDVGECIPVLKPVPGCRLPDDHRTVAGPPQVEILPIPTLQRLLAAQLPRTKLKLLRIPFHATWRQSLADFQ-

Group
KEGG pathway	dpe:Dper_GL26894	3e-17
	K03083 (GSK3B)	maps->	Axon guidance
			Prostate cancer
			Alzheimer's disease
			B cell receptor signaling pathway
			Hedgehog signaling pathway
			Pathways in cancer
			Chemokine signaling pathway
			Endometrial cancer
			Insulin signaling pathway
			Neurotrophin signaling pathway
			T cell receptor signaling pathway
			Melanogenesis
			Focal adhesion
			ErbB signaling pathway
			Basal cell carcinoma
			Colorectal cancer
			Wnt signaling pathway
			Circadian rhythm - fly
			Cell cycle
InterPro domain	[684-724] IPR022364	1.1e-08	F-box domain, Skp2-like
	[445-513] IPR011011	3.8e-07	Zinc finger, FYVE/PHD-type
Orthology group	MCL17437		Insect specific

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: