MonarchBase - Protein-coding gene

DPOGS210820
Transcript	DPOGS210820-TA	2100 bp
Protein	DPOGS210820-PA	699 aa
Genomic position	DPSCF300027 - 526514-533744
RNAseq coverage	353x (Rank: top 33%)

Annotation
*Heliconius*	HMEL008519	0.0	57.67%
*Bombyx*	BGIBMGA007135-TA	0.0	71.48%
*Drosophila*	Axn-PA	2e-59	38.78%
EBI UniRef50	UniRef50_UPI0002063F84	4e-106	35.64%	UPI0002063F84 related cluster n=3 Tax=unknown RepID=UPI0002063F84
NCBI RefSeq	XP_001656733.1	2e-95	35.80%	axis inhibition protein, axin [Aedes aegypti]
NCBI nr blastp	gi\|380029587	7e-107	35.89%	PREDICTED: axin-1-like [Apis florea]
NCBI nr blastx	gi\|380029587	1e-107	35.77%	PREDICTED: axin-1-like [Apis florea]

Group
Gene Ontology	GO:0007275	1.9e-24	multicellular organismal development
	GO:0005622	1.9e-24	intracellular
	GO:0004871	1.9e-24	signal transducer activity
KEGG pathway	aag:AaeL_AAEL003388	5e-95
	K02157 (AXIN1)	maps->	Basal cell carcinoma
			Colorectal cancer
			Pathways in cancer
			Wnt signaling pathway
			Endometrial cancer
InterPro domain	[618-697] IPR001158	1.9e-24	DIX
	[97-225] IPR016137	1.5e-19	Regulator of G protein signalling superfamily
	[109-222] IPR000342	2.4e-15	Regulator of G protein signalling
	[449-487] IPR014936	1e-10	Axin beta-catenin binding
	[209-225] IPR024066	2e-08	Regulator of G-protein signaling, domain 1
Orthology group	MCL12897		Single-copy universal gene

Nucleotide sequence:

>DPOGS210820-TA
ATGTTATTAAGTGTCGTTGTCCAGGTCGTGTCTCGCCATGCAGCGCGCGGGTGGGAGCAGGGCCTTTGCGCCATGAGCCATACTCCTGTAGGCGGCCACCCGCAAGGTTGGGAACACAAGCTTGCTGACAGGTCGTCGCTGCCGCCGGCGCCAGGGGAGGAGAAGAGACAATCTCAGACCAGACATGTGTTCACACACGCACATCTCACCAAAGCGGCCCCGTGTGTGGGCGGCGTTGCGTCGCGGCGCTCGGAGACGGAAGGCTCGTCCGGCAGCTCGGGACGATCCCCGGAGGAACCGCCCTACGCCAGGTGGGCGAGGACACTGCATCATCTGCTCGAGGATGGAGAGGGCGTGCGTCTGTTCCGCAAGTTCGTGTGCGGCGCGGGCGGGCTGCACGTGGACCGCCTCAACTTCTACTTCGCCGTTCAGGGCCTGCGCCAGGAGACCGAGCCCAGCAAGATACGGACCGTCGTCTCCGCCATATACAAGTTCCTCCGCAAGTCTCAGCTAGCGATGCCCGAGGAGCTGAAGCAGCGCGTCAAGCAGAGCCTCAAGGACGGCTCCAACATAGAGAAGACCATCTTCGATAATATGGAACAGGAGGTGACCCGCGCCATCACTGAGTCTACGTACCAGTCGTTCCTGCGGTCGGAGGCCTACGTGTCGTACGTGAGTGCGGCCACTCAGCCGCTGTCCTCGCCTGACGCCTCACCGACACACTCCAGAGAACTATGTGTGGGCACTCTGGCCACTTTACACGAGGGCCAGGAGTTATCAGGCGGCGCCTGTCCGTCCGTGGGCGCCAGGCTCACCCACGACGCTCTGCTCGCCACACAATCCCGACGACTACAGTCAGACGTCGCTCCGCACCGCAAGCGGTCCGTGTACAGCGCGCACGTGTCGTACGCGGGGTACACGCCCGCCTCGCGCCAGGACTCGGAGCGGGCCAGCCTCAGCAGCGGGCGGACGGACAGCGACGCGGTGTCTCTCTCCGGCAGCAGTCTTGACGGCATGTCCCTCCGCGGGTCCCGTGAAGCCCGCGAGTCCCGCCACCGGCCGCGGCTGTACGGCCTCGACCGACACGCCGTCATCAACAAGGAACAAGACACCGCCATGATGATCCCTCGCACGCAGCGTGTGCAGTCGGAGCAGCTCCGAGTGTTGCCGCCGCACGAGTTCGCACCGCTACTGATAGAGAAGCTGGAGCGAGTTAGGAGAGATCAGGACAACAAAGAGAGACTGGAGAGGAGACTCGCTGAGGGCGAAGGCGACGAGCTGTGCGCACAGGCTCTACCGCCACAGCTGGTGGCCGCCGCCATCAGGGAGAAGCTACAGCTGGAGGACGACAACGATCAGGATATACTGGATCAGCACGTGTCTCGTGTGTGGTCAGAGCGCACGCCCGACACGTCCCCGCCGGGAGGGAGGCGCACTCGCGGCCGCCACGGGCCTCACGGCCACGGGTCGCGCCGGGCGGCCTCGGCCCTGTCCGCCGACTCGGGACACTATGACGCGCCCCCGGACTCCCTACACCATCCCCACTCCTTGATACGCAGATCTTTCTCGAAGAAGACGGTGACGGAGCTGACGGACAGCGGGGTGTCGGTGGTGAGCGAGGGGGCGGCCAGTGTGGAGCCGCGCCTGCTGCTGTGGATAGCGGAGGGCTCGGAGAGGGCGGAGAGGCGGCTCAGGGACCTGTCCTCTCGGGGCTCCTCCGCCGACAGGGAAGACCACCGCCGCCGGGACAAGACACAGGCGCGGACACGTACTGGCGCCACTACCGGCAGTACGGGCAGCAAGTCCAGCGGCAGCGGTACAGCTACAGGCGCCACGAGTGGAGCTGGCACCGAGCACACCGTGGTCGTGGTTAACTTCCTGGACGAGAGCGTCCCTTACAGATTCAAGGTGCCCGCCTCGCCGCTCACCCTGCGCACGTTTAAGGAATATCTGCCCAGGAAGGGAAACTATAGATACTTCTTCAAGACGGAGTGCGCGGACCTCGACAACACGGTCATACAGGAGGAGGTGAGCAGCGACGGAGACACGCTGCCCATGTACGAGGGGAAGGTCATGGCCAGGGTCAAGAGCATCGAGTGA

Protein sequence:

>DPOGS210820-PA
MLLSVVVQVVSRHAARGWEQGLCAMSHTPVGGHPQGWEHKLADRSSLPPAPGEEKRQSQTRHVFTHAHLTKAAPCVGGVASRRSETEGSSGSSGRSPEEPPYARWARTLHHLLEDGEGVRLFRKFVCGAGGLHVDRLNFYFAVQGLRQETEPSKIRTVVSAIYKFLRKSQLAMPEELKQRVKQSLKDGSNIEKTIFDNMEQEVTRAITESTYQSFLRSEAYVSYVSAATQPLSSPDASPTHSRELCVGTLATLHEGQELSGGACPSVGARLTHDALLATQSRRLQSDVAPHRKRSVYSAHVSYAGYTPASRQDSERASLSSGRTDSDAVSLSGSSLDGMSLRGSREARESRHRPRLYGLDRHAVINKEQDTAMMIPRTQRVQSEQLRVLPPHEFAPLLIEKLERVRRDQDNKERLERRLAEGEGDELCAQALPPQLVAAAIREKLQLEDDNDQDILDQHVSRVWSERTPDTSPPGGRRTRGRHGPHGHGSRRAASALSADSGHYDAPPDSLHHPHSLIRRSFSKKTVTELTDSGVSVVSEGAASVEPRLLLWIAEGSERAERRLRDLSSRGSSADREDHRRRDKTQARTRTGATTGSTGSKSSGSGTATGATSGAGTEHTVVVVNFLDESVPYRFKVPASPLTLRTFKEYLPRKGNYRYFFKTECADLDNTVIQEEVSSDGDTLPMYEGKVMARVKSIE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: