MonarchBase - Protein-coding gene

DPOGS203361
Transcript	DPOGS203361-TA	2106 bp
Protein	DPOGS203361-PA	701 aa
Genomic position	DPSCF300003 + 86334-92633
RNAseq coverage	317x (Rank: top 36%)

Annotation
*Heliconius*	HMEL022513	4e-15	96.00%
*Bombyx*	BGIBMGA011890-TA	4e-146	81.01%
*Drosophila*	alpha-Cat-PA	1e-154	89.68%
EBI UniRef50	UniRef50_B0WEX3	8e-151	88.26%	Actin binding protein n=2 Tax=Endopterygota RepID=B0WEX3_CULQU
NCBI RefSeq	XP_001965858.1	3e-154	73.30%	GF20570 [Drosophila ananassae]
NCBI nr blastp	gi\|194767509	7e-153	73.30%	GF20570 [Drosophila ananassae]
NCBI nr blastx	gi\|194767509	2e-143	73.30%	GF20570 [Drosophila ananassae]

Group
Gene Ontology	GO:0007155	1.4e-93	cell adhesion
	GO:0015629	1.4e-93	actin cytoskeleton
	GO:0005198	1.4e-93	structural molecule activity
	GO:0045735	2.4e-13	nutrient reservoir activity
KEGG pathway	dan:Dana_GF20570	1e-153
	K05691 (CTNNA)	maps->	Pathways in cancer
			Endometrial cancer
			Leukocyte transendothelial migration
			Bacterial invasion of epithelial cells
			Tight junction
			Adherens junction
			Arrhythmogenic right ventricular cardiomyopathy (ARVC)
InterPro domain	[418-660] IPR006077	1.4e-93	Vinculin/alpha-catenin
	[506-523] IPR017997	1.9e-14	Vinculin
	[63-398] IPR001419	2.4e-13	HMW glutenin
Orthology group	MCL10388		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS203361-TA
ATGTCCAAGTTCGCGGTCCGTGTGGACGCGGCCGTATCAGCCCTCGGTGGAGGGGCGGGTTCTGGTTTGGACGAGAACGACTTCATAGACGCGTCCCGTCTCGTTTATGATGCTGTTAGGGAGATACGGCGAGCTGTCCTCATGAACAGGGGGATAGGACGAACAGGGAGGGTGAGTGATAGAGTAGAGATAGGCCAAGGAGATAGGACGAACAGGGTGAGTGATAGAGTAGAGATAGGCCAAGGAGATAGGACGAACAGGGTGAGTGATAGAGTAGAGATAGGCCAAGGAGATAGGACGAACAGGGTGAGTGATAGAGTAGAGATAGGCCAAGGAGATAGGACGAACAGGGTGAGTGATAGAGTAGAGATAGGCCAAGGAGATAGGACGAACAGGGTGAGTGATAGAGTAGAGATAGGCCAAGGAGATAGGACGAACAGGGTGAGTGATAGAGTAGAGATAGGCCAAGGAGATAGGACGAACAGGGTGAGTGATAGAGTAGAGATAGGCCAAGGAGATAGGACGAACAGGGTGAGTGATAGAGTAGAGATAGGCCAAGGAGATAGGACGAACAGGGTGAGTGATAGAGTAGAGATAGGCCAAGGAGATAGGACGAACAGGGTGAGTGATAGAGTAGAGATAGGCCAAGGAGATAGGACGAACAGGGTGAGTGATAGAGTAGAGATAGGCCAAGGAGATAGGACGAACAGGGTGAGTGATAGAGTAGAGATAGGCCAAGGAGATAGGACGAACAGGGTGAGTGATAGAGTAGAGATAGGCCAAGGAGATAGGACGAACAGGGTGAGTGATAGAGTAGAGATAGGCCAAGGAGATAGGACGAACAGGGTGAGTGATAGAGTAGAGATAGGCCAAGGAGATAGGACGAACAGGGTGAGTGATAGAGTAGAGATAGGCCAAGGAGATAGGACGAACAGGGTGAGTGATAGAGTAGAGATAGGCCAAGGAGATAGGACGAACAGGGTGAGTGATAGAGTAGAGATAGGCCAAGGAGATAGGACGAACAGGGTGAGTGATAGAGTAGAGATAGGCCAAGGAGATAGGACGAACAGGGTGAGTGATAGAGTAGAGATAGGCCAAGGAGATAGGACGAACAGGGTGAATGATAGAGTAGAGATAGGCCAAGGGGATAGGATGAGCAGGGACGAGGAGGATCTGGACCCCGAGGACGTGGAGCTCGACGAGCATTACACCCTGGAAACGAGAAGCAAATGTGAGATCACAGCTCGTGACGAGCATACAAGCGACGATCTGGACACCGACACGGAGTTCGAACCTGTCGAAGATATGACCATGGAGACGAGGAGCAGATCGAGCGCCCACACCGGAGAGCACGGGGTCGACGAATATCCGGACATCAGTGGAATAACGAACGCAAGAGAAGCCATGCGGAAAATGACGGAAGAAGATAAGAGGAAGATACTCCAGCAAGTGGAGTTGTTCAGGCGGGAGAAGATGACCTTCGACAACGAGGTCGCTAAGTGGGACGATGCCGGAAACGACATCATAATGTTGGCCAAACACATGTGTATGATCATGCTCGAAATGACAGACTTCACCAGAGGCCGCGGTCCCTTGAAGACGACCATGGACGTCATTAACGCGGCCAAGAAGATATCGGAGGCTGGAACTAAACTGGACAAACTCACGAGAGAAATAGCCGAACAGTGCCCGGAGTCGTCGACCAAACAGGATTTGCTGGCCTACCTTCAGCGTATAGCGCTCTACTGTCACCAGATACAGATCACCAGCAAGGTGAAGGCGGACGTTCAGAACATATCCGGCGAGCTGATCGTTAGCGGGTTGGACAGCGCCACGTCTCTCATACAAGCTGCCAAAAACCTGATGAATGCTGTGGTGCTGACGGTCAAGGCCTCGTACGTCGCCTCTACGAAATACACCAGACAGGGCACCATCGCCTCACCCATAGTGGTGTGGAGGATGAAGGCCCCGGAGAAGAAGCCGCTCATAAGACCGGAGAAGCCGGAGGAGGTGCGCGCGAAGGTCAGGAGAGGGAGTCAGAAGAAACAACCCAGCCCCATACACGCGCTCGCCGAGTTCCAGAGCCCCGCCGAGAGTGTGTGGTGA

Protein sequence:

>DPOGS203361-PA
MSKFAVRVDAAVSALGGGAGSGLDENDFIDASRLVYDAVREIRRAVLMNRGIGRTGRVSDRVEIGQGDRTNRVSDRVEIGQGDRTNRVSDRVEIGQGDRTNRVSDRVEIGQGDRTNRVSDRVEIGQGDRTNRVSDRVEIGQGDRTNRVSDRVEIGQGDRTNRVSDRVEIGQGDRTNRVSDRVEIGQGDRTNRVSDRVEIGQGDRTNRVSDRVEIGQGDRTNRVSDRVEIGQGDRTNRVSDRVEIGQGDRTNRVSDRVEIGQGDRTNRVSDRVEIGQGDRTNRVSDRVEIGQGDRTNRVSDRVEIGQGDRTNRVSDRVEIGQGDRTNRVSDRVEIGQGDRTNRVSDRVEIGQGDRTNRVSDRVEIGQGDRTNRVNDRVEIGQGDRMSRDEEDLDPEDVELDEHYTLETRSKCEITARDEHTSDDLDTDTEFEPVEDMTMETRSRSSAHTGEHGVDEYPDISGITNAREAMRKMTEEDKRKILQQVELFRREKMTFDNEVAKWDDAGNDIIMLAKHMCMIMLEMTDFTRGRGPLKTTMDVINAAKKISEAGTKLDKLTREIAEQCPESSTKQDLLAYLQRIALYCHQIQITSKVKADVQNISGELIVSGLDSATSLIQAAKNLMNAVVLTVKASYVASTKYTRQGTIASPIVVWRMKAPEKKPLIRPEKPEEVRAKVRRGSQKKQPSPIHALAEFQSPAESVW-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: