MonarchBase - Protein-coding gene

DPOGS210684
Transcript	DPOGS210684-TA	1089 bp
Protein	DPOGS210684-PA	362 aa
Genomic position	DPSCF300013 - 896469-904231
RNAseq coverage	191x (Rank: top 48%)

Annotation
*Heliconius*	HMEL005425	2e-114	84.10%
*Bombyx*	BGIBMGA006299-TA	2e-81	65.50%
*Drosophila*	CASK-PF	3e-166	67.22%
EBI UniRef50	UniRef50_Q24210-4	2e-171	69.12%	Isoform G of Peripheral plasma membrane protein CASK n=48 Tax=Bilateria RepID=Q24210-4
NCBI RefSeq	XP_002058710.1	1e-176	72.21%	GJ14160 [Drosophila virilis]
NCBI nr blastp	gi\|270003442	2e-179	74.44%	hypothetical protein TcasGA2_TC002673 [Tribolium castaneum]
NCBI nr blastx	gi\|195143609	6e-169	72.46%	GL23741 [Drosophila persimilis]

Group
Gene Ontology	GO:0005515	4.4e-44	protein binding
KEGG pathway	dvi:Dvir_GJ14160	4e-176
	K06103 (CASK)	maps->	Tight junction
InterPro domain	[204-347] IPR008144	4.4e-44	Guanylate kinase
	[182-350] IPR008145	2.7e-39	Guanylate kinase/L-type calcium channel
	[54-199] IPR001452	5.2e-38	Src homology-3 domain
	[1-82] IPR001478	3.3e-17	PDZ/DHR/GLGF
	[91-154] IPR011511	1.2e-08	Variant SH3
Orthology group	MCL10346		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS210684-TA
ATGGGCATTACACTAAAACTGGCTGATGACGGACGTTGCATTGTTGCTCGGATCATGCATGGTGGAATGATACACCGACAAGCGACTCTACACGTGGGAGATGAGATCAAGGAAATTAATGGCACACCAGTAGCCAATCAATCTGTCGCTCAACTTCAAAGGATGCTGCGTGAAGCGCGTGGTTCAGTGACGTTCAAGATTGTGCCATCATACCGATCGGCTCCTCCGCCGTGCGAGCTATTCCGGATTAAGCCTTCGCCCGTGCTAATATTCGTTAGAGCGCAGTTTGACTACGATCCCTTAGAGGACGAACTAATACCCTGCGCTCAAGCTGGTATAGCGTTCAGCACAGGGGATATACTGCAGATAATCAGCAAGGATGACTCCCATTGGTGGCAGGCGCGGAAGGACGCATCAGGTGGATCAGCCGGTCTCATACCGAGTCCTGAACTACAAGAGTGGCGCGCCGCTTGCGCTGCCGCCGAAAGAAGTAACACAGATCAAGTGAATTGTTCTATATTCGGAAGAAAAAAGAAACAGGCCAAAGACAAATATTTGGCGAAACACAACGCCGTGTTCGATCAACTAGATGTTGTAACATACGAAGAAGTTGTTAAACTTCCCTACACCACGAGACCCCCTCGAACCGATGAGGAAAACGGCAGACATTACTACTTCGTTACCCACGACGAGATGATGGCTGACATAGCCGCTAACGAGTACCTCGAATACGGAACCCACGAGGACGCGATGTACGGAACAAAACTAGAGACGATACGCCGCATACATTCTGAGCGTCGCATAGCCATATTGGATGTGGAGCCACAAGCTCTTAAAATACTACGAACAGCGGAGTTCGCGCCATACGTGGTTTTCGTGGCCGCACCCTCTCTTAACAATGTCGCTGATTACGACGGTTCCTTAGAGGTGCTCGCGCGCGAGTCTGAGACGCTCCGCCGTACATACGGCCATTACTTCGACATGTCCATAGTCAACAATGACATTGACGACACACTCGGCCAGCTGGAGGCGGCACTAGCTAGGATGCGGTCCACACCACAGTGGGTACCAGTCTCCTGGGTTTACTGA

Protein sequence:

>DPOGS210684-PA
MGITLKLADDGRCIVARIMHGGMIHRQATLHVGDEIKEINGTPVANQSVAQLQRMLREARGSVTFKIVPSYRSAPPPCELFRIKPSPVLIFVRAQFDYDPLEDELIPCAQAGIAFSTGDILQIISKDDSHWWQARKDASGGSAGLIPSPELQEWRAACAAAERSNTDQVNCSIFGRKKKQAKDKYLAKHNAVFDQLDVVTYEEVVKLPYTTRPPRTDEENGRHYYFVTHDEMMADIAANEYLEYGTHEDAMYGTKLETIRRIHSERRIAILDVEPQALKILRTAEFAPYVVFVAAPSLNNVADYDGSLEVLARESETLRRTYGHYFDMSIVNNDIDDTLGQLEAALARMRSTPQWVPVSWVY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: