MonarchBase - Protein-coding gene

DPOGS211456
Transcript	DPOGS211456-TA	1809 bp
Protein	DPOGS211456-PA	602 aa
Genomic position	DPSCF300223 + 135541-139800
RNAseq coverage	28x (Rank: top 76%)

Annotation
*Heliconius*	HMEL013823	4e-65	54.33%
*Bombyx*	BGIBMGA002162-TA	1e-165	57.95%
*Drosophila*	Cad96Cb-PB	7e-127	45.66%
EBI UniRef50	UniRef50_Q9VBV6	1e-124	45.66%	Cad96Cb, isoform B n=17 Tax=Drosophila RepID=Q9VBV6_DROME
NCBI RefSeq	NP_001163727.1	2e-126	45.64%	Cad96Cb, isoform C [Drosophila melanogaster]
NCBI nr blastp	gi\|281362550	4e-125	45.64%	Cad96Cb, isoform C [Drosophila melanogaster]
NCBI nr blastx	gi\|281362550	1e-123	45.32%	Cad96Cb, isoform C [Drosophila melanogaster]

Group
Gene Ontology	GO:0016020	1.8e-28	membrane
	GO:0005509	1.8e-28	calcium ion binding
	GO:0007156	3.2e-25	homophilic cell adhesion
KEGG pathway
InterPro domain	[124-230] IPR015919	1.8e-28	Cadherin-like
	[128-235] IPR002126	3.2e-25	Cadherin
Orthology group	MCL16152		Insect specific

Nucleotide sequence:

>DPOGS211456-TA
ATGCGTCCTTCCCCGCAGCCTCTGAATGTTCCCATCATCATTATAACTATCCAAGATAGTCGATGTTATTTGATGAACGGTGGCGCCGTGGAGAGTTTCTTCATCAGCGAGGACACGCCGGTCGGCAGTATTATTGGAACACTATCAGTGAACGGTGACCCCGGTGATGAGGGCGACATCAGTCTTCGGGTCCAGGAGCGCAAGCCGGCCGTGGCGCTAGTCCCGGGGTCCAAGAACGTCACCCTGACCCGCGCCCTCGACCGAGAGGAGAAGACCGGACCCTCCAGCGTCTACGTCAACGTGCGATGTGACAGACGACACACCACAGACCCGAGCTTCGTGATCCCGGTGTCGGTCCGTGTGTGGGACGTCAACGACAACGCTCCGTCGTGGTCGGGCGCGCCGTACAGGGCGCGCGTGTCGGAGCTGGCCGCCGTGGGCACACGCCTGCTGACGGCGCGGGCGCACGACCCCGACCAGCCCGGGCCGCACGCCACCGTCAGATACTCCGTGCTGCCCGGACCCGCCGCGGAGTACGTGGGGTTCCCGAGCGAGCTGGACGGCGCGCTGGTGGTGAGGAAGCCGCTGGACTACGAGACCGCCACCAACCTCACGGTGACTCTGAGGGCGCAGGACGGCGGCTCCCCGCCCCGCCACAACGACACCACCCTCACCATCGTCGTCATGGACGCCGACGACCAGAACCCGACCTTCACACACGATCACTACAGCGCGGTCATACCCGAGGACGCGCGGGAGGGTACAATCCTCGAGACGTTCCCGGGGCCCGTGGCGGCGCACGACCAGGATCGGGGGATCAACGCTCCCGTCACGTACAGCGTGCGAGCCTCCCCCTCCCCCGCCGACAACAACACCGCCCTGGTCCGACTGCACAAGGACAGCGGCGAGCTGAGCGTCACCGGCGACCTGCTGCGGGCCAGCCTCCCCACCACCATCGTCATACAGGCCACTCAGGTAGACAACCCGGACCGCTACGCCCTGGCCACCCTGTCCGTGTCCCGTGCCGGCTCCGGGTCCGTTTCGTTCCCGCGGCGCCTCTACTCCGTGTCGGTGCGCGAGGACTCCGCCCCCGGGAGCGTGCTGCTGTCGCTGGAGGCCCGGGGCCAGGGGCCGCTGCAGTACTTCGTATCGGACCGCAGCTTCCTGCAGCAGTTCGCCATCAGCGAGGCAGGCGAGCTGCTGCTGCGACGAGCGCTGGACCGGCTCGTCAGACACTACGACTACCAGGTCATGGTCACCGACGGACGGACGAACGACACGGCTCACATCAACATATCGGTGGAGGCGGTGAACGAATGGGAGCCGCGGTTCAAGCACGCCCAGTACTCGTTCGTGGTGGAGCGGCCGACGGGCGAGGGCCGCGTGCGGGTGGGGCGCCTGCACGTGCACGACGGCGACCCCGAGGACCGCGTGTCGGTGAAGGTGGCGGGCCCGGACGCCGCCGCCGTCACCGTGGACGACGCCGGGGACGTGTTCGTGTCCGCGCCCGCCCTCAGGAACATGCGCTCCGACACGCTGCACCTCGTCGCCACCGCCGTCGACTCCGGCACTCCGCCCAGACAGGGTGCGCTTCTCGTGGGTTGTAACGCGTGTCTCTCCGCCAGTCGTCCGTGCCGCTGTCGGTCCGCGTGTCTCCCCCCGCCCCCACGTCTCCCCCCGGCGCCGCCTCCTCCTGTCCAGTGTGGGCACGTCCGTGTGTGTGTCTGTGTCGTCGCTGGTACTGCTGGCCGTGCTGCTGCTCTTCCTTCACAGGCTCAGACTCTCTTTGGACAAAAACCTCCAACGTGA

Protein sequence:

>DPOGS211456-PA
MRPSPQPLNVPIIIITIQDSRCYLMNGGAVESFFISEDTPVGSIIGTLSVNGDPGDEGDISLRVQERKPAVALVPGSKNVTLTRALDREEKTGPSSVYVNVRCDRRHTTDPSFVIPVSVRVWDVNDNAPSWSGAPYRARVSELAAVGTRLLTARAHDPDQPGPHATVRYSVLPGPAAEYVGFPSELDGALVVRKPLDYETATNLTVTLRAQDGGSPPRHNDTTLTIVVMDADDQNPTFTHDHYSAVIPEDAREGTILETFPGPVAAHDQDRGINAPVTYSVRASPSPADNNTALVRLHKDSGELSVTGDLLRASLPTTIVIQATQVDNPDRYALATLSVSRAGSGSVSFPRRLYSVSVREDSAPGSVLLSLEARGQGPLQYFVSDRSFLQQFAISEAGELLLRRALDRLVRHYDYQVMVTDGRTNDTAHINISVEAVNEWEPRFKHAQYSFVVERPTGEGRVRVGRLHVHDGDPEDRVSVKVAGPDAAAVTVDDAGDVFVSAPALRNMRSDTLHLVATAVDSGTPPRQGALLVGCNACLSASRPCRCRSACLPPPPRLPPAPPPPVQCGHVRVCVCVVAGTAGRAAALPSQAQTLFGQKPPT-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: