MonarchBase - Protein-coding gene

DPOGS204151
Transcript	DPOGS204151-TA	2568 bp
Protein	DPOGS204151-PA	855 aa
Genomic position	DPSCF300034 - 759035-802094
RNAseq coverage	11x (Rank: top 84%)

Annotation
*Heliconius*	HMEL009670	8e-74	42.69%
*Bombyx*	BGIBMGA005033-TA	8e-130	74.11%
*Drosophila*	CG14372-PC	8e-108	33.81%
EBI UniRef50	UniRef50_E2AKZ8	7e-138	38.46%	Protein turtle-like protein A n=7 Tax=Formicidae RepID=E2AKZ8_CAMFO
NCBI RefSeq	XP_975559.2	9e-169	40.00%	PREDICTED: similar to CG34113 CG34113-PP [Tribolium castaneum]
NCBI nr blastp	gi\|189239517	2e-167	40.00%	PREDICTED: similar to CG34113 CG34113-PP [Tribolium castaneum]
NCBI nr blastx	gi\|189239517	1e-166	40.33%	PREDICTED: similar to CG34113 CG34113-PP [Tribolium castaneum]

Group
KEGG pathway	gga:428253	2e-12
	K06491 (NCAM)	maps->	Cell adhesion molecules (CAMs)
			Prion diseases
InterPro domain	[202-284] IPR013783	7.9e-15	Immunoglobulin-like fold
	[202-284] IPR013162	2.1e-11	CD80-like, immunoglobulin C2-set
	[33-147] IPR003599	4e-08	Immunoglobulin subtype
	[35-146] IPR013106	2.3e-07	Immunoglobulin V-set
Orthology group	MCL10437		Insect specific

Nucleotide sequence:

>DPOGS204151-TA
ATGTGCTCCATGAAGTGGCTCCGACTGCTTGTGATGCTGGCTGTCTGCTGTGCTCAAGAAGGAGAATGGAACGAAGATGCGGAGGACTTAGTGTCAACAGTGGATGTAGATGCCGTGCTGGGGCGTACAGCATCGCTTCCCTGTGACGTTACTCCAGATACAAATGAGGATAGAGTATACATGGTGCTCTGGTTTCGAGCAGGGAAGAGTACCGGCGGAAAACCTATTTATAGTTTTGACGTTCGTGGAAGATCATTTAACAAAGCTTTACAATGGTCAGATCCTAATGTTTTTGGTCCACGGGCTTATTTCGCCACCGTTGCCAGACCGGCCTCTTTGACGCTTGACACTGTCCAATTGGATGATGAAGGAGTATACCGCTGTCGAGTCGACTTTAAGAATTCTCCCACACGCAATTTCCAAATCAGGTTGTCCGTTATTGTTCCACCACATCAACTGATACTATACGACAAGTCTGGGCGAGATGTTTCGGGCGTGGTGGGTCCGCTCGAAGAGGGCAACGAGCTTGTCCTCGTTTGCGAGGTCAGAGGAGGAGATTACACAGAAGAAATATTTTCTCTTGCCCTCCTGGAAAAGAACGCTCCTGTGATACAGAACAAACCAGTGACGTTATCTTCGGAACGCTACGTCAGCTTATCGTGTGTGTCAGAGGGAAGCCGCCCGCCCGCGCAGTTGACCTGGTTCAAGGACAATAGAAAATTTAAAAGAGGAAAAATAACAGATGCATCTAATGACACTTGGGTGAGCAGCACGCTGCAATTTATGCCACTTCCAGAAGACGATGGCGTCCAAATAAAATGTCAAGCAGATAACAACGCGCTTCCCGGACAAAGCATAGAAGATTCTTTCAAACTGGATGTTGTTTCGCCTAAAAATGAAAATTATAAATTGCATAACGTGGAAGATGAACAACCTACTTATGGCTTGTCGGATAAATTTTACAAATACCTATTCTGTAAAATAAATGTTACAAATATTATTGCTCAAGATATGGATGCATTACCACTTGAGGTCAAAATCTCGGAAAAACCAGTACTCCATAACGTGGTTTCTGGCATCATTGTCAGCACCAAGTCATTAGTGCTACAAAAGGTTACAAGGGACTATAGCGGAGACTACTCTTGTCGTGCCACCAATGCCCTCGGAGAAACAGCGAGCCAAGCTACTCATCTTAGTATACAATATACACCAGTTTGCACGCACACTTCACCTCAAGTGTTAGGTGCACAGATAGACGAAGCCCTACTTATACGCTGTTCTGTTACCGCCAATCCCCCAGATGTCACCTTCTTTTGGCAGTTTAATAATAGTGGGGAGAGCCTAGACGTATCCCCGACTAAGTTTGGCACAGCCAACGGCAGTACAAGCGAGTTAAGCTACAAGCCTCAAAGCGAACGCGACTATGGAGCTCTGAGTTGCCGCGGTACAAATTCAGTCGGTAGACAAGACGAGCCATGTGTATTTCAAATAGTACCTGCATCTCGCCCAGCCCCACCTAAAAACTGTTCTCTTCACACCGGATCCAATAGTTCTGAGGGGCTGAACTGGTTGATGGTACGCTGTGTTGCTGGATATGACGGAGGTCTACCTCAAACCTTTGTGCTGGAAACACTAGATCCCATCACTAGCAAGACTAAGTTCAATAGCAGCGCTAACGATACAGATGGTTTAGCTACTTTCAAGTTAGATCTCTCGCAAATATCGGCTGGCGAGACCGAGACCACATTTAATCTACTCATCTATGCAAGGAACCTCAAGGGAGATTCGGAGAAAACTCTGCTGGAAAATATTGCTTTCAATGACGCCGCCAGGAGAACGGATGGCAAAAATGTATTGGGAGGAATAACGTTTGGAATGGTAATTGCTGCGTCACTTGGAGCCGTGTTTGCCGTTGGAGGAATAATTTTCGCCGCGCTCTGTGCACGTCGAAAGAGATCTCATCCAACTCATAAACATCCTCCAGGTGATATGCTGGAGTTAAGTGATGGGTGCAGAAGATATGTTGTAGCATACACTATCAAACCATCGCAAGAACTTAAAACGCCTGATCCACAGCCAGATATTTTAAATCCACCAGATGGCGAAAGTCAAAAAGCGCCAGCTTCGACGGTTGAAGCCGATGAGTGGCCAAGTGTAAAAGAAGTTAGAGGGGACTGGAATAAAACAGGAGCTGTCTTTTCAGCAGAGGACCTTGCACTTTTAGATTCAACTGGACATCCACAAGAGATAACTTCAAGAAATGAATTGGTTCATAACAGTCGGCAGGAAGACGCTCTTAATCAGAATTTATCTCAACCTATATTAGCAAGTAATTTTAGGCCCAACTTTTTAGTAACAAATAGTCCAACATTAGGAAGTCCAAACTTTGTGTGTCCTAATGGTAATATTGGATCACCTTTTGAAAGTCAAACGCTCACACTAAGCGGACCAACTTTAAGTTCTAGTAGTCTGTCTAATTCTACGTTACATAGAAAAGGCAAGAGTAATACACGAAGAAGAGAACATGTTCTCGCAGAAAACTTGCCGGGTCCTGAGAGCTGTGTTTAA

Protein sequence:

>DPOGS204151-PA
MCSMKWLRLLVMLAVCCAQEGEWNEDAEDLVSTVDVDAVLGRTASLPCDVTPDTNEDRVYMVLWFRAGKSTGGKPIYSFDVRGRSFNKALQWSDPNVFGPRAYFATVARPASLTLDTVQLDDEGVYRCRVDFKNSPTRNFQIRLSVIVPPHQLILYDKSGRDVSGVVGPLEEGNELVLVCEVRGGDYTEEIFSLALLEKNAPVIQNKPVTLSSERYVSLSCVSEGSRPPAQLTWFKDNRKFKRGKITDASNDTWVSSTLQFMPLPEDDGVQIKCQADNNALPGQSIEDSFKLDVVSPKNENYKLHNVEDEQPTYGLSDKFYKYLFCKINVTNIIAQDMDALPLEVKISEKPVLHNVVSGIIVSTKSLVLQKVTRDYSGDYSCRATNALGETASQATHLSIQYTPVCTHTSPQVLGAQIDEALLIRCSVTANPPDVTFFWQFNNSGESLDVSPTKFGTANGSTSELSYKPQSERDYGALSCRGTNSVGRQDEPCVFQIVPASRPAPPKNCSLHTGSNSSEGLNWLMVRCVAGYDGGLPQTFVLETLDPITSKTKFNSSANDTDGLATFKLDLSQISAGETETTFNLLIYARNLKGDSEKTLLENIAFNDAARRTDGKNVLGGITFGMVIAASLGAVFAVGGIIFAALCARRKRSHPTHKHPPGDMLELSDGCRRYVVAYTIKPSQELKTPDPQPDILNPPDGESQKAPASTVEADEWPSVKEVRGDWNKTGAVFSAEDLALLDSTGHPQEITSRNELVHNSRQEDALNQNLSQPILASNFRPNFLVTNSPTLGSPNFVCPNGNIGSPFESQTLTLSGPTLSSSSLSNSTLHRKGKSNTRRREHVLAENLPGPESCV-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: