MonarchBase - Protein-coding gene

DPOGS210287
Transcript	DPOGS210287-TA	1497 bp
Protein	DPOGS210287-PA	498 aa
Genomic position	DPSCF300216 + 320127-325446
RNAseq coverage	247x (Rank: top 42%)

Annotation
*Heliconius*	HMEL016977	6e-144	59.15%
*Bombyx*	BGIBMGA000030-TA	4e-171	64.23%
*Drosophila*	Scgalpha-PA	6e-72	34.66%
EBI UniRef50	UniRef50_D6X1T3	2e-85	41.16%	Putative uncharacterized protein n=2 Tax=Tribolium castaneum RepID=D6X1T3_TRICA
NCBI RefSeq	XP_001811825.1	2e-85	41.98%	PREDICTED: similar to 50-kda dystrophin-associated glycoprotein [Tribolium castaneum]
NCBI nr blastp	gi\|270013517	6e-85	41.16%	hypothetical protein TcasGA2_TC012123 [Tribolium castaneum]
NCBI nr blastx	gi\|270013517	2e-84	40.44%	hypothetical protein TcasGA2_TC012123 [Tribolium castaneum]

Group
Gene Ontology	GO:0016012	3.6e-76	sarcoglycan complex
	GO:0016020	8.6e-06	membrane
	GO:0005509	8.6e-06	calcium ion binding
KEGG pathway	oaa:100087291	5e-18
	K12565 (SGCA)	maps->	Dilated cardiomyopathy
			Viral myocarditis
			Arrhythmogenic right ventricular cardiomyopathy (ARVC)
			Hypertrophic cardiomyopathy (HCM)
InterPro domain	[23-379] IPR008908	3.6e-76	Sarcoglycan alphaepsilon
	[24-121] IPR015919	8.6e-06	Cadherin-like
Orthology group	MCL12932		Single-copy universal gene

Nucleotide sequence:

>DPOGS210287-TA
ATGAATAAAATGATGCGACAACCGTTGCTTTGGTTGATATTTATGAGAGCGGTTGTATGTCATGTTTATAATGCTGTCGAAACTGAAATGTTCTCTATACCCATCAGTCCTAACTTATTCAACTGGACTTATCAAGAATTTGATCAGCAGTACCGTTTCCACGCGTCCTTGATCGGTAAACCTGAATTGCCGATATGGCTTCGTTACATCTACAGCGGGCGACATCACTCGGGATTCATTTTTGGCACGCCGCCCCGAAATACTGAATCTCCTATTACGTTAGAGGTGATAGGGTTGAACCGTCAGGACTATGAAACCCGCCGGGTGCTGTTAACCCTGAAGGTTCTTCCCAAGGAGAAGATGGCTCGCCACGAGGTCGAGTTCAAGATAGACAATCTTAATGTTGAAGATCTTCTCGATGAGCATAGAATGAGCCGTCTGAAGGACATACTACGTACTAAACTATGGTTTGAGAGCAGCGAGGATCTGTATCCGACGTTCCTTGCATCAGCTATAGACTTGGGAGCCAGGCTACCGTTGAAGCCCAGCGATGGAGAAGGTCTGGTGATACGTCTGGGTAGTTCTCACCCGTTCTCGTCGGAGATGAAACGTCTCAGAGAGGAGGTACGCCCTCTCAGCAGACTACCCAGCTGTCCGAGGGAATACAAGAGAACAACCGTGGAGAGACTGTTCAGAGACGCCGGCTTCACACTGGACTGGTGTAACTTTGAGCTGTACAATACAATATACGGTCCACGGTCCACGGATCACTTGGAATACTTAACTGAGATTCCTTCACCCATAAATCGCGTCCGATCTGAAAGTCGCGAAGTGTGGACGGCGCCTAACAAGCAATCCTTGCCGACGAGGAGTTACGCGAAACAATTGACAGCAGCGATAGTGGGACCGTTGATTTTGCTGCTGCTATCGGTAGCAGCACTAACCGGTGTGCTGTGCTTCCATTATGCTGCTATAAGAGATCCCGAGTCAGACGTATTCTTAGACGGCATTTACCATATATGCGAAGATTACAGAAACCGAAGAGCGCACAAGTCATCTAACGTTGAAATATGCAAATATGGTACTAGCAACACAGAGCAAACTCAATTAGCTGACAACACCAGCACTAAAAGTTTAGGAATCAGTCCAAGCAGCAGTCTAGCGCGGCCCTACAGTCCTAAATCGACGACAAACTTAGCCGGCAGCTACAACCGACCTCAACCACCGCCGTACGGGACCCTCCATCATAGGAAACTGGACAAAACACCCGACAAAAGGTCGCGTTCACTGGAAGAATCATTAAAATTATTAAACGAAGCCAACATAGCTACGGAGTACGAGAGGAATCCGATCATAGACTACGCCGACAGCACGGACGATTACATATCAATAAAACCTGACACTGATTACATTATTAATAAAATGCAAAACGATTTGGACGACATAGTGGTTCCTGAACTCGCTAAATACGGCATATCCGGCATAGGACCGATTTGA

Protein sequence:

>DPOGS210287-PA
MNKMMRQPLLWLIFMRAVVCHVYNAVETEMFSIPISPNLFNWTYQEFDQQYRFHASLIGKPELPIWLRYIYSGRHHSGFIFGTPPRNTESPITLEVIGLNRQDYETRRVLLTLKVLPKEKMARHEVEFKIDNLNVEDLLDEHRMSRLKDILRTKLWFESSEDLYPTFLASAIDLGARLPLKPSDGEGLVIRLGSSHPFSSEMKRLREEVRPLSRLPSCPREYKRTTVERLFRDAGFTLDWCNFELYNTIYGPRSTDHLEYLTEIPSPINRVRSESREVWTAPNKQSLPTRSYAKQLTAAIVGPLILLLLSVAALTGVLCFHYAAIRDPESDVFLDGIYHICEDYRNRRAHKSSNVEICKYGTSNTEQTQLADNTSTKSLGISPSSSLARPYSPKSTTNLAGSYNRPQPPPYGTLHHRKLDKTPDKRSRSLEESLKLLNEANIATEYERNPIIDYADSTDDYISIKPDTDYIINKMQNDLDDIVVPELAKYGISGIGPI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: