MonarchBase - Protein-coding gene

DPOGS210106
Transcript	DPOGS210106-TA	1254 bp
Protein	DPOGS210106-PA	417 aa
Genomic position	DPSCF300017 + 1097891-1102782
RNAseq coverage	4050x (Rank: top 3%)

Annotation
*Heliconius*	HMEL014623	90.08%
*Bombyx*	BGIBMGA012687-TA	97.69%
*Drosophila*	Sec61alpha-PA	94.09%
EBI UniRef50	UniRef50_Q9H9S3	91.77%	Protein transport protein Sec61 subunit alpha isoform 2 n=126 Tax=Coelomata RepID=S61A2_HUMAN
NCBI RefSeq	NP_001037628.1	97.69%	transport protein Sec61 alpha subunit [Bombyx mori]
NCBI nr blastp	gi\|112983370	97.69%	transport protein Sec61 alpha subunit [Bombyx mori]
NCBI nr blastx	gi\|112983370	97.69%	transport protein Sec61 alpha subunit [Bombyx mori]

Group
Gene Ontology	GO:0016020	2.6e-92	membrane
	GO:0015450	2.6e-92	P-P-bond-hydrolysis-driven protein transmembrane transporter activity
	GO:0015031	2.6e-92	protein transport
KEGG pathway	cqu:CpipJ_CPIJ007723	0.0
	K10956 (SEC61A)	maps->	Phagosome
			Vibrio cholerae infection
			Protein processing in endoplasmic reticulum
			Protein export
InterPro domain	[2-389] IPR002208	0	SecY protein
	[7-389] IPR023201	6.3e-136	SecY subunit domain
	[40-74] IPR019561	4.4e-18	Translocon Sec61/SecY, plug domain
Orthology group	MCL10778		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS210106-TA
ATGGGAATCAAATTCCTGGAAGTTATAAAACCGTTTTGCAGTATACTGCCAGAAATAGCGAAACCGGAGAGAAAGATCCAATTCAGAGAAAAAGTATTATGGACAGCAATTACACTATTCATTTTCTTAGTATGCTGCCAGATTCCATTATTTGGTATAATGTCGTCAGACAGTGCGGATCCCTTCTATTGGATCCGTGTGATCTTGGCATCGAATCGAGGAACACTTATGGAGCTGGGTATTTCCCCCATCGTCACATCAGGACTGATCATGCAACTGCTAGCTGGAGCTAAGATTATAGAAGTCGGTGACACTCCCAAAGATAGGGCCTTGTTTAATGGGGCGCAGAAACTATTCGGCATGGTGATAACAGTGGGACAGGCCATAGTGTATGTCATGACGGGAATGTACGGTGAACCTAGTGAGATTGGTGCCGGAGTCTGTCTGCTCATCATCATACAGTTGTTTGTGGCCGGACTTATTGTACTGCTGCTCGATGAATTACTTCAGAAAGGTTATGGTCTTGGCTCCGGTATTTCCCTCTTCATTGCCACCAACATTTGTGAAACAATCGTATGGAAGGCTTTCTCACCGGCTACCGTCAACACTGGTCGCGGTACAGAGTTTGAAGGCGCAGTGATAGCATTATTCCACTTGCTGGCCACTAGACCCGATAAAGTCCGAGCACTCAGAGAAGCCTTCTACCGTCAGAATCTACCAAATTTGATGAACCTCCTAGCGACAGTCCTAGTGTTTGCTATCGTGATATACTTCCAGGGCTTCAGGGTGGATCTCCCCATCAAGTCAGCTCGTTACCGCGGCCAGCACTCTTCGTACCCCATCAAACTGTTCTACACCTCAAACATTCCAATCATTCTTCAATCCGCCCTCGTCTCCAATCTGTATGTTATCTCTCAGATGTTAGCTGTGAAGTTCAGCGGCAACTTCCTGGTGAACTTACTTGGTGTGTGGGCAGACGTGGGCGGTGGTGGCCCCGCCCGCGCCTATCCCGTGGGCGGTCTGTGCTACTACTTCAGCCCCCCGGAGTCGCTCGCCCACATCGCTCACGACCCGCTTCACGCCGTCATGTACATCATCTTCATGTTGGGCTCCTGCGCATTCTTCTCAAAGACATGGATCGATGTTTCTGGATCATCAGCTAAGGATGAACCAAACTCCTATCCCGTATGTTGGTCCCGCACCAAGGTCAGATCGTTCCATCGCTCGATAACGGAAGACGTATATAAACCGTAA

Protein sequence:

>DPOGS210106-PA
MGIKFLEVIKPFCSILPEIAKPERKIQFREKVLWTAITLFIFLVCCQIPLFGIMSSDSADPFYWIRVILASNRGTLMELGISPIVTSGLIMQLLAGAKIIEVGDTPKDRALFNGAQKLFGMVITVGQAIVYVMTGMYGEPSEIGAGVCLLIIIQLFVAGLIVLLLDELLQKGYGLGSGISLFIATNICETIVWKAFSPATVNTGRGTEFEGAVIALFHLLATRPDKVRALREAFYRQNLPNLMNLLATVLVFAIVIYFQGFRVDLPIKSARYRGQHSSYPIKLFYTSNIPIILQSALVSNLYVISQMLAVKFSGNFLVNLLGVWADVGGGGPARAYPVGGLCYYFSPPESLAHIAHDPLHAVMYIIFMLGSCAFFSKTWIDVSGSSAKDEPNSYPVCWSRTKVRSFHRSITEDVYKP-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: