MonarchBase - Protein-coding gene

DPOGS203907
Transcript	DPOGS203907-TA	2595 bp
Protein	DPOGS203907-PA	864 aa
Genomic position	DPSCF300005 - 975788-979158
RNAseq coverage	711x (Rank: top 18%)

Annotation
*Heliconius*	HMEL010414	72.80%
*Bombyx*	BGIBMGA011180-TA	73.38%
*Drosophila*	gammaCop-PB	56.36%
EBI UniRef50	UniRef50_Q9Y678	54.41%	Coatomer subunit gamma n=161 Tax=Eukaryota RepID=COPG_HUMAN
NCBI RefSeq	NP_001036846.1	82.93%	nonclathrin coat protein gamma1-COP [Bombyx mori]
NCBI nr blastp	gi\|112983936	82.93%	nonclathrin coat protein gamma1-COP [Bombyx mori]
NCBI nr blastx	gi\|112983936	82.93%	nonclathrin coat protein gamma1-COP [Bombyx mori]

Group
Gene Ontology	GO:0005488	1.4e-107	binding
	GO:0006886	1.2e-103	intracellular protein transport
	GO:0030117	1.2e-103	membrane coat
	GO:0016192	1.2e-103	vesicle-mediated transport
	GO:0005798	1.3e-72	Golgi-associated vesicle
	GO:0005198	1.3e-72	structural molecule activity
	GO:0030126	2.2e-51	COPI vesicle coat
KEGG pathway
InterPro domain	[5-864] IPR017106	0	Coatomer, gamma subunit
	[19-592] IPR011989	1.4e-107	Armadillo-like helical
	[31-537] IPR002553	1.2e-103	Clathrin/coatomer adaptor, adaptin-like, N-terminal
	[16-589] IPR016024	8.5e-90	Armadillo-type fold
	[605-863] IPR014863	1.3e-72	Coatomer, gamma subunit , appendage
	[595-756] IPR013041	8.5e-54	Clathrin/coatomer adaptor, adaptin-like, appendage, Ig-like subdomain
	[602-752] IPR013040	2.2e-51	Coatomer, gamma subunit, appendage, Ig-like subdomain
	[758-863] IPR009028	1.1e-21	Clathrin/coatomer adaptor, adaptin-like, appendage, C-terminal subdomain
	[762-864] IPR015873	2.8e-15	Clathrin alpha-adaptin/coatomer adaptor, appendage, C-terminal subdomain
Orthology group	MCL11188		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS203907-TA
ATGAGCTCTTTTCGTCGTGACAAGAAGGAGGAAGAAGATACGGGAGGAAATGTCTTCCAGAATCTTGATAAGACTGCTCTTTTGCAAGAGGCTCGTTATTTCAACTCCACTCCTGTAATTCCAAAAAAATGTGTCCAGATCCTTACGAAAATTCTATACCTACTCAACCAAGGAGAGAAACTAACTACTCAAGAAGCCACAGATATATTTTTTGCGACAACTAAATTGTTTCAATCTAAGGATGTTGTTTTACGTCGTCTTGTGTATTTGTGCATTAAAGAATTAAGCTCAATGGCACAAGATGTAATCATCGTAACGTCCTCTTTGACCAAAGATATGACTGGCAAGGAGGATCTTTATCGAGCTGCAGCAATTCGTGCACTCTGCAGTATAACCGACAGTACTATGCTTCAAGCTATAGAACGGTACATGAAGCAGGCAATTGTGGATAAAAATCCTGCCGTCAGTTCAGCTGCTCTTGTGTCAGCTCTTCATCTATCTGCAACTGTTCCTGAACTGGTTAGGAGATGGGTGAATGATGCGCAGGAGGCAATTATGTCTGATAATGCAATGGTGTCATATCACGCCTTGGCAGTAGTAGCAGGTGCCAGACGGAATGATCGTTTATCAACTGTGAAATTGGTAACAAAACTATCTCGTTCACCTTTACGATCTCCATTTGCTTTATGCCTGTTAGTTAGATATGCTGCCAAATTAGCAGAAGAGGATCAAACTGAAGCATCAGAACCATACTTGGAATTTATAGAATGTTGCTTGCGTCACAAATCTGAGATTGTTGTTTATGAAGCTGCTCATGCTATTGTTAATTTGCGAAAGTCTGCTAGAGATCTTGCCCAAGCTGTGAGCGTTTTACAAATTTTCTGTGGTTCATCCAAGGCAACCCTTCGCCTTGCTGGAGCTCGTACCTTAGCGAAGTTAACAACAAAACATCCAAATGCTGTTGCAGCTTGTGCTGTTGACTTGGAAAACTTGATTTCAGATCCAAATCGCTCTGTTGCTACTTTAGCTGTGACAACTTTGCTTGCCACCGGAGCAGAAAGCTCAATTGATCGCCTAATGAAGCAAATTTCTACTTTCATGTCTGAAATATCAGATGAATTTAAAATTGTAGTTGTTCGTGCCATAAGGCGTCTTTGTACCAAATATCCAAGAAAGCATCAATCGCTGGCCTCATTTTTAGCTGGGATGTTGCGTGATGAAGGTGGCGTACAGTACAAGACAGCAATTGCCGATGCGATTATTGCCTTGATAGAAGAAAATCCAGATGCAAAAGAGACTGGTCTGGCTCATCTTTGTGAATTTATAGAAGATTGCGAACATACATCACTGGCAGTTAGGATTTTGTATGTTTTGGGTCGCGAAGGCCCTAAAGCTCGTCAGCCTTCTCGCTACATTAGATATATCTATAATCGAGTTATTTTGGAATCTGGCCCAGTTCGAGCTGCTGCTGTATCTGCAGTTGCTCGCTTTGGCGCTACTTGCGAGGATCTACTTCCAAATATTAGTGTATTGTTAGCTCGTTGTCAGCTTGACGATGATGATGAAGTTCGCGACAGAGCTATATTTTTTAATGCTATCTTGAATTCCAATGACCCTCAACTAATTAGCGATTATATCACAAACGTACCGACTCCAAACCCAGTTCTCTTGGAAAAAGCCCTTCATGATCACCTTAAAATGAATCCTGATAAACCATTCAACATTCTGTCGGTTCCATCATCAGAACCCACCAAAGAACCTGAAGAAGCCCCTGTTCAAATTGAAACTCGTAAACAGCCAGTTGTTTCTCTTGAAGAATTGTATTCTGAACAATTGAAAGTGGTTCCCGGCATTGAAAAACTCGGTCCACCATTTAAGACATGCAAAGCTATTGACCTTACTGAGCCAGAAACCGAATATCGTGTACGCTGTGTTAAACACATCTTTGCACGACATTTAATTTTGCAGTTTGAATGTTTGAACACACTTAGCGATCAGCTTTTGGAAAAAGTCCGCGTCCGCCTGGAAACGGCTCCTGGGTATAAAATCCTGTGTGAAGTTCCATGCGAGCAACTACCCTATGATAAACAAGGTAGTGTGTTTTGTCTCTTAGAATTCCCTCATGGTCCGATAGAAACCTTGGGCACCTTTGGGGCTACCCTTGAATTTTCAGTTCGAGATTGCGATCCTACCACTGGACTGCCTGATGGCGGTGATGGATATTCCGATACGTATCCTTTAGAGGAATTAGATATTGGATGCGCTGAGCAGTTCCGCGCTCACGTGGCTACTGATGATTGGGAAGCTTCATGGGAAAGAACAGCGTCAGCCGCCGAAGCTTCCGATACCTTTGTACTATCACAGTCAGATATTAATGAAGCAGCATCGGCAGTGTGCACCCATTTAGGTTTACCTAAAGCTGCCATATCAGGTGACGCTGTAAAGGAAATTCGTGGTGGAGGTTTGTGGCGCGAAGGCACACCGATGTTGGTACGTGCACGTCTGGTGGCATCTCAAGGGTCTGTGACTATGAAACTCACGGCTCGCTCTCCTCGTGAAGATGTTGCTACTCTACTTTTAGCTGCAGTTGGCTAA

Protein sequence:

>DPOGS203907-PA
MSSFRRDKKEEEDTGGNVFQNLDKTALLQEARYFNSTPVIPKKCVQILTKILYLLNQGEKLTTQEATDIFFATTKLFQSKDVVLRRLVYLCIKELSSMAQDVIIVTSSLTKDMTGKEDLYRAAAIRALCSITDSTMLQAIERYMKQAIVDKNPAVSSAALVSALHLSATVPELVRRWVNDAQEAIMSDNAMVSYHALAVVAGARRNDRLSTVKLVTKLSRSPLRSPFALCLLVRYAAKLAEEDQTEASEPYLEFIECCLRHKSEIVVYEAAHAIVNLRKSARDLAQAVSVLQIFCGSSKATLRLAGARTLAKLTTKHPNAVAACAVDLENLISDPNRSVATLAVTTLLATGAESSIDRLMKQISTFMSEISDEFKIVVVRAIRRLCTKYPRKHQSLASFLAGMLRDEGGVQYKTAIADAIIALIEENPDAKETGLAHLCEFIEDCEHTSLAVRILYVLGREGPKARQPSRYIRYIYNRVILESGPVRAAAVSAVARFGATCEDLLPNISVLLARCQLDDDDEVRDRAIFFNAILNSNDPQLISDYITNVPTPNPVLLEKALHDHLKMNPDKPFNILSVPSSEPTKEPEEAPVQIETRKQPVVSLEELYSEQLKVVPGIEKLGPPFKTCKAIDLTEPETEYRVRCVKHIFARHLILQFECLNTLSDQLLEKVRVRLETAPGYKILCEVPCEQLPYDKQGSVFCLLEFPHGPIETLGTFGATLEFSVRDCDPTTGLPDGGDGYSDTYPLEELDIGCAEQFRAHVATDDWEASWERTASAAEASDTFVLSQSDINEAASAVCTHLGLPKAAISGDAVKEIRGGGLWREGTPMLVRARLVASQGSVTMKLTARSPREDVATLLLAAVG-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: