MonarchBase - Protein-coding gene

DPOGS204802
Transcript	DPOGS204802-TA	3525 bp
Protein	DPOGS204802-PA	1174 aa
Genomic position	DPSCF300460 + 94516-108198
RNAseq coverage	431x (Rank: top 28%)

Annotation
*Heliconius*	HMEL013184	1e-165	57.30%
*Bombyx*	BGIBMGA010725-TA	0.0	67.74%
*Drosophila*	alphaCop-PB	0.0	65.30%
EBI UniRef50	UniRef50_F4WHH3	0.0	55.54%	Coatomer subunit alpha n=16 Tax=Coelomata RepID=F4WHH3_ACREC
NCBI RefSeq	NP_001166192.1	0.0	72.02%	coatomer protein complex subunit alpha [Bombyx mori]
NCBI nr blastp	gi\|289629216	0.0	72.02%	coatomer protein complex subunit alpha [Bombyx mori]
NCBI nr blastx	gi\|289629216	0.0	71.96%	coatomer protein complex subunit alpha [Bombyx mori]

Group
Gene Ontology	GO:0006886	7.9e-148	intracellular protein transport
	GO:0030126	7.9e-148	COPI vesicle coat
	GO:0005515	7.9e-148	protein binding
	GO:0005198	7.9e-148	structural molecule activity
	GO:0016192	7.9e-148	vesicle-mediated transport
	GO:0030117	1.1e-61	membrane coat
KEGG pathway	bta:100126041	0.0
	K05236 (COPA)	maps->	Neuroactive ligand-receptor interaction
InterPro domain	[1-1169] IPR016391	0	Coatomer, alpha subunit
	[784-1172] IPR010714	7.9e-148	Coatomer, alpha subunit, C-terminal
	[4-316] IPR015943	3.5e-74	WD40/YVTN repeat-like-containing domain
	[329-612] IPR006692	1.1e-61	Coatomer, WD associated region
	[9-305] IPR011046	8.7e-58	WD40 repeat-like-containing domain
	[227-535] IPR011048	2.8e-08	Cytochrome cd1-nitrite reductase-like, C-terminal haem d1
	[185-220] IPR019781	4e-08	WD40 repeat, subgroup
	[182-221] IPR001680	1.9e-06	WD40 repeat
Orthology group	MCL11194		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS204802-TA
ATGCTGACAAAATTCGAAACAAAGTCAGCTAGAGTGAAAGGGATATCGTTTCACGCGAAGCGACCGTGGGTTTTGACGAGTCTTCATAATGGTGTAATTCAACTTTGGGACTATCGTATGTGTACATTGCTGGAGAAATTTGATGAACATGATGGTCCCGTCCGCGGTATTTGCTTCCACATTCAACAGCCTTTGTTCGTTTCCGGCGGTGACGATTATAAAATAAAGGTTTGGAATTACAAGCAAAGAAGATGCCTTTTCACCCTACTCGGTCACTTGGACTACATTCGCACAACTTTCTTTCATCATGAGTACCCTTGGATCTTAAGTGCTTCAGATGATCAGACAATAAGAATATGGAACTGGCAATCCCGTCAATGCATCAGTGTCCTGACTGGGCACAACCACTATGTAATGTGTGCACAGTTTCATCCCACCGAAGATCTTCTAGTGTCAGCTTCCTGTGATCACGGGCAGGTGAGGAAAATGTTGCCCTTTTCATCTTTTTTTGTGAAATTAAAAAGTGTGAGCCGCCATTGTGCGGATGCAGTTGTAAAGCATGTGTTGGAAGGGCATGATCGCGGAGTGAACTGGGCGTCTTTCCATCCAAACCTCCCGCTCATAGTGTCCGCAGCTGATGATAGACAAGTCAAACTGTGGCGGATGAACGATGCCAAGGCTTGGGAGGTAGACACGTGTCGCGGGCACTACAACAACGTGTCATGTGCGCTGTTCCACGCTAGACACGAGCTGATACTGTCGAATAGTGAGGATAAATCCATCAGGGTCTGGGATATGACGAAGCGTGTCTGTTTGCACACCTTCAGGAGAGAACACGAACGCTATTGGGTGCTATCATCACATCCGACCCTCAACCTATTTGCCGCTGGTCACGACGCTGGTATGATATTGTTCAAACTTCAACGAGAAAGACCAGCATATGCCATACATAATAATATGCTCTTCTATATTAAGGACAGACAGCTTCGTAAACTGGATATGTCAACTAATAGAGATGCCCCGGTTATGCAGATCAAGGGTGGCGGAAGACATCAACCTTACAGTATGTCGCTGAATCACGCTGAGTGGTGCGTGCTTGTGTCGTGGCGTGTTGGTGACACGCATACGTACGAACTATACAACGTTTCGAGAGACGGTGAGGCTGCGAGTACCGCTGAGCCAATGAGGGGACACGCTACTACGGCTGTGTGGGTCGCTAGGAATAGATTTGCTGTATTGGAGAAGAACAATCAGCTGATAATAAAGAATCTGAAGAACGAGGTGTCCAAGAAGATAGCGACTCCGACGTGTGAGGAGATCATGTACGCCGGTACTGGGATGCTGTTACTCAGGGAGGTCGATGCTGTGCAGCTCCTGGACGTGCAGCAGAAGAGGACCGTGGCCAGTGTGAAAGTATCCAAATGCCGTTACGCTATTTGGAACTCGGATATGTCGCTAGTGGCGCTCCTTGGGAAGCATACGGTGACGATATGTACCAAGAAGCTAGAACAGCTGTGCTCTATCACCGAAGGGGCGCGGGTCAAGTCGGGGGCGTTTGATGATTCAAATTCACACCCAGTCTTCATATACACGACGGCCAATCACATCAAATATTGCTGCAAAGAAGGAGATCACGGGATTATCCGTACGTTGGATGTGCCGGTGTATGCGGTGAAGGTGATAGCGAACGAAGCTGGGGCGAGAGTTGTATGTCTCGATAGAGAGGCCCGTCCCAAAGTACTCAACATTGACCCCACAGAATACAGGTTCAAACTGGCTCTGGTGACCCGTCAGTACGACCAGGTTCTTCATATGCCGGTTCCCGTGCGTCAACGTAACGCGAGATCTGCCGAGAATATCGCCGCTGTGCGCGACAGTGTCCTCGAAAACCCGCGGCAGTCAATTCCGCGTCGCGCACAGGAACTCGGCCTTTCGCAGACGACAACTTGGCGAATTTTGCGTTGTGACTTGAGCCTGCACCCGTACAAGATCCAGCTGACCCAAGAGCTCAAGGTTAATGACCATAGACAGCGCCGTGTGTTCGCTGACTGGGCATTAGAGCAGTTGGAAGTTGACGCCGATTTTGGCAAAAAAATCATCTTCAGCGACGAGGCGCATTTTTGGATGAATGGCTATCTCTCCCTGGCATACCTGACAGCGATCAATCACAAGCAGACAAGTGAGGCTGAGCAATTGAAGGTGGCGTTGGAAGCGGCCAATCTCCCCGTACCCAACAAGAACCCTAAAGCTGTCGTTCTGCGACCACCCGTACCTGTACAGAAAGCTCAATCTAACTGGCCGCTTCTATCTATATCTAAGAGCTTCTTCGAAGTGGCGGGTGCTCGGTCGGAGGGTCCGAGGGTTGCGGGCCAGGAGGCTATACACGAGGACGAACCTCTGGAAGCAACAGGCGCCTGGGGCGATGATGATTTAGGCGATAACAAGGAGGTTGATGGTGATGTGGTCATTGACCAAGAAGACGCTTGTGAGGACGGAGGCTGGGATGTTGGTGACGAGGACTTGGACCTGCCCGAACTACCACCTGTTGCTGCCGAAGAATCATCTGAGTCCTCGTTCTTCGTCGCTCCGCCCCGCGGGACGCGAGCCCCCGCGGTCTTGAGAACAGCGCACGACCATGTCGCTACAGGAAACATAGAAGGAGCTATGAGGTTACTGAACGAGCAAGTCGGGATTGTGAACTTCGAGCCCTACCTAGAGACATTCCTCTCGATGTATTCCACTGCGAGGGTCATGTTCGCTGGTCTGCCACAGCTGCCGCCGCTGGTGACTCTCTTACACAGAAACTGGAAGGAGGCCAGCGGGAAAGACCTGCTGCCCGTTATCACCGCCAAGCTGACGGATCTGGTGAACCAGCTGCAGCAGTGCTACCAACTGACCACTAGCGGCAAGTTCCCGGAGGCGCTCGTCCGTCTGGAGAGGGTGGTGAGGCTGGTGCCGCTGCTGGTGGTCGACACCCGCCAGGAGCTCGTGGAGGCGCAGCAGCTGATGACCATCAGCAGGGAGTACCTGCTCGGACTCAGGATGGAAACGGCGAGGAAGGCCATGCCGAAGAACACGCTCGAGGAACAAATAAGGACGTGCGAGATGGCAGCTTACTTCACTCACTGCAAGCTGCAGCCGGTCCATCAGATCCTGACGCTGCGGACGGCGCTGAACATGTTCTTCAAGCTGAAGAACTACAAGACAGCTGCGTCCTTCGCGCGGCGGCTGCTGGAGCTGGGACCGAGACCGGAAGTGGCCCAACAGGCGAGGAAAATACTACAGGCCTGCGAAAAAACGCCCACCGACGAACACCAGCTGTCGTACGACGAGCACAATCCGTTCAATATATGCGGGATAAGCTATAAGCCGATATACAGAGGCAAGCCGGAGGAGAAGTGCTCGCTCTGCAGCGCCAGCTTCATGCCCGAGCATAAAGGGAAGCTGTGCCCCGTGTGCGGCGTCGCTGAAATAGGCAAAGACGTCCTCGGACTGAGAATCTGTGCTGTCCAGTTTCAGAGATAA

Protein sequence:

>DPOGS204802-PA
MLTKFETKSARVKGISFHAKRPWVLTSLHNGVIQLWDYRMCTLLEKFDEHDGPVRGICFHIQQPLFVSGGDDYKIKVWNYKQRRCLFTLLGHLDYIRTTFFHHEYPWILSASDDQTIRIWNWQSRQCISVLTGHNHYVMCAQFHPTEDLLVSASCDHGQVRKMLPFSSFFVKLKSVSRHCADAVVKHVLEGHDRGVNWASFHPNLPLIVSAADDRQVKLWRMNDAKAWEVDTCRGHYNNVSCALFHARHELILSNSEDKSIRVWDMTKRVCLHTFRREHERYWVLSSHPTLNLFAAGHDAGMILFKLQRERPAYAIHNNMLFYIKDRQLRKLDMSTNRDAPVMQIKGGGRHQPYSMSLNHAEWCVLVSWRVGDTHTYELYNVSRDGEAASTAEPMRGHATTAVWVARNRFAVLEKNNQLIIKNLKNEVSKKIATPTCEEIMYAGTGMLLLREVDAVQLLDVQQKRTVASVKVSKCRYAIWNSDMSLVALLGKHTVTICTKKLEQLCSITEGARVKSGAFDDSNSHPVFIYTTANHIKYCCKEGDHGIIRTLDVPVYAVKVIANEAGARVVCLDREARPKVLNIDPTEYRFKLALVTRQYDQVLHMPVPVRQRNARSAENIAAVRDSVLENPRQSIPRRAQELGLSQTTTWRILRCDLSLHPYKIQLTQELKVNDHRQRRVFADWALEQLEVDADFGKKIIFSDEAHFWMNGYLSLAYLTAINHKQTSEAEQLKVALEAANLPVPNKNPKAVVLRPPVPVQKAQSNWPLLSISKSFFEVAGARSEGPRVAGQEAIHEDEPLEATGAWGDDDLGDNKEVDGDVVIDQEDACEDGGWDVGDEDLDLPELPPVAAEESSESSFFVAPPRGTRAPAVLRTAHDHVATGNIEGAMRLLNEQVGIVNFEPYLETFLSMYSTARVMFAGLPQLPPLVTLLHRNWKEASGKDLLPVITAKLTDLVNQLQQCYQLTTSGKFPEALVRLERVVRLVPLLVVDTRQELVEAQQLMTISREYLLGLRMETARKAMPKNTLEEQIRTCEMAAYFTHCKLQPVHQILTLRTALNMFFKLKNYKTAASFARRLLELGPRPEVAQQARKILQACEKTPTDEHQLSYDEHNPFNICGISYKPIYRGKPEEKCSLCSASFMPEHKGKLCPVCGVAEIGKDVLGLRICAVQFQR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: