MonarchBase - Protein-coding gene

DPOGS203367
Transcript	DPOGS203367-TA	2844 bp
Protein	DPOGS203367-PA	947 aa
Genomic position	DPSCF300003 + 176711-188605
RNAseq coverage	1158x (Rank: top 11%)

Annotation
*Heliconius*	HMEL013530	77.38%
*Bombyx*	BGIBMGA003892-TA	78.83%
*Drosophila*	beta'Cop-PA	68.97%
EBI UniRef50	UniRef50_O62621	68.97%	Coatomer subunit beta' n=25 Tax=Opisthokonta RepID=COPB2_DROME
NCBI RefSeq	NP_001166610.1	78.75%	coatomer protein complex subunit beta 2 [Bombyx mori]
NCBI nr blastp	gi\|290560891	78.75%	coatomer protein complex subunit beta 2 [Bombyx mori]
NCBI nr blastx	gi\|290560891	78.75%	coatomer protein complex subunit beta 2 [Bombyx mori]

Group
Gene Ontology	GO:0006886	3.9e-155	intracellular protein transport
	GO:0030117	3.9e-155	membrane coat
	GO:0005198	3.9e-155	structural molecule activity
	GO:0016192	3.9e-155	vesicle-mediated transport
	GO:0005515	2.5e-72	protein binding
KEGG pathway	pcs:Pc20g03970	2e-77
	K05236 (COPA)	maps->	Neuroactive ligand-receptor interaction
InterPro domain	[1-909] IPR016453	0	Coatomer, beta' subunit
	[320-779] IPR006692	3.9e-155	Coatomer, WD associated region
	[335-375] IPR015943	2.5e-72	WD40/YVTN repeat-like-containing domain
	[1-297] IPR011046	4.1e-70	WD40 repeat-like-containing domain
	[198-487] IPR011048	3.9e-16	Cytochrome cd1-nitrite reductase-like, C-terminal haem d1
	[220-257] IPR019781	2.2e-11	WD40 repeat, subgroup
	[218-257] IPR001680	2.5e-10	WD40 repeat
	[158-172] IPR020472	1e-05	G-protein beta WD-40 repeat
Orthology group	MCL13157		Single-copy universal gene

Nucleotide sequence:

>DPOGS203367-TA
ATGCCGTTAAGATTGGAAATCAAGAGGAAGCTGACAGCGCGATCTGATCGCGTCAAGTGCGTCGACCAGCACCCAACAGAACCGTGGCTGCTTTGTTCGCTGTACAGCGGCGACGTCAATATATGGAACTATGAAACACATACACAGATCAAAAGATTCGAGGTGTGCGACTTACCAGTGAGGGCTGCTAAATTCGTGATGCGGAAGAACTGGGTCGTGACAGGATCTGACGATATGCAGATCAGAGTGTTTAATTACAATACTCTAGAAAGGGTGCACAACTTTGAGGCTCACTCGGACTACATAAGATGCATCGTCATACATCCCACACAGCCTTACATACTGACAAGCAGCGACGATCTCCTCATCAAGCTGTGGAACTGGGACCGTAACTGGGCTTGCCAGCAAGTGTTCGAGGGCCACACCCATTACGTGATGCAAATTGTTATCAACCCTAAAGATAACAATACATTTGCCAGCGCAAGTCTCGATACCACTGTTAAGGTTTGGCAGCTCGGTTCATCAATCTCAAACTTCACATTGGAAGGTCACGAGAAAGGTGTCAACTGTGTGGATTACTACCACGGTGGTGAAAAGCCCTACCTCATCAGCGGTGCCGATGACCGTCTTGTCAAGATATGGGATTACCAGAACAAGACATGTGTTCAGACGCTAGAAAGTCACGCCCAGAATGTCACAGCGGTTTCCTTCCACCCGGAACTTCCCATCCTGCTTACGGGCTCCGAGGACGGCACCGTGAGGATCTGGCACGCCGGGACATACAGACTGGAAGCGGCCCTCAACTACGGCTTTGAAAGAGTATGGACTTTATCATCACTCCACAGATCCAACAATGTGGCTATCGGATATGACGAAGGTACCATAATGATCAAAGTTGGAAGAGAAGAGCCCGCTATATCCATGGATGTGAACGGTGGGAAAATAATTTGGGCCAAGCATTCTGATATGCAGCAAGTTAATTTGAAAGCTCTACCCGAAGGTACAGATATAAAAGATGGCGAACGGGTCCCAGTGGTTGCTAAAGATATGGGTTCCTGTGAGATATATCCCCAGACGATAGCCCACAATCCAAACGGACGTTTCGTGGTTGTGTGCGGTGATGGGGAATACATAATATACACAGCCATGGCCTTGAGGAATAAGGCCTTCGGAACAGCCCAGGAGTTTGTGTGGGCTTTGGATAGCTCGGAGTACGCTACACTGGAGAATTCTAGCACAGTGAAAGTCTTTAAGAACTTCAAGGAGAGGAAGAGCTTTAAACCTGAATATGGCGCTGAAGGTATCTTCGGTGGATTCATGCTGGGCGTTAAGTCTATCAGTGGCATGGCCTTCTCGTTCTACGACTGGGAACAATTGGAGCTCATTAGACGTATCGAGATTCAGCCTCGTCATGTTTTCTGGTCTGAGAGCGGAAGCCTAGTGTGTCTGGCCAGCGAGGAGGCCTACTACGTGCTGAAGTACAACGCTTCTGTCGTAGCTAAATCAAGAGAAAATAATACTAACGTAACCGAGGACGGCATCGAGGATGCTTTCGAGGTTGTGGGCGAAGTAAATGAGTCGGTGAAGACGGGCTTGTGGGTAGGCGACTGCTTCATATACACCAACTCGTTGAACAGAATCAACTATTACGTCGGCGGTGAGATTGTGACCATAGCGCACTTGGACCACACGATGTATATCCTGGGATACGTCGCTAAAGAAAACAGGCTGTACCTCAACGACAAGGAGTTGAACATAGTGTCGTATTCCCTCCTGCTGCCGGTTCTGGAGTATCAGACGGCGGTGATGAGAGGTGACTTCGAAACAGCTGATCGCGTCCTGCCGACCATACCTCACGATCATCGCACCAGGGTCGCACATTTTCTCGAGAAACAGGGCTTCAAACAACAAGCTCTGGCTGTGTCAACGGAGCCCGAACACCAGTTCGAGCTGGCCCTGTCGCTGGGCGAGCTGAAGAAGGCCAGCCAGTTGGCAGAGGAGTCAGATAAGGCCGAGGGCCGCGAGGACAACCAGCCCTCGAGGCCTTCAGCTGCCAGGTGGTCCAGATTGGGAGCAGCAGCTGCAGCAGCTGCAGACACTGATCTCACCAAGTTCTGCTACCAGAAGGCCCGCGACTACAGCGCCCTGCTACTATTCTCCGTCAGCACTGGCGATCGTGAGTTGCTGGAAGAGGTGGCTCATATGTCCGATCTGGCCGGTGAAGATAACATAGCCTTCACATCCTATCTTACTCTGAATGACCTGGACTCTTGTCTGGCGCTGCTTCTCAAACGAAACAAACTACCAGAGGCTGCGTTCTTCTGCAGGTCATACTATCCTTCAATGATGAGCGATGTCCTCAAACGTTGGAGGGATTCCGTCTCTATGACCAATCCCAAGTGCGGCCAGGCCTTGGCCGATCCCAACAAATACGACAACCTGTTCCCGGAATACATGGATACCCTGGCGATGGAGTTCTACCAGAAGCACTTTGGTTATCCGTACTACAATCAGTTGGAGCATATCAAAGAGAACACTGATTTATGCAATGTTGACCGAGACATGGCTCACGAAAGGCTGGTCGCTATCCACATGGGCGCCTGGGACCCTAGGGTCATAACCCCACCATCCGGTGCTTCAGGTCTCTCCAGTCTACAGGACAGTCCGAGACGAGATCCCAGAAATCCAGATAGTTCAGATGAAGCTTCCTATTCTGATGAAAAGATCAGACGTAGAGACTCCATGGACATCCTCGAAGAGATTGAACGTGAGATAGACAACATTGTGCTGGACAACAACGAAGAGGATCTGGATTCGTCAGACGAGACCATGTATCTTGAATAA

Protein sequence:

>DPOGS203367-PA
MPLRLEIKRKLTARSDRVKCVDQHPTEPWLLCSLYSGDVNIWNYETHTQIKRFEVCDLPVRAAKFVMRKNWVVTGSDDMQIRVFNYNTLERVHNFEAHSDYIRCIVIHPTQPYILTSSDDLLIKLWNWDRNWACQQVFEGHTHYVMQIVINPKDNNTFASASLDTTVKVWQLGSSISNFTLEGHEKGVNCVDYYHGGEKPYLISGADDRLVKIWDYQNKTCVQTLESHAQNVTAVSFHPELPILLTGSEDGTVRIWHAGTYRLEAALNYGFERVWTLSSLHRSNNVAIGYDEGTIMIKVGREEPAISMDVNGGKIIWAKHSDMQQVNLKALPEGTDIKDGERVPVVAKDMGSCEIYPQTIAHNPNGRFVVVCGDGEYIIYTAMALRNKAFGTAQEFVWALDSSEYATLENSSTVKVFKNFKERKSFKPEYGAEGIFGGFMLGVKSISGMAFSFYDWEQLELIRRIEIQPRHVFWSESGSLVCLASEEAYYVLKYNASVVAKSRENNTNVTEDGIEDAFEVVGEVNESVKTGLWVGDCFIYTNSLNRINYYVGGEIVTIAHLDHTMYILGYVAKENRLYLNDKELNIVSYSLLLPVLEYQTAVMRGDFETADRVLPTIPHDHRTRVAHFLEKQGFKQQALAVSTEPEHQFELALSLGELKKASQLAEESDKAEGREDNQPSRPSAARWSRLGAAAAAAADTDLTKFCYQKARDYSALLLFSVSTGDRELLEEVAHMSDLAGEDNIAFTSYLTLNDLDSCLALLLKRNKLPEAAFFCRSYYPSMMSDVLKRWRDSVSMTNPKCGQALADPNKYDNLFPEYMDTLAMEFYQKHFGYPYYNQLEHIKENTDLCNVDRDMAHERLVAIHMGAWDPRVITPPSGASGLSSLQDSPRRDPRNPDSSDEASYSDEKIRRRDSMDILEEIEREIDNIVLDNNEEDLDSSDETMYLE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: