MonarchBase - Protein-coding gene

DPOGS204779
Transcript	DPOGS204779-TA	2700 bp
Protein	DPOGS204779-PA	899 aa
Genomic position	DPSCF300231 + 579132-590477
RNAseq coverage	1166x (Rank: top 11%)

Annotation
*Heliconius*	HMEL017691	0.0	78.34%
*Bombyx*	BGIBMGA013717-TA	6e-175	87.86%
*Drosophila*	betaCop-PA	0.0	60.30%
EBI UniRef50	UniRef50_B0W8M2	0.0	56.28%	Coatomer subunit beta n=12 Tax=Opisthokonta RepID=B0W8M2_CULQU
NCBI RefSeq	XP_001816488.1	0.0	58.46%	PREDICTED: similar to coatomer subunit beta [Tribolium castaneum]
NCBI nr blastp	gi\|383856100	0.0	60.95%	PREDICTED: coatomer subunit beta-like isoform 1 [Megachile rotundata]
NCBI nr blastx	gi\|350413321	0.0	60.57%	PREDICTED: coatomer subunit beta-like [Bombus impatiens]

Group
Gene Ontology	GO:0005737	0	cytoplasm
	GO:0006886	5.6e-110	intracellular protein transport
	GO:0030126	5.6e-110	COPI vesicle coat
	GO:0005198	5.6e-110	structural molecule activity
	GO:0016192	5.6e-110	vesicle-mediated transport
	GO:0005488	4.5e-92	binding
	GO:0030117	1.5e-87	membrane coat
KEGG pathway	vvi:100241708	1e-13
	K12392 (AP1B1)	maps->	Lysosome
InterPro domain	[1-891] IPR016460	0	Coatomer, beta subunit
	[624-883] IPR011710	5.6e-110	Coatomer, beta subunit, C-terminal
	[24-484] IPR011989	4.5e-92	Armadillo-like helical
	[20-473] IPR002553	1.5e-87	Clathrin/coatomer adaptor, adaptin-like, N-terminal
	[12-490] IPR016024	1.9e-64	Armadillo-type fold
Orthology group	MCL14209		Single-copy universal gene

Nucleotide sequence:

>DPOGS204779-TA
ATGGGGGGTGTTGAGCAACCATGCTACACTCTCATTAACTTTCCCACTGATACCGAGCCTTATAGTGAACAGCAGCTGAAGACAGACCTTGAAAAGGGTGATATAAAGAAGAAAATTGAGGCACTTAAGAAAACCATTGGTATCATCCTGTCCGGAGAAAAGATTCCAGGGTTGCTGATGATAATCATCAGGTTTGTGCTGCCGTTACAGGATCACACCATCAAGAAGCTCCTTCTCATCTTCTGGGAAATTGTTCCCAAGACCACACCGGATGGGAAGTTGTTGCAGGAAATGATACTAGTCTGTGATGCATACAGAAAGGATCTCCAACACCCCAATGAGTTCCTCCGAGGTTCTACGTTGAGGTTCCTCTGCAAGTTGAAGGAGCCAGAGCTTCTAGAGCCCCTGATGCCGGCCATCCGAGCCTGCCTGGAACACAGACATTCATATGTTCGGAGAAATGCTGTGCTCGCAATCTTCACCATCTACCGAAACTTCGAGTTCCTGATCCCGGACGCGCCGGAGGTGATCGGCTCGTTCCTGGAGTCGGAGCAGGACATGTCGTGTAAGAGGAACGCCTTCCTCATGCTGCTGCACGCGGACCAGGAGACGGCGCTGGCCTACCTCTCGCAGCGCCTCGACCAGGTGCACGGCTTCGGAGACATCCTGCAGCTCGTCATAGTGGAACTCATATACAAAGTGTGTCACGCCAACCCGGCAGAGCGGTCTCGTTTCATCCGCACGGTGTACGGGCTACTGAACGCGCCGAGCGCCGCTGTGCGCTACGAGGCGGCCGGCACGCTGGTCACGCTGTCCACGGCACCCGCCGCCATCAAGGCGGCGGCGGCGTGCTACATAGACCTGATAGTGAAGGAGAGCGACAACAACGTCAAGCTGATAGTGGTGGAGAAGCTGTCCGCGCTCAGGGACGTGAGCTGCGACGCCACCTCGCGCGCCCTGCCCGAGCTGGCCATGGACGTGCTCAGGGTGCTGGCCTCCTCCGACCTGGACGTCCGCAGGCACACGCTGCATCTCGCTCTGGAGCTGGCCACTCCTCGCCACGCGGACGAGCTGGTGGGCGCTCTGAGGAAGGAGGCGTCGCGGGCTCAGCTCGCGGATCACGACGACGCGGCCAAGTACCGGCAGCTGCTGGTGAGGGCGATGCATCGAGCGGCCATCAAGTTCCCGGAGGTGGCGTGCTCGGTGGCGCCCGGATTGTTGGAGCTACTAGGGGACGGCGGGGAGGTGGCGGCGCAGGATGTGCTCATGTTCACCAGGCACGCGCTGCACGCCTTCCATGACCTGAAACCTGGCATATACGCGAAACTACTGGAGAGTCTGGGCAGCATCCGGGTGGGGAAGATCGCGAGGGCCGCCCTGTGGCTGGTGGCCGAGTTCGCCGACAACGAGGACAACGTGAAGGCGGCCATCGACGTCATCGCGGCTGCCATGCCGACACACAAAGACAATGAGGAGGACGGCGACAAGGACGGCGCTGAGGCTCCGCCTAAGGAAAAGGAGAAGGAGGCGCCCACTCGACAGCTGGTCACCAGTGATGGAGCGTACGTCACGCAGTCCGCCTTCAACCAGCCCAAGACTCCTGTGACTGACAGCGGTCCGACGGCGGACGACCTGGAGCACGGCGTGCGCTGCGTGCGCGCCGGCGCAGAGCGACCCGACGTGCTCAGCGAGGCGCTCACGGCCGGATCCCGGAAAGCGCTCGCCTCGCTACTGACGCTACCACATCGCTCGGCACCGACCCTGCTCCCTGAGGGCTCCCCCGAGCGTCCCGAGGCGTCTTCTCGTCCGACGTCTGTTCCCATCGAGCGCGGGATATCGTTCACCGCCCTGGCGCCGCTCGCCGCCGCCGGCAACAGAGACGTGTTCGAGCTGGCCTTGGATAGAGCTTTACAAGGTCGCACCAAGCCGGCCAGTGACGACGGCGGTCGTTTGTCCAAGGTGACCCAGCTGACGGGCTTCTCGGACCCGGTGTACGCGGAGGCGGTCGTGTCCGTCAATCAGTACGACATAGTGCTGGACGTGTTCGTCGTCAACCAGACAGACGATACCCTCCAGAACTGTACGGTGGAGTTGGCGACGCTGGGCGAGCTGCGGCTGGTGGAGCGGCCGGCGGGCATCGTACTGGGGCCGCGGGATTACGCCTCCATCAGGGCGCACGTCAAGGTCGCCTCCACAGAGAACGGCATCATCTTCGGAAACATCGTGTACGAGGTGTCCGGCGCGTCCATGGACCGCGGCGTGGTCGTGCTCAACGACATCCACATAGACATCGTGGACTACATACAGCCCGCCGCCTGCAGCGACGCCGACTTCCGCACCATGTGGGCAGAGTTCGAGTGGGAGAACAAGGTGTCCGTGAACACGAACATCACGGAGCTGAACGAGTACCTGGAGCACCTGCTGGCGTCCACCAACATGAAGTGCCTCACTCCCGATAAGGCCCTGTCCGGTCAGTGCGGGTTCATGGCGGCCAACCTGTACGCGCGGTCCATATTCGGCGAGGACGCGCTCGCCAACCTCAGCATCGAGATCCCCATGAACAAACAGAACGCTCCCGTCGTGGGACACGTGCGGATACGGGCTAAGACACAGGGCATGGCTCTCAGTCTGGGCGACAAGATCAACATGATGCAGAAGACTCGCCCCAAGAAGCCCAAAGATCCCACGCCGGCTGCCTAA

Protein sequence:

>DPOGS204779-PA
MGGVEQPCYTLINFPTDTEPYSEQQLKTDLEKGDIKKKIEALKKTIGIILSGEKIPGLLMIIIRFVLPLQDHTIKKLLLIFWEIVPKTTPDGKLLQEMILVCDAYRKDLQHPNEFLRGSTLRFLCKLKEPELLEPLMPAIRACLEHRHSYVRRNAVLAIFTIYRNFEFLIPDAPEVIGSFLESEQDMSCKRNAFLMLLHADQETALAYLSQRLDQVHGFGDILQLVIVELIYKVCHANPAERSRFIRTVYGLLNAPSAAVRYEAAGTLVTLSTAPAAIKAAAACYIDLIVKESDNNVKLIVVEKLSALRDVSCDATSRALPELAMDVLRVLASSDLDVRRHTLHLALELATPRHADELVGALRKEASRAQLADHDDAAKYRQLLVRAMHRAAIKFPEVACSVAPGLLELLGDGGEVAAQDVLMFTRHALHAFHDLKPGIYAKLLESLGSIRVGKIARAALWLVAEFADNEDNVKAAIDVIAAAMPTHKDNEEDGDKDGAEAPPKEKEKEAPTRQLVTSDGAYVTQSAFNQPKTPVTDSGPTADDLEHGVRCVRAGAERPDVLSEALTAGSRKALASLLTLPHRSAPTLLPEGSPERPEASSRPTSVPIERGISFTALAPLAAAGNRDVFELALDRALQGRTKPASDDGGRLSKVTQLTGFSDPVYAEAVVSVNQYDIVLDVFVVNQTDDTLQNCTVELATLGELRLVERPAGIVLGPRDYASIRAHVKVASTENGIIFGNIVYEVSGASMDRGVVVLNDIHIDIVDYIQPAACSDADFRTMWAEFEWENKVSVNTNITELNEYLEHLLASTNMKCLTPDKALSGQCGFMAANLYARSIFGEDALANLSIEIPMNKQNAPVVGHVRIRAKTQGMALSLGDKINMMQKTRPKKPKDPTPAA-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: