MonarchBase - Protein-coding gene

DPOGS200385
Transcript	DPOGS200385-TA	1587 bp
Protein	DPOGS200385-PA	528 aa
Genomic position	DPSCF300852 - 1321-6526
RNAseq coverage	267x (Rank: top 40%)

Annotation
*Heliconius*	HMEL004231	0.0	82.77%
*Bombyx*	BGIBMGA013343-TA	0.0	67.73%
*Drosophila*	gho-PA	6e-176	54.43%
EBI UniRef50	UniRef50_Q9VQ94	9e-174	54.43%	CG10882 n=30 Tax=Coelomata RepID=Q9VQ94_DROME
NCBI RefSeq	XP_971886.1	0.0	58.54%	PREDICTED: similar to Sec24B protein, putative [Tribolium castaneum]
NCBI nr blastp	gi\|91094647	0.0	58.54%	PREDICTED: similar to Sec24B protein, putative [Tribolium castaneum]
NCBI nr blastx	gi\|91094647	0.0	58.54%	PREDICTED: similar to Sec24B protein, putative [Tribolium castaneum]

Group
Gene Ontology	GO:0006886	9.4e-48	intracellular protein transport
	GO:0030127	9.4e-48	COPII vesicle coat
	GO:0006888	9.4e-48	ER to Golgi vesicle-mediated transport
KEGG pathway	tca:660571	0.0
	K14007 (SEC24)	maps->	Protein processing in endoplasmic reticulum
InterPro domain	[3-180] IPR006896	9.4e-48	Sec23/Sec24, trunk domain
	[281-386] IPR006900	4e-29	Sec23/Sec24, helical domain
	[187-269] IPR012990	3.3e-20	Sec23/Sec24 beta-sandwich
Orthology group	MCL10886		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS200385-TA
GGTACCCTGGCGCAGCCCGCAATGCTCTCAGTGGGCGACACCGCGGACATGTTCGTGCCACTGCTAGAAGGATTCCTGTCCACCGCGGAGGACAGCGGGCCGGTGTTGACGTCACTGCTGCAACAGCTGCCGCAGGTGTTCCAGAACAACAAGGACACGGAGACCGTGCTGCTGCCGGCCGTCCAGGCTGGCTACGAGGCTCTGAAGGCCGCTGACACTTCCGGCCAACTGCTAGTCTTCCACACATCGCTGCCCACATACAACGCGCCCGGGAAACTCATCAACAGGGAAGACAGGAAGTTACTCGGCACGGATAAGGAAAAACAGATACTTTCCCCTCAGAGCACGTCATACAATGAGCTGGGGCAGCTGTGCAGCGCTGCAGGCGTGTGTGTCCAGATGTTCGTGTGTAACAACTCGTACGTCGACTGCGCCACCATCGGCCAGCTGGCCAGGCTCACCGGCGGACAAGTACACAAGTACACGTACTTCACATCGGACACGGACGGCCACCGTCTGATGTGGGACGTGTCGCGCGTGCTGTCCCGCCCGACCGCTCACGACGCGGTCATGCGCGTGAGGACCAGCACCGGCGTGCGCCCCACAGACTTCTACGGACACTTCTTCATGTCCAACACCACGGACGTCGAGCTGGCCGCCATCGACTCGGACAAGGCCATCGGCGTGGAGATCAAACACGACGACAAGTTGACGGCGGAGTCCGGCGTGTACATCCAGGCGGCGCTGCTGTACACCCACCGCTCGGGCCAGCGGAGGCTGAGGGTCATCAACCTCGCGCTGTCGCTCGCCCACCAGCTGGCGGATGTGTACAGATCCGCGGAACTGGACACCATCGTAAACTTCCTCACTAAACAAGCCGTGTGGGCGCTCCGTGAGGCTACGCCCCGTCAGGTCCGCGAGGGCCTCACAAGTCGCTGTGCTCGTTCGCTGGCCGCCTACCGACGTCACTGCGCCTCGCCCTCGTCCGCCGGACAGCTGGTGTTGCCGGAAGCCATGAAACTACTTCCACTATACACCAGCTGTGTGCTGCGGTCTGATGCTGTCGGCGGTGGGCCGGACATAACGTGCGACGACCGCTCGTGCGCCATGTACCGCGCGCTCACGGCGGACGTGTCCCTGTCGCTCGTGTACACCTACCCTCGCCTGCTGCCGCTGCACGTGCTGCCCGACCAGGAGCCCGCCCCGCTCAGGGCCTCCATAGACAAGATGTCCGAACACGGAGTCTATTTGTTGGAGAACGGAGTCCACATGTTGATATGGGTGGGGTCCCAAGCGCCGCTGGAGTTCGTGAGGGATGTGTTCGGAGCGAACTCGCCGCAGGCCGTAGACGCCCGGGTGTGCGAGCTACCGGAAATAGACTCGCGAGTCGGCGCAGCGGTGCGCAGGCTCGTGGACGACACCAGGCATAAGAGGAGGAACGCCATGAGGCTAACCGTATTACGGCAGCACGACAAGCTGGAGACGGTGCTGCGTCAGCTTTTAGTGGAGGATCGGGGGGTAGACGGCGGGGCTTCCTACGTCGACTACCTCTGCCATATACACAAGGAGATACGCGCCCTACTCTAG

Protein sequence:

>DPOGS200385-PA
GTLAQPAMLSVGDTADMFVPLLEGFLSTAEDSGPVLTSLLQQLPQVFQNNKDTETVLLPAVQAGYEALKAADTSGQLLVFHTSLPTYNAPGKLINREDRKLLGTDKEKQILSPQSTSYNELGQLCSAAGVCVQMFVCNNSYVDCATIGQLARLTGGQVHKYTYFTSDTDGHRLMWDVSRVLSRPTAHDAVMRVRTSTGVRPTDFYGHFFMSNTTDVELAAIDSDKAIGVEIKHDDKLTAESGVYIQAALLYTHRSGQRRLRVINLALSLAHQLADVYRSAELDTIVNFLTKQAVWALREATPRQVREGLTSRCARSLAAYRRHCASPSSAGQLVLPEAMKLLPLYTSCVLRSDAVGGGPDITCDDRSCAMYRALTADVSLSLVYTYPRLLPLHVLPDQEPAPLRASIDKMSEHGVYLLENGVHMLIWVGSQAPLEFVRDVFGANSPQAVDARVCELPEIDSRVGAAVRRLVDDTRHKRRNAMRLTVLRQHDKLETVLRQLLVEDRGVDGGASYVDYLCHIHKEIRALL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: