MonarchBase - Protein-coding gene

DPOGS215248
Transcript	DPOGS215248-TA	3558 bp
Protein	DPOGS215248-PA	1185 aa
Genomic position	DPSCF300047 - 434023-445885
RNAseq coverage	814x (Rank: top 16%)

Annotation
*Heliconius*	HMEL013991	6e-78	44.31%
*Bombyx*	BGIBMGA008812-TA	4e-88	59.34%
*Drosophila*	sec31-PB	3e-156	36.28%
EBI UniRef50	UniRef50_E0VNA3	0.0	34.38%	Putative uncharacterized protein n=1 Tax=Pediculus humanus corporis RepID=E0VNA3_PEDHC
NCBI RefSeq	XP_973673.1	0.0	37.90%	PREDICTED: similar to vesicle associated protein, putative [Tribolium castaneum]
NCBI nr blastp	gi\|91087995	0.0	37.90%	PREDICTED: similar to vesicle associated protein, putative [Tribolium castaneum]
NCBI nr blastx	gi\|91087995	0.0	38.34%	PREDICTED: similar to vesicle associated protein, putative [Tribolium castaneum]

Group
Gene Ontology	GO:0005515	1.8e-43	protein binding
KEGG pathway	tca:662488	0.0
	K14005 (SEC31)	maps->	Protein processing in endoplasmic reticulum
InterPro domain	[10-325] IPR015943	1.8e-43	WD40/YVTN repeat-like-containing domain
	[12-330] IPR011046	1.5e-40	WD40 repeat-like-containing domain
	[239-279] IPR001680	1.3e-09	WD40 repeat
	[242-279] IPR019781	1.4e-08	WD40 repeat, subgroup
Orthology group	MCL11293		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS215248-TA
ATGAAGATCAAAGAGTTAAAACGGACGGTGAACATGAGCTGGTCGCCAGCGGAGCTCTATCCCTCTATGTTGGTTACCGGCTCTGCGGCACAGCAAGTTGACGCTTCCTTCAGCTCTAATGCTAGCTTAGAGTTATATTCTCTTAATCTTGGTGACCCTACCTACGATTTGGAACTTAAATCTAGTATGCAAACAGAACATAAATTTCAGAAATTAGTGTGGTCGGGCGCTGGAGTGATTGTTGGTGGATGTGATGGTGGACTGTTGGAGTTTTATAATGCGGAGAAACTTCTCAAGAACTCCTCAGAAGCCTTTGTTGGTAGCAGTACTAAACATACAGGCCAAGTGTCGGCGCTGGATATTAACCCCTACCAGAAGAACCTGTTGGCTTCCGGAGCCTCTGACAGTGAGATCTTCATCTGGGACCTCAACAACACCAGCCAGCCCATGGCGCCGGGCGCGAGGAGCGCGCCACACGATCATGTTCAGGGTCTAGCGTGGAACCAACAGGTCCAGCACATTCTGGGTTCGACTTTCGCAACACGATGTCTCGTTTGGGATTTGAGGAAGAATGAACCGATAATGAAACTCAGCGACTCCCAGTCCGGTAGTCGCTGGCGCGCCCTGGCCTGGCACCCTCAGGTCGCCACTCAGCTGTGCGTGGCGTCCGACCACGACCACGCGCCCGTCTTACAGCTGTGGGATCTCAGGTTGGCGGCGTCTCCGCTGGTGACGCTGGAGGGCCACGAGAAGGGCGTGCTGTCCTTGAGCTGGAGCAAACACGACGAGGACCTGCTGCTGTCCGCCGGCAAGGACGGGAGCGTGCGCGTCTGGAACCCTGCCAACACCAAGCCGGGAGGGGAGATGGTCCTGGAGGTGTGCCGTCAGTCGGGCTGGGTGCTGGACGTGTCGTGGTCGCCGCGGACGCCCGGCCTCCTCGCCGCCGCCTCCTTCGACCAGACCCTTTCAATCAACGAACACTCCAATTTTCCTGGTCCATTTCAGAGCGCTCAGGGTCAGAGCGACATAATGGATTCTTTCGGTGGGGCGGAGTCGTTCCTGTCCCTGCCGGTGGTGAGTCCGTCCGCCCCGCCGCCCGCCCCCGCCCCGCAGGCTCACAGACCACCCAGATGGTTGAAGCGACCCGTCCGGGCCAGGTTCGCGTTCGGTGGTAAGTTGGTGTCGTTCGAGCGTTGCCGGCGCGAGGCGGGCGCGCAGGAGACGGTCTACATCAGTCAGGTGGTGAGCGAGCCGGAGATCGTGGAGAAGGCGATGGAGCTGGACAAGGTCATCGGCCTCACGCTCAGCCAGGAACCCGACGCGACACACCGGCTGGCCGAATATTGCCGTGAGAAGGGAGACGCGGCCGTGGAGCAGAGCGAGCGCTACGAGTGGTTCTTCCTACGAGCGAACTTCCTGCCATCATACCGGACGGAACTGCTGAATCTGTTAGGGTTCAAACAGGACGAGATATCGTCGAGGTTCAAAGGCCTAGCCGTTAACAACGAGGGCCGAGCAGCGGACGCCCAGGGACTCAGCAGGGACGCGCAGACCTTGATAGAGAGGAAGCTGTCTAGTGTGGAGCTGGAGCCGAGCGTGCGGGACGTGGTCATCCCCAACGGAGACGACCTCACGAGTGAGATCTGTCGCTCGCTGGTGATGGGTCAGCTGGAGGAGGCGGTGGAGCTGTGTCTGGAGGACGAGCGGGTCGCCGACGCACTCGTCATCGCCTCGCTCGGAAGCCAAGAGTTGTTGTACAAGGTCCAGCGGTACCATCTGTATCGCACGTGTAACTCGCCCGTGTCGCTGGTGGCGGGCGGTCTGCTAGGCGGGCGTTGGGCGGCGCTGGTGGCGGGCGCCTCTCCCTCGTCCTGGAGGGACGTGCTGGCCGCCCTCCTCACACACTGCCACGGAGAGAGCTTGCAACACTACTGCGAGATGTTGGGTGACAAGCTATCATCGTCATCCGAGGCGAGTCTTCGGGAGGCGGCCGTACTGTGTTACACGTGTTGTGCGTGCGGGGAGCCGCTGTGTAGACGAGCGCTACGATCCAGCCGGAGCCCCGCAGACCTGGCAGCCGCCGCGGAGCGAGCGCTGTTGTTGCGTCGGGCAGCCGCGGTCAACGGTTCCGCGGCCGGCGGGTCCGCGGTGCCCGGGGGGTCCTCTGCCGTGGACGTGTTGCTGGAGGAGTACGCAGCGAGGCTCGCGGCTCAGGGCTGCCTGAGGAGCGCCCTGGCCGCACTGCAGGGAGCCAACACTACGCTCAATGATAGACTGGAGGTGGCTCTAAGGATGAAGAATCAATATCACAATCGTCAGCAGCCGTCCGGCTCCCAGCAGACCGGCCCTCGCTCCCGGACCGTCAGCGGACACACGCACACACAGCCGCGCGGACAGTACACACACACATACACACACAACGACAGCCACGCCTACAACCAACGTGGAATATCCGGGAGATCTAAATACAAAGTGGATCCGTCAGTGCAGGCGGCTCCTCTCTACAACCAGTATAGCTTCAACAACCCCGCTCCCCCGCAGCCGTCATACGGCTATAACAGTCCTCTGCCGGAACAGTACGGGTCCCCCGCGCCCGTCAATAACTTCGCTCCCATCAACAGACCTAACCCGGTCCCGTTAAACCCGGCTCCACTAAACCCGGCTCCACTAAACCCAGCTCCACTAAACCCAGCCCCGCTCAGCCAGCCTCAGCCTGAGCCCATGTCCATGTCTCAGTACGCTCCCCCCCGGCCCGCCGCCCCCGGCTGGAACGACCCCCCGATGGTCACCAACACGCATAAGTTCGATGTCGGCGACATGTCGGCCTCCCACGCCGGCACCAGGCACTGGACACAGCTCCTACAGAGTAGACGGTCGGATGAGCCAAAGCAAGAAGTTCAGCAGCAGGCGCCCATAACACATCCGTTGTTCGGAGTGGAGCCTCCGCAGCACGTGCCTCTGGTGCCGGCCCCGGGACAGAATCACTACCAGCCACAGAACCAGTTCCCTCCGGCCCAGTACCCCGGACAGTTCCAAGGACAGTATCAAGGGCAACCGGCTCACTTCCCGGGACAGCAGGACCAATTCTCGGGACAACAACCTCCTGACCAGTACCAGCCGCAGTACCCTGGCGGATATCAACAGAACTACGTGCAGCAGCTGCCTCCTCAGGCCGCCGCCCCCCCGGCCTCGGGTCCCCCGGCGCCGCCAGCCCCGGTACCCAAGCCCCCGCTGTCGGCGGACCACGCCCCCATACAGACCGCCTTCGACGAACTCCACCGCGTGTGTCTCGAGCGAGCACACAACACACAAATCAAGAGGAAGCTGGAGGACGTGCAGCGGCGGCTGGAGACGCTCTACGATATATTACGCGAGAACAAGCTGTCCCCGTCAGCGCTGTCGGCGCTTCACACGAGCGCAGCGCTGGCCGGTCGCGGGGAGGCGTCCAGCGCGCTGCAGGCGTGCTCGGAGCTGGCGGCCGGCAGTGACTTCGCCGCGGCCGCGTCCTTCCTCCCTGGATTGAAGATGTTGTTCCTCCTGGCGGACCAGCTGCGGTAG

Protein sequence:

>DPOGS215248-PA
MKIKELKRTVNMSWSPAELYPSMLVTGSAAQQVDASFSSNASLELYSLNLGDPTYDLELKSSMQTEHKFQKLVWSGAGVIVGGCDGGLLEFYNAEKLLKNSSEAFVGSSTKHTGQVSALDINPYQKNLLASGASDSEIFIWDLNNTSQPMAPGARSAPHDHVQGLAWNQQVQHILGSTFATRCLVWDLRKNEPIMKLSDSQSGSRWRALAWHPQVATQLCVASDHDHAPVLQLWDLRLAASPLVTLEGHEKGVLSLSWSKHDEDLLLSAGKDGSVRVWNPANTKPGGEMVLEVCRQSGWVLDVSWSPRTPGLLAAASFDQTLSINEHSNFPGPFQSAQGQSDIMDSFGGAESFLSLPVVSPSAPPPAPAPQAHRPPRWLKRPVRARFAFGGKLVSFERCRREAGAQETVYISQVVSEPEIVEKAMELDKVIGLTLSQEPDATHRLAEYCREKGDAAVEQSERYEWFFLRANFLPSYRTELLNLLGFKQDEISSRFKGLAVNNEGRAADAQGLSRDAQTLIERKLSSVELEPSVRDVVIPNGDDLTSEICRSLVMGQLEEAVELCLEDERVADALVIASLGSQELLYKVQRYHLYRTCNSPVSLVAGGLLGGRWAALVAGASPSSWRDVLAALLTHCHGESLQHYCEMLGDKLSSSSEASLREAAVLCYTCCACGEPLCRRALRSSRSPADLAAAAERALLLRRAAAVNGSAAGGSAVPGGSSAVDVLLEEYAARLAAQGCLRSALAALQGANTTLNDRLEVALRMKNQYHNRQQPSGSQQTGPRSRTVSGHTHTQPRGQYTHTYTHNDSHAYNQRGISGRSKYKVDPSVQAAPLYNQYSFNNPAPPQPSYGYNSPLPEQYGSPAPVNNFAPINRPNPVPLNPAPLNPAPLNPAPLNPAPLSQPQPEPMSMSQYAPPRPAAPGWNDPPMVTNTHKFDVGDMSASHAGTRHWTQLLQSRRSDEPKQEVQQQAPITHPLFGVEPPQHVPLVPAPGQNHYQPQNQFPPAQYPGQFQGQYQGQPAHFPGQQDQFSGQQPPDQYQPQYPGGYQQNYVQQLPPQAAAPPASGPPAPPAPVPKPPLSADHAPIQTAFDELHRVCLERAHNTQIKRKLEDVQRRLETLYDILRENKLSPSALSALHTSAALAGRGEASSALQACSELAAGSDFAAAASFLPGLKMLFLLADQLR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: