MonarchBase - Protein-coding gene

DPOGS215454
Transcript	DPOGS215454-TA	3066 bp
Protein	DPOGS215454-PA	1021 aa
Genomic position	DPSCF300098 - 650774-660263
RNAseq coverage	573x (Rank: top 22%)

Annotation
*Heliconius*	HMEL008361	5e-129	58.31%
*Bombyx*	BGIBMGA007486-TA	6e-36	59.71%
*Drosophila*	CG32350-PA	1e-39	28.18%
EBI UniRef50	UniRef50_E1ZWD6	0.0	46.93%	Vacuolar protein sorting-associated protein 11-like protein n=11 Tax=Coelomata RepID=E1ZWD6_CAMFO
NCBI RefSeq	XP_393972.3	0.0	47.25%	PREDICTED: similar to Vacuolar protein sorting 11 [Apis mellifera]
NCBI nr blastp	gi\|307190490	0.0	46.93%	Vacuolar protein sorting-associated protein 11-like protein [Camponotus floridanus]
NCBI nr blastx	gi\|307190490	0.0	46.82%	Vacuolar protein sorting-associated protein 11-like protein [Camponotus floridanus]

Group
Gene Ontology	GO:0005515	2.4e-11	protein binding
KEGG pathway
InterPro domain	[29-229] IPR015943	2.4e-11	WD40/YVTN repeat-like-containing domain
	[29-190] IPR011046	2.8e-10	WD40 repeat-like-containing domain
Orthology group	MCL14900		Single-copy universal gene

Nucleotide sequence:

>DPOGS215454-TA
ATGGCGTTTTTAGAGTGGCGTCGTTTCACTTTTTTTGATGTTCACAACAACCTGGACAATGGAAAGATTGCTGAGTGCTTGCAGGATACCAATGTAACAGTGGCTACGAGTGGCCACAACCACGTAATACTCTGTGATGTGACAGGGTGGGCTCATCTGATATCCCGCTCCTGGGAGATAATGTCATTCAAAGCTTACGAGATGACCGTCCTATTAGCGCAACAGCTACCACACGATCCATTCTTAGTAACTATTGGAGAAGATGAGTCCGGTGTCACACCTTTGATTAAAGTGTGGGACTGGTCGAGGGTGGACCGTCATGGGAACCCTCAATGTGTTCGAACTGCCCGTGCTATGCCGTCTCATGGACACAATGTACAAACTACCGCTCTAGCTGTGCATGACAATAAGAATCTCCTAGCCGTTGGTTTCCAAGATGGTTCAGTGACCTTATATCGTGGAGAGATATCAAGACAGCGTGGAATCAAAATGAAAACATTACCAGACACCGGATCCAGTCCTATAACTGGACTGGCTTTCAAAGGTGCTGATAAGTTGTTCGTGGTGTCTCGTTCCTGTGTAATGGTGTGCTGGTTGACCAGCGACCGTAGTGTGGTTCTGGACGCCATGGGAGCAGCACCAGGGTGCTCAGTGCTAGCAAACTCACATAGACTGACGGTTGCCGCACCGGATGCTATTTACTGCTATACTACCGAGGGTCGTGGTCCATGCTATGCTCTGGAGGGGGAGAAAGTCAGGTTGAACTGGTTCCGCAGCTACCTGGTGATAGTCACCAACGCCACCGGTTCAGCAAACACACCGAAATCCCATCACATCACGATATTGGACATTCAGAACAAATTCATAGTATTCTCTAAGACGTTCGAAGAAATCGATGCCGTCCTGACAGAATGGGGATCCTTTTACATTCTCCAGAAGAATAAGGAGATGATATTTTTGGAGGAGAAGGATCTTCAATCGAAGTTACTGTTGCTCTTCAAGAAGAACCTGTACGATGTAGCCATTAGGATAGCGAGCAGCCAACACTACGACGTAGAGGGGTTGACTGAAATATACAAGAATTACGGAGACCATTTGTATAGTAAGGGTGACCTTAAAGGGGCGATAGATCAATATGTGAAGACGATAGGCTGGTTGGAAACGTCATACGTTATACGCAAATACCTCGAATCCCGCCACCTGGAACCCTTGGTGCTGTATTTGGAGGAACTGCATAAGAAGGGTTACGCCACCGAAGACCACACCACGTTGCTGCTGACGTGTTACGTGAAAATCGACCAACACGACCAACAGGGGAAATTGAAGGAATTCATCAACTCCAAGGATAAGGCCATCGACTTCGACGTAGATGTTGCTATCAAGGTCGTCCGTCAAGTGAGTGCCACAGACGCGTTGTCACTAGCTTACAACTACAAGCGTCACGACTGGTACCTGAAAATAGTGACAGAGGATAAGAAAGATTACAAACAGGCTCTGGACTATATATCGGAACTAGAGTTTGAAGACGCCGAGATGTACATGAAGAAGTACGGACACAAACTGATACAACACGTCCCCGGAGATAGCACCGAGCTGTTGAAATTACTGTGTACAGACTACAAACCTCGCAGTAAACCGTTAGTAGATGAGAGCACTTTATCCGGTAACCTGCGAGAACCCGACAGAGCTGTACCCGATGATTTCATACACATGTTCCTGAGCAATTCTGAGCGTCTCATAGACTTCCTTGAGCATATGGTGACCAAGGACACTCAATGCTCGAGTCTCGTCTACAATGCTCTAATTGAGCATTATATACACGTCTGGGCCAAATCGTCTGAAGCGGACAAGAGGATTTACGAGCAGAAAGTACTCGATATCATCAAAGACCCCGAAGCCAAATACGACAAAGATCAGACGCTCATTATTTGCCAAATGCTGGGATTCAAGAGTGGCATCCTCCAACTATACGAGGAGAAAAGACTATGGCGTGCTCAGATATCTCTCCACCTCCGTACACCGGGCGGCACAGAGCGCGCGCTCGGAGTGTGTCGTCGTCGCGGAGGGAGTGCGCCGCGTTTGTGGCTGGACGTACTATGGGCACCTCCACCACCAGATTACCTTCCAGAACTGCTCAGAGTCGTGGCTGCCGAAAAACTGTTATCACCCATCCTGGTCATCGATTGCCTGGCGAGTACACCGACCTACACACTCGGAGATGTCCGCAAGTACCTGACGGACGTTTTGAAGTCTGAGGACGAAGTGATCACTAGAGAACAGGAACTGGCAGCGAAATACAAGAAGGAGATAGAAGAGATGAAGACTCAGATACACAACATACAGAACGAACCTATCACGTTCCAGAGGAGCCTGTGCGCGGCCTGCAGCAGGCCGCTCGAGTTGCCCACCGTACACTTCATGTGTCAGCACTCCTTCCACAAGGACTGTTTCGAGACGTATTCGGAGTCGGAGCGCCAGTGCGTGGCGTGTTCCCCGACGCTTCGCCCCGCGCCCGCGCCGCCCGCCGACCAGCTGCACTCACGACTACACGCAGACACCGACCCCGTATTATATGTGGTGACTGAGGCGCCGGAGCCCGTACCCTTCAATGTACCCTCAACTGTACCTTACGTACCATCCGTTGTGACTGTACCCTCCGCACCTGTCCCAACTTACGGACCGGGCGCTGAAGCGAAGCTCAGGCTGCAGGAGGGACAAAGCAAACAAGTCTATGTCCAGAACGCTTTGAAGCAAATACCTCCGAAGGGCACGGCGGTGATTCCCGTACCGGAAGGCAGGATGCGTCTCCTGGAACAGCATCAGTACAGTTCCAGCCTGGAAGCCAATATGAGCAAACTGGAACCCTTAGTCCACAGATCCCCTCAACAGTCCCCAAACACCTCCCGGACGAAACCTCCACAGAAAATATCCTCAGCGATCATCGATAGCAAAAATCCCTTCGACACATACGACGAGTCGAAGAATCCCTTCGCAGACGAAGACAACGATCCCACGAACCCCTTCGCCGAAGACGACTATGATAAAAATTTAAATCCATTCGCCTGA

Protein sequence:

>DPOGS215454-PA
MAFLEWRRFTFFDVHNNLDNGKIAECLQDTNVTVATSGHNHVILCDVTGWAHLISRSWEIMSFKAYEMTVLLAQQLPHDPFLVTIGEDESGVTPLIKVWDWSRVDRHGNPQCVRTARAMPSHGHNVQTTALAVHDNKNLLAVGFQDGSVTLYRGEISRQRGIKMKTLPDTGSSPITGLAFKGADKLFVVSRSCVMVCWLTSDRSVVLDAMGAAPGCSVLANSHRLTVAAPDAIYCYTTEGRGPCYALEGEKVRLNWFRSYLVIVTNATGSANTPKSHHITILDIQNKFIVFSKTFEEIDAVLTEWGSFYILQKNKEMIFLEEKDLQSKLLLLFKKNLYDVAIRIASSQHYDVEGLTEIYKNYGDHLYSKGDLKGAIDQYVKTIGWLETSYVIRKYLESRHLEPLVLYLEELHKKGYATEDHTTLLLTCYVKIDQHDQQGKLKEFINSKDKAIDFDVDVAIKVVRQVSATDALSLAYNYKRHDWYLKIVTEDKKDYKQALDYISELEFEDAEMYMKKYGHKLIQHVPGDSTELLKLLCTDYKPRSKPLVDESTLSGNLREPDRAVPDDFIHMFLSNSERLIDFLEHMVTKDTQCSSLVYNALIEHYIHVWAKSSEADKRIYEQKVLDIIKDPEAKYDKDQTLIICQMLGFKSGILQLYEEKRLWRAQISLHLRTPGGTERALGVCRRRGGSAPRLWLDVLWAPPPPDYLPELLRVVAAEKLLSPILVIDCLASTPTYTLGDVRKYLTDVLKSEDEVITREQELAAKYKKEIEEMKTQIHNIQNEPITFQRSLCAACSRPLELPTVHFMCQHSFHKDCFETYSESERQCVACSPTLRPAPAPPADQLHSRLHADTDPVLYVVTEAPEPVPFNVPSTVPYVPSVVTVPSAPVPTYGPGAEAKLRLQEGQSKQVYVQNALKQIPPKGTAVIPVPEGRMRLLEQHQYSSSLEANMSKLEPLVHRSPQQSPNTSRTKPPQKISSAIIDSKNPFDTYDESKNPFADEDNDPTNPFAEDDYDKNLNPFA-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: