MonarchBase - Protein-coding gene

DPOGS213220
Transcript	DPOGS213220-TA	2430 bp
Protein	DPOGS213220-PA	809 aa
Genomic position	DPSCF300114 + 470503-476585
RNAseq coverage	494x (Rank: top 25%)

Annotation
*Heliconius*	HMEL017081	0.0	71.03%
*Bombyx*	BGIBMGA007414-TA	9e-113	66.87%
*Drosophila*	p115-PA	0.0	56.66%
EBI UniRef50	UniRef50_E3WNX5	0.0	55.07%	Putative uncharacterized protein n=1 Tax=Anopheles darlingi RepID=E3WNX5_ANODA
NCBI RefSeq	XP_972184.1	0.0	59.65%	PREDICTED: similar to vesicle docking protein P115 [Tribolium castaneum]
NCBI nr blastp	gi\|91088529	0.0	59.65%	PREDICTED: similar to vesicle docking protein P115 [Tribolium castaneum]
NCBI nr blastx	gi\|91088529	0.0	59.65%	PREDICTED: similar to vesicle docking protein P115 [Tribolium castaneum]

Group
Gene Ontology	GO:0048193	0	Golgi vesicle transport
	GO:0006886	6.6e-68	intracellular protein transport
	GO:0048280	6.6e-68	vesicle fusion with Golgi apparatus
	GO:0005737	6.6e-68	cytoplasm
	GO:0000139	6.6e-68	Golgi membrane
	GO:0005488	1.1e-17	binding
	GO:0016020	3.7e-08	membrane
	GO:0008565	3.7e-08	protein transporter activity
KEGG pathway
InterPro domain	[3-781] IPR024095	0	Vesicle tethering protein p115-like
	[360-625] IPR006953	6.6e-68	Vesicle tethering protein Uso1/P115-like , head domain
	[27-325] IPR016024	1.1e-17	Armadillo-type fold
	[682-783] IPR006955	3.7e-08	Uso1/p115-like vesicle tethering protein, C-terminal
	[16-210] IPR011989	7.7e-06	Armadillo-like helical
Orthology group	MCL13721		Single-copy universal gene

Nucleotide sequence:

>DPOGS213220-TA
ATGGATTTTCTTAAAAGCGGTCTCAAAACAGTCCTCGGAACACCGGAGTCTGGTCAACAACCATCGGTCGCTGAAACGGTTGAGCGTTTGGTAGAAAGAGCAAGTAATTCCACCCTCCTGGAAGATCGTAGAGATGCTTGCCGGGCATTGAAAGCTATGTCCAGGAAATACAGGCTTGAAGTTGGTGCTCAAGGGTTAGATACTCTGAGACAGATTTTAGAATTAGACAGAGCAGACAACGAAACTGTGAACTATGCGTTGGACACGTTAAACAATATTGTGTCTCCGGCTCAATTTGAGGAAGAAGAGGATAAACCTCACATACCAATGAACATCGGCGACCAGTTCACGGAAATGTTCATCAAAGACCCGCACAATATACAATTAGTGTTGGATCTTCTCGACGAATATGACTTCCGAGTTAGGTTGTCTGCGGTGCAGCTTCTCGTGTCCGTGCTCACAAACAGAACCAAGGACATCCAAGAGATCATTCTAGATAAGCCAATGGGTGTGTCCAAAATGATGGATCTCTTAGCAGACACGAGGGAAGTCATCCGAAACGAAACACTGTTGTTGCTGATCAAATTGACGAAGGGCAATGCGAACATACAGAAGATTGTGGCCTTCGAGAACGCCTTCGACAGACTGTTCGAGATAGTGACCAGCGAAGGATATTCAGATGGGGGGATCATCGTGGAAGACTGTCTGTTGCTGATGTTGAATCTGTTAAAGAATAACAGCAGCAATATAAATTTTTTCAAAGAGGGTAGTTACATACAGAAGATGTTGCCGATGTTCAACATTCCGGAGAACTCTGAAGAGGTCGGCTGGTCGCCACAGAAAGTTGTTAACGTGCATTGTATGCTGCAGCTGGTGAGGACTCTGGTGTCCCCCAGCAACTCTATCCAGATTATATCGAGTTGTCAGAAAATTATGAAAAATGTCGGTCTCTTGGATGCGCTATGTAACATCCTCATGGCGAGTGGAGTGCCAGCGGACATACTGACGGAGACGATCAACACTGTTGGTGAAGTGGTCAGAGGCGACGCCACTAACCAGGACTTCATAGGAAACGTCATCGCACCGTCGTATCCCCCGCGGCCGGCGATTATAGTGCTCTTGATGTCTATGGTCAACGAGAAACAGCCTTTTGCATTGAGATGCGCCGTGCTGTATTGCTTCCAATGTTATCTATATCACAACGAGAGCAGCCAGTCTAACTTGGTCCAGACGTTGCTGCCGTCGTCGTCGGACGTGTCGAGCCTGACGAGCGGTCAGATCCTCTGCGGGGGTCTGTTCTCGTCGGACGTGCTGTCGAACTGGTTTTCAGCCGTGGCCTTGAAGCACGCGCTCATCGATAACCCCACGCAGAAGGAACAGGCGCTAAGAGTGTTACTCGCTACCAACATAGGCAGCACGCCGGTGTCGCTGCTCCACCAATGTACTCTGCTGCTGCAGCAAACCACCAAGCTACAGTCCAAGGTAGCTCTCCTCATGTTGCTGTCGACGTGGACGGCGGGCTGTTCCGGGGCCGTGGCGGCGTTCCTGGCGGCCCCGGGCGGAGTCCCGCTGCTGGTGCATCACGCCGGGAGCAACGAACACGACGACAACGAGTACCTGCTGCAAGGTCTGTCAGCGTTCCTGCTGGCTATATGTATCCACTTCAACGACGACTCGGTGGCCACCTACAGCAGGGACGCCCTCAAGCAGTTGCTGGTGAAGCGGATCGGCATGGAGACGTTCGTGGCCAAGCTGAGCGACGTGTCCAAACACGAACTCTACAACAGGGCCGCCAAACATCCGCAACTGAGAGTCGCCTCGCCCTCAGACGTGCTCATCGACTACGAGTTCTGCAAACTCTTCAAGAGTCTAGAAGGTCTGGAAGGCCCCCTAATGGAGAGCGTGTCTATGAGTCCGGGCAGGTCGTCCCCGGAGCCCCAGCTGGAGCAGTACAAGTCCCTGATCCGTCAACAAGACGCACGCCTCCAGGAGCTGGTGCAGCAGCTGGAGACGCTCACGGCACACGCACAAAACCTCCAGGGCGCTCTGAACGAGGCTCAGTCAGCCAACTCCCTGCTCAGAGACGAGAACACACTGCTCAAGGCGCAGGTCGGGAACTCCGGCTCGGACCACGAGGACAGGATACGACAGCTGACCGGGGAGGTGGCCAGGCTCAAGGAGGAGTTGGAGGGAGTCAGGAGGAGTCACAGCGCCAGGGACGAGGAGCTGGAGAAGATGAAGAGGGACCAGAACGATCTGTTGGAGCTACTGGACGATCAGGATTTGAAATTGACGGAATACAAAATGAGGTTAATAAATCTCGGCCAATCTATAGACGAAGACAATGTCGTCGAGCCCGAAGATAACCCGAGTCGTGTAAATAACAAAACAGTCGACGGAACAGATTACATCGTGACCCCGCCTTTATAG

Protein sequence:

>DPOGS213220-PA
MDFLKSGLKTVLGTPESGQQPSVAETVERLVERASNSTLLEDRRDACRALKAMSRKYRLEVGAQGLDTLRQILELDRADNETVNYALDTLNNIVSPAQFEEEEDKPHIPMNIGDQFTEMFIKDPHNIQLVLDLLDEYDFRVRLSAVQLLVSVLTNRTKDIQEIILDKPMGVSKMMDLLADTREVIRNETLLLLIKLTKGNANIQKIVAFENAFDRLFEIVTSEGYSDGGIIVEDCLLLMLNLLKNNSSNINFFKEGSYIQKMLPMFNIPENSEEVGWSPQKVVNVHCMLQLVRTLVSPSNSIQIISSCQKIMKNVGLLDALCNILMASGVPADILTETINTVGEVVRGDATNQDFIGNVIAPSYPPRPAIIVLLMSMVNEKQPFALRCAVLYCFQCYLYHNESSQSNLVQTLLPSSSDVSSLTSGQILCGGLFSSDVLSNWFSAVALKHALIDNPTQKEQALRVLLATNIGSTPVSLLHQCTLLLQQTTKLQSKVALLMLLSTWTAGCSGAVAAFLAAPGGVPLLVHHAGSNEHDDNEYLLQGLSAFLLAICIHFNDDSVATYSRDALKQLLVKRIGMETFVAKLSDVSKHELYNRAAKHPQLRVASPSDVLIDYEFCKLFKSLEGLEGPLMESVSMSPGRSSPEPQLEQYKSLIRQQDARLQELVQQLETLTAHAQNLQGALNEAQSANSLLRDENTLLKAQVGNSGSDHEDRIRQLTGEVARLKEELEGVRRSHSARDEELEKMKRDQNDLLELLDDQDLKLTEYKMRLINLGQSIDEDNVVEPEDNPSRVNNKTVDGTDYIVTPPL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: