MonarchBase - Protein-coding gene

DPOGS208482
Transcript	DPOGS208482-TA	2652 bp
Protein	DPOGS208482-PA	883 aa
Genomic position	DPSCF300064 - 1142399-1145178
RNAseq coverage	184x (Rank: top 49%)

Annotation
*Heliconius*	HMEL002189	0.0	84.94%
*Bombyx*	BGIBMGA010625-TA	8e-52	76.34%
*Drosophila*	scat-PA	0.0	39.63%
EBI UniRef50	UniRef50_E3WZ20	0.0	39.88%	Putative uncharacterized protein n=1 Tax=Anopheles darlingi RepID=E3WZ20_ANODA
NCBI RefSeq	XP_001846254.1	0.0	43.53%	vacuolar protein sorting [Culex quinquefasciatus]
NCBI nr blastp	gi\|170036809	0.0	43.53%	vacuolar protein sorting [Culex quinquefasciatus]
NCBI nr blastx	gi\|170036809	0.0	43.53%	vacuolar protein sorting [Culex quinquefasciatus]

Group
Gene Ontology	GO:0042147	8.8e-39	retrograde transport, endosome to Golgi
KEGG pathway
InterPro domain	[642-772] IPR012501	8.8e-39	Vps54-like
	[177-367] IPR019515	1.6e-16	Vacuolar protein sorting-associated protein 54
Orthology group	MCL13385		Single-copy universal gene

Nucleotide sequence:

>DPOGS208482-TA
ATGGAGGACAAGAATACCACAAATAAGACGCCAGCATGGCAAAACTGTGTTCATTGCCCAAACCTTCTGTTCAACTCTGCCACGGAATTCGAAAGGCACATACACGAAAAACACAGTATTAAAGAGGGCTCCATCGTACTATGCCAATATGGGCAGAATGGCATTTGTTCAGCATTGCAATTTGGTGATTTACGAAAAGCAGGATTTAAGTACCACATTAGACAACACCACCTTTATAAAAATTGTATAAATGATGACTGGACATTCTATTCCTCATCACAAAACTTGCCTGCAGTATTGAATGATCCAAACAGAGGCAAGCAGAACAATTTTTTTACTAAAACATGGGGTGACAGCTTTACTGATAAGGTAGATATATATCCTAGTCCATATTTGCCAGTTATAACTCTGGCTCACTTTGAATCATACTGTAAAAAAATATCAAAAAGATTTAAAAGGCACCGACAACTTAAAGAGACTCTACCAGCTAAAAGTAAAACACCAGTAGTGGAAACAGTTTGTGAGATTCCTAGCATCTTTTATGAGCAATCTTTAGCTCTTAATGACCCTCAAAACTTCAGTAAAGTTTTTCCTGGGTTATCAAACACACAGGACATAAATAGCACCATAAGGTCACTCCAAGAAACTTTGAGTACATACCTTGATATAATTGAAATGAAGATATCAAAACAGGTAGCGCAGAAATCTGATGCCTTTTTCCATGCTATGCTTTCTCATGACACTATCATGGAACAGATGGCGAGAGCCGTTAGAACAGTTCAAAATACAAGGAGGGATATAAAAGATGTTAAAGAGAATTTAACTGATAGTCCTTTAAAATTAATAAGCCTCACTAGAATCAACAAAAACCTTAACAATGTTCATGAACTCTTGAAGTTAATGGGAACAGTGCAGCAAACCCAACCTATGATTCAACTTCTTTTAAGTACTTCAGACTATGTTGCTGCTCTTGACTTAATAAGCTCTACACAAAGAGTTCTATCGACAAGATTATCGGGTATACAAGCCTTCAGACATTTATCACCACAGCTGACAGAGATGAAAAGGTTGATACACAAGATGTTAAGCAATGAATTTCTAAGATTTATTATTGCTGACATAAACAGACCTCTAAAAGATACTGCTGATTTACCAGAAAGAGATAAAATTGTCTCCATTGTATCAGGTATACTCCGTTTGAAAGAATTTGATTTTCTAGACATATTCAAAACAGAAGCAATGACTTCAATTCAAACGACTATAAAACAATGTGTCATAGAAATAATATCAGATAGAGATGGTAGTACAGAAATAGTATTAAGGGGATCTAATACAGACACATGGTTGCTTTGTAATGAAGGTATCATCTTTCTTCAGAAAGTCACTCCCAATATAGTTAATTTATTTAGAAGAATTTTATCTTTGTGTAATTTAATATTGGATGTCAGTCAAATGAGTGACATCACAGGAAATGATAGTGAAGATATATGGACACAGGATGAGCTTTTATTAATTGAGGATAAAATTAAAAAACTTATTATCTCACTGTCTGACTACAGCAACGAAAAATGTGCCAATCTCATTGTAACTAAGACGGATAGAGACTACGTTTTCACAGATTTAACACAACTATCAAAATTATCAAAGCTAATAGAAGACTTTTCAAAGGAGTGCGAAAATATAACAGGACACTACAGTAATTCAATGAAATTGGCGTTAAGAAGTTTTGCTATGAAATATATTCAAAATTTGCATTCTGATAGACGGGTACAACTGACCACAGCTCTTAACAGTGAGAGATGGAAAATTGCTGATGTACCATATGAGTTACAGAGTGTAATAAACAAAATATGTGAAATTGGGGAAATACCTTCAACACTTAATTACGAAAGTGGCAAGGCTGATGGTAAATATTTAATTATAGATAAGGAGAGCTATGCTGTCGTTGCGACAGTGCAACTTTTGATAAAAATTCTACTTGAGTACTGTGACGCAATAAAACAGTCTCCAGATATTGTTCAATATTTAGTTCATTGTATGTTAGAATTGATGAGATTGTTTAATTCTCGATGTTGCCAGTTGGTTTTGGGTGCTGGAGCTATACAGAGTGCTGGATTAAAAACAATTTCTACATCAAATTTAGCTTTAGTGTCTAGATCACTTCAAGTAATACTTTGGCTTTTACCATTAATAAAAAAATTATTAGAAGAAAATAGCTCCAAAGATTTGTCCCTCGGTGGATTTAACAGCATTGAGAGTGACATAATTGGTCATAAGAAGGAAATTGAGAGCAAAATCTGTTTCATAGTGAGCAACATGTTGAGTTCTCAGTTAGTTGGCTGGGAAGCTAAGCCTCCAGTACCTTCGCAGACATTCCGTAACATTTCTAAACACTTGGTCAAACTGCATGAAGCTCTCATAGATATTTTACCTTTAGAACAAATCCGAAATATTTACATGAAAGTACACGACAATTTTAAAGACAAATTACGAGAACAATTAAGCAAAATGAACATAGTTGCGAACGGTAGCCCCCAGCACGGTGTTGTGACTTCTGAATTAACTTTTTATTTACAAACCCTCAAAACATTAAGAGTGATCAATGAAAACGATCCTGAGGATAATATTTTATATGATATTTGGTTACATTAA

Protein sequence:

>DPOGS208482-PA
MEDKNTTNKTPAWQNCVHCPNLLFNSATEFERHIHEKHSIKEGSIVLCQYGQNGICSALQFGDLRKAGFKYHIRQHHLYKNCINDDWTFYSSSQNLPAVLNDPNRGKQNNFFTKTWGDSFTDKVDIYPSPYLPVITLAHFESYCKKISKRFKRHRQLKETLPAKSKTPVVETVCEIPSIFYEQSLALNDPQNFSKVFPGLSNTQDINSTIRSLQETLSTYLDIIEMKISKQVAQKSDAFFHAMLSHDTIMEQMARAVRTVQNTRRDIKDVKENLTDSPLKLISLTRINKNLNNVHELLKLMGTVQQTQPMIQLLLSTSDYVAALDLISSTQRVLSTRLSGIQAFRHLSPQLTEMKRLIHKMLSNEFLRFIIADINRPLKDTADLPERDKIVSIVSGILRLKEFDFLDIFKTEAMTSIQTTIKQCVIEIISDRDGSTEIVLRGSNTDTWLLCNEGIIFLQKVTPNIVNLFRRILSLCNLILDVSQMSDITGNDSEDIWTQDELLLIEDKIKKLIISLSDYSNEKCANLIVTKTDRDYVFTDLTQLSKLSKLIEDFSKECENITGHYSNSMKLALRSFAMKYIQNLHSDRRVQLTTALNSERWKIADVPYELQSVINKICEIGEIPSTLNYESGKADGKYLIIDKESYAVVATVQLLIKILLEYCDAIKQSPDIVQYLVHCMLELMRLFNSRCCQLVLGAGAIQSAGLKTISTSNLALVSRSLQVILWLLPLIKKLLEENSSKDLSLGGFNSIESDIIGHKKEIESKICFIVSNMLSSQLVGWEAKPPVPSQTFRNISKHLVKLHEALIDILPLEQIRNIYMKVHDNFKDKLREQLSKMNIVANGSPQHGVVTSELTFYLQTLKTLRVINENDPEDNILYDIWLH-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: