Monarch geneset OGS2.0

DPOGS208482
TranscriptDPOGS208482-TA2652 bp
ProteinDPOGS208482-PA883 aa
Genomic positionDPSCF300064 - 1142399-1145178
RNAseq coverage184x (Rank: top 49%)
Annotation
HeliconiusHMEL0021890.084.94% 
BombyxBGIBMGA010625-TA8e-5276.34% 
Drosophilascat-PA0.039.63% 
EBI UniRef50UniRef50_E3WZ200.039.88%Putative uncharacterized protein n=1 Tax=Anopheles darlingi RepID=E3WZ20_ANODA
NCBI RefSeqXP_001846254.10.043.53%vacuolar protein sorting [Culex quinquefasciatus]
NCBI nr blastpgi|1700368090.043.53%vacuolar protein sorting [Culex quinquefasciatus]
NCBI nr blastxgi|1700368090.043.53%vacuolar protein sorting [Culex quinquefasciatus]
Group
Gene OntologyGO:00421478.8e-39retrograde transport, endosome to Golgi
KEGG pathway 
InterPro domain[642-772] IPR0125018.8e-39Vps54-like
[177-367] IPR0195151.6e-16Vacuolar protein sorting-associated protein 54
Orthology groupMCL13385 Single-copy universal gene
Genotypes for resequenced monarchs and outgroup Danaus species

Nucleotide sequence:

>DPOGS208482-TA
ATGGAGGACAAGAATACCACAAATAAGACGCCAGCATGGCAAAACTGTGTTCATTGCCCAAACCTTCTGTTCAACTCTGCCACGGAATTCGAAAGGCACATACACGAAAAACACAGTATTAAAGAGGGCTCCATCGTACTATGCCAATATGGGCAGAATGGCATTTGTTCAGCATTGCAATTTGGTGATTTACGAAAAGCAGGATTTAAGTACCACATTAGACAACACCACCTTTATAAAAATTGTATAAATGATGACTGGACATTCTATTCCTCATCACAAAACTTGCCTGCAGTATTGAATGATCCAAACAGAGGCAAGCAGAACAATTTTTTTACTAAAACATGGGGTGACAGCTTTACTGATAAGGTAGATATATATCCTAGTCCATATTTGCCAGTTATAACTCTGGCTCACTTTGAATCATACTGTAAAAAAATATCAAAAAGATTTAAAAGGCACCGACAACTTAAAGAGACTCTACCAGCTAAAAGTAAAACACCAGTAGTGGAAACAGTTTGTGAGATTCCTAGCATCTTTTATGAGCAATCTTTAGCTCTTAATGACCCTCAAAACTTCAGTAAAGTTTTTCCTGGGTTATCAAACACACAGGACATAAATAGCACCATAAGGTCACTCCAAGAAACTTTGAGTACATACCTTGATATAATTGAAATGAAGATATCAAAACAGGTAGCGCAGAAATCTGATGCCTTTTTCCATGCTATGCTTTCTCATGACACTATCATGGAACAGATGGCGAGAGCCGTTAGAACAGTTCAAAATACAAGGAGGGATATAAAAGATGTTAAAGAGAATTTAACTGATAGTCCTTTAAAATTAATAAGCCTCACTAGAATCAACAAAAACCTTAACAATGTTCATGAACTCTTGAAGTTAATGGGAACAGTGCAGCAAACCCAACCTATGATTCAACTTCTTTTAAGTACTTCAGACTATGTTGCTGCTCTTGACTTAATAAGCTCTACACAAAGAGTTCTATCGACAAGATTATCGGGTATACAAGCCTTCAGACATTTATCACCACAGCTGACAGAGATGAAAAGGTTGATACACAAGATGTTAAGCAATGAATTTCTAAGATTTATTATTGCTGACATAAACAGACCTCTAAAAGATACTGCTGATTTACCAGAAAGAGATAAAATTGTCTCCATTGTATCAGGTATACTCCGTTTGAAAGAATTTGATTTTCTAGACATATTCAAAACAGAAGCAATGACTTCAATTCAAACGACTATAAAACAATGTGTCATAGAAATAATATCAGATAGAGATGGTAGTACAGAAATAGTATTAAGGGGATCTAATACAGACACATGGTTGCTTTGTAATGAAGGTATCATCTTTCTTCAGAAAGTCACTCCCAATATAGTTAATTTATTTAGAAGAATTTTATCTTTGTGTAATTTAATATTGGATGTCAGTCAAATGAGTGACATCACAGGAAATGATAGTGAAGATATATGGACACAGGATGAGCTTTTATTAATTGAGGATAAAATTAAAAAACTTATTATCTCACTGTCTGACTACAGCAACGAAAAATGTGCCAATCTCATTGTAACTAAGACGGATAGAGACTACGTTTTCACAGATTTAACACAACTATCAAAATTATCAAAGCTAATAGAAGACTTTTCAAAGGAGTGCGAAAATATAACAGGACACTACAGTAATTCAATGAAATTGGCGTTAAGAAGTTTTGCTATGAAATATATTCAAAATTTGCATTCTGATAGACGGGTACAACTGACCACAGCTCTTAACAGTGAGAGATGGAAAATTGCTGATGTACCATATGAGTTACAGAGTGTAATAAACAAAATATGTGAAATTGGGGAAATACCTTCAACACTTAATTACGAAAGTGGCAAGGCTGATGGTAAATATTTAATTATAGATAAGGAGAGCTATGCTGTCGTTGCGACAGTGCAACTTTTGATAAAAATTCTACTTGAGTACTGTGACGCAATAAAACAGTCTCCAGATATTGTTCAATATTTAGTTCATTGTATGTTAGAATTGATGAGATTGTTTAATTCTCGATGTTGCCAGTTGGTTTTGGGTGCTGGAGCTATACAGAGTGCTGGATTAAAAACAATTTCTACATCAAATTTAGCTTTAGTGTCTAGATCACTTCAAGTAATACTTTGGCTTTTACCATTAATAAAAAAATTATTAGAAGAAAATAGCTCCAAAGATTTGTCCCTCGGTGGATTTAACAGCATTGAGAGTGACATAATTGGTCATAAGAAGGAAATTGAGAGCAAAATCTGTTTCATAGTGAGCAACATGTTGAGTTCTCAGTTAGTTGGCTGGGAAGCTAAGCCTCCAGTACCTTCGCAGACATTCCGTAACATTTCTAAACACTTGGTCAAACTGCATGAAGCTCTCATAGATATTTTACCTTTAGAACAAATCCGAAATATTTACATGAAAGTACACGACAATTTTAAAGACAAATTACGAGAACAATTAAGCAAAATGAACATAGTTGCGAACGGTAGCCCCCAGCACGGTGTTGTGACTTCTGAATTAACTTTTTATTTACAAACCCTCAAAACATTAAGAGTGATCAATGAAAACGATCCTGAGGATAATATTTTATATGATATTTGGTTACATTAA

Protein sequence:

>DPOGS208482-PA
MEDKNTTNKTPAWQNCVHCPNLLFNSATEFERHIHEKHSIKEGSIVLCQYGQNGICSALQFGDLRKAGFKYHIRQHHLYKNCINDDWTFYSSSQNLPAVLNDPNRGKQNNFFTKTWGDSFTDKVDIYPSPYLPVITLAHFESYCKKISKRFKRHRQLKETLPAKSKTPVVETVCEIPSIFYEQSLALNDPQNFSKVFPGLSNTQDINSTIRSLQETLSTYLDIIEMKISKQVAQKSDAFFHAMLSHDTIMEQMARAVRTVQNTRRDIKDVKENLTDSPLKLISLTRINKNLNNVHELLKLMGTVQQTQPMIQLLLSTSDYVAALDLISSTQRVLSTRLSGIQAFRHLSPQLTEMKRLIHKMLSNEFLRFIIADINRPLKDTADLPERDKIVSIVSGILRLKEFDFLDIFKTEAMTSIQTTIKQCVIEIISDRDGSTEIVLRGSNTDTWLLCNEGIIFLQKVTPNIVNLFRRILSLCNLILDVSQMSDITGNDSEDIWTQDELLLIEDKIKKLIISLSDYSNEKCANLIVTKTDRDYVFTDLTQLSKLSKLIEDFSKECENITGHYSNSMKLALRSFAMKYIQNLHSDRRVQLTTALNSERWKIADVPYELQSVINKICEIGEIPSTLNYESGKADGKYLIIDKESYAVVATVQLLIKILLEYCDAIKQSPDIVQYLVHCMLELMRLFNSRCCQLVLGAGAIQSAGLKTISTSNLALVSRSLQVILWLLPLIKKLLEENSSKDLSLGGFNSIESDIIGHKKEIESKICFIVSNMLSSQLVGWEAKPPVPSQTFRNISKHLVKLHEALIDILPLEQIRNIYMKVHDNFKDKLREQLSKMNIVANGSPQHGVVTSELTFYLQTLKTLRVINENDPEDNILYDIWLH-