MonarchBase - Protein-coding gene

DPOGS208072
Transcript	DPOGS208072-TA	2967 bp
Protein	DPOGS208072-PA	988 aa
Genomic position	DPSCF300282 - 7183-16948
RNAseq coverage	169x (Rank: top 51%)

Annotation
*Heliconius*	HMEL003339	73.66%
*Bombyx*	BGIBMGA007745-TA	97.47%
*Drosophila*	g-PB	59.43%
EBI UniRef50	UniRef50_Q16YQ5	59.25%	Apl5 protein (Spac144.06 protein) n=2 Tax=Culicinae RepID=Q16YQ5_AEDAE
NCBI RefSeq	XP_001659245.1	59.25%	apl5 protein (spac144.06 protein) [Aedes aegypti]
NCBI nr blastp	gi\|157118913	59.25%	apl5 protein (spac144.06 protein) [Aedes aegypti]
NCBI nr blastx	gi\|157118913	55.49%	apl5 protein (spac144.06 protein) [Aedes aegypti]

Group
Gene Ontology	GO:0008565	0	protein transporter activity
	GO:0005794	0	Golgi apparatus
	GO:0015031	0	protein transport
	GO:0005488	2.4e-156	binding
	GO:0006886	3.7e-125	intracellular protein transport
	GO:0030117	3.7e-125	membrane coat
	GO:0016192	3.7e-125	vesicle-mediated transport
KEGG pathway	aag:AaeL_AAEL008462	0.0
	K12396 (AP3D1)	maps->	Lysosome
InterPro domain	[1-975] IPR017105	0	Adaptor protein complex AP-3, delta subunit
	[649-677] IPR011989	2.4e-156	Armadillo-like helical
	[32-584] IPR002553	3.7e-125	Clathrin/coatomer adaptor, adaptin-like, N-terminal
	[29-957] IPR016024	7.7e-90	Armadillo-type fold
	[713-970] IPR010474	2.7e-22	Bovine leukaemia virus receptor
Orthology group	MCL12345		Single-copy universal gene

Nucleotide sequence:

>DPOGS208072-TA
ATGGCTTTAAAAAAAGTTAAGGGTAACTTCGAAAGAATGTTTGACAAAAATCTTACGGATTTAGTTCGTGGGATAAGAAATAACAAAGATAACGAGGCAAAATATATAGCACAATGTATGGAAGAAATTAAAGTTGAATTGCGGCAAGATAATATCGGGGTGAAAGCTAACGCTGTCGCCAAACTAACATATCTTCAAATGTTAGGATATGACATATCCTGGGCTATATTTAATATAATTGAAGTTATGAGTTCAACTAAGTTTACATATAAACGTATTGGATATTTAGCTGCTAGTCAGTCATTCCATGCAGACTCCGAGCTGCTTATGCTTACCACTAATATGATAAGAAAAGATCTGAATGCTCAAAACCAGTACGAAGCAGGCCTGGCGCTTAGTGGTCTCAGCTGTTTCATATCTCATGATCTGGCGAGAGACTTAGCTAATGATATCATGACATTGATGAGTTCTACGAAACCCTATCTCAGAATGAAGGCGGTGTTGATGATGTACAAAGTATTCTTAAGATATCCCGAAGCTTTGAGACCAGCTTTTCCTAAGTTAAAAGAGAAACTTGAAGATCCCGATCCCGGTGTACAGTCAGCTGCTGTGAATGTTGTGTGTGAATTGGCCCGGAAGAATCCCAAGAATTATCTGTCACTGGCTCCCGTCTTCTTTAAGCTAATGACCACCTCCACTAACAATTGGATGTTGATAAAGATAATAAAACTGTTTGGTGCCTTAACCCCATTAGAGCCTCGACTTGGCAAGAAACTGATAGAACCATTAACTAATTTAATACATAGCACGTCAGCCATGTCTCTGCTGTACGAGTGCATCAACACTGTGATAGCTGTTCTTATCAGCATCAGCAGCGGCATGCCGGGCCATGCAGCATCAGTACAGCTCTGCGTACAGAAACTACGGATACTTATAGAGGACAGCGATCAGAATTTGAAGTATCTGGGTCTGCTGGCTATGTCTCGGATACTGAAGTCTCATCCGAAATCAGTTCAAGCTCACAAGGACCTCGTCCTGGCCTGTTTGGATGATAAGGACGAGTCTATAAGACTAAGAGCTCTCGGCCTGCTGTACGGAATGGTGTCGAAGAAGAATTTGATAGAGATAGTGAAGAAACTAATGGTACACATGGAACGAGCTGAGGGTACGCTGTACAGGGACGAGCTGTTGACCAGGATGATTGAGATCTGCTCCCAGAACAACTACCAGCATGTGGTGCACTTCGAGTGGTACATCACGGTGCTGACGGAACTCACTGAAATGGAGACCAGCGCTAAACACGGTTGTATGATAGCCGGGCAGTTATTGGAGGTGGGGGCCCGGGTGTCGGAGACCCGGGCTTTCGCCGCCCGCGAGTGCTCGTCGCTGGTGACCCGCACCGCCGCAACACAACACGCGCCTCGTGCCGCCTCCAGGGAGGTGTTGTACGCCGCCGCCTATGTACTCAGCGAATACTGCACCGAGGAGCCGGTGATGCGATCTTCCCTGTCTCCTCTGCTGGTGTGTGCCGGTCTCCACGCGGGCCCGTCCAGCGCGCATATGCGGGCCCGGGCGGTGTGTGTGCACGCCGCCCTCAAACTCACCGCCAGACTGCTCCTGTTGTATGAGAACAGAGGCGAGCGCACCGCCGCGCTCTCGGTTATCCACGAGACCCTGGCGGGCATGCAGCCTTTACTCAGCAGCGAGGATATGGAGGTACAGGAGCGAGCCCACAACGCTACAGCACTACTGCGTATAGTGTTGAGGAAGATCAACCCCACGGATCCCGCGCTCGGCAGTGACGTCATCCGCAATGACGTCACCGACACCTTGGTAGAACACGAACCGGAACAGAGCAACGGCGTGGACATCATTGGTGATAGTGACATGAATGGCGGAGACGACGAAGGTTTCAGTGGCGGCCTCATAGCAGAGCTGGCTGGTTTGTTCGAGGGTGAGCTCAAGCCCGTAGCGCCCAAGGCACAGAAGAAAGTACCGATGCCGCCGGACCTGGATCTCAGCGAGTGGCAGTCTTCGTCGCGGTGGTCGTCAGACAGCTCCTCCTCTGAGGCGGAAGAGGACGCTCTGTTCGTCGCACCGCAACCAGAACAAAAACCCGCAACACCCGTCACTACACTACAGTCGTTGCGCGAGGCTCGTCTCCTGGAACAGGCCAACAACCCTCACTACTTGAAGGACGACGGCCGCTACCAGCAGGAGGACGAGGACCCGCCCGTCGCTGAGATCGCTTTAGACGTGCCGCTGCAAATAACCGTTAAGAGATCTGATAAGTACTTAATGTCGAAAGAAAACTCGAAGAAGACGAAGGAAAAGAAGAGGCCGTCTAAGAAACGGAAGAACAAAGTAGAGAGACATTCGTCCGAGTCGGAGAGTGACGACGCGTCAGTGTCCCGACCTACGGTGGCGGAGGGCGGCGAGTTACCGGAGGGTGCTGCGGCCTCCGACGACGAGCCTCCGCCCCGCGACGATCCCCACCGAGCGCTTGACCTTGACCTCGACATGCCATTACGCGAGGAAGAGTTGCTCAGCACACGAACGCGATCGTACCCGCTACCGGAGAGTGGCTTACTAAGTAAGAAAACAGAATCCAAGAAAAACAAATCTACGGAAAAGAAAACCTCCGAAAAATCTACTCACAAAAAGAAATCCAAGAGCTCTAAACGGAACAAAGAAGCCGACCTCATATTACCGGAAACGGAAAATAAGGTCGAGGACATACTGTTGATCGAAACTGAAAACGAATCTAAGAGTAATGAGATCGTTAAAAATGATATTCAGGATGACAAGCCAGAGAAAATTAAGACTGAAAAACATAAAAGGTCAAAGAAAGACACTAAGGAGAAAGATTCGAAGAAAAAGAAGACATCTAAGAAAGGAAAACATGAAACTAAATTAGGTTATGAAGAAGCAATAGGTATTTCAACACCAAGCAAAGAGGTTGTATAG

Protein sequence:

>DPOGS208072-PA
MALKKVKGNFERMFDKNLTDLVRGIRNNKDNEAKYIAQCMEEIKVELRQDNIGVKANAVAKLTYLQMLGYDISWAIFNIIEVMSSTKFTYKRIGYLAASQSFHADSELLMLTTNMIRKDLNAQNQYEAGLALSGLSCFISHDLARDLANDIMTLMSSTKPYLRMKAVLMMYKVFLRYPEALRPAFPKLKEKLEDPDPGVQSAAVNVVCELARKNPKNYLSLAPVFFKLMTTSTNNWMLIKIIKLFGALTPLEPRLGKKLIEPLTNLIHSTSAMSLLYECINTVIAVLISISSGMPGHAASVQLCVQKLRILIEDSDQNLKYLGLLAMSRILKSHPKSVQAHKDLVLACLDDKDESIRLRALGLLYGMVSKKNLIEIVKKLMVHMERAEGTLYRDELLTRMIEICSQNNYQHVVHFEWYITVLTELTEMETSAKHGCMIAGQLLEVGARVSETRAFAARECSSLVTRTAATQHAPRAASREVLYAAAYVLSEYCTEEPVMRSSLSPLLVCAGLHAGPSSAHMRARAVCVHAALKLTARLLLLYENRGERTAALSVIHETLAGMQPLLSSEDMEVQERAHNATALLRIVLRKINPTDPALGSDVIRNDVTDTLVEHEPEQSNGVDIIGDSDMNGGDDEGFSGGLIAELAGLFEGELKPVAPKAQKKVPMPPDLDLSEWQSSSRWSSDSSSSEAEEDALFVAPQPEQKPATPVTTLQSLREARLLEQANNPHYLKDDGRYQQEDEDPPVAEIALDVPLQITVKRSDKYLMSKENSKKTKEKKRPSKKRKNKVERHSSESESDDASVSRPTVAEGGELPEGAAASDDEPPPRDDPHRALDLDLDMPLREEELLSTRTRSYPLPESGLLSKKTESKKNKSTEKKTSEKSTHKKKSKSSKRNKEADLILPETENKVEDILLIETENESKSNEIVKNDIQDDKPEKIKTEKHKRSKKDTKEKDSKKKKTSKKGKHETKLGYEEAIGISTPSKEVV-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: