MonarchBase - Protein-coding gene

DPOGS210122
Transcript	DPOGS210122-TA	2316 bp
Protein	DPOGS210122-PA	771 aa
Genomic position	DPSCF300017 + 1497440-1505211
RNAseq coverage	390x (Rank: top 31%)

Annotation
*Heliconius*	HMEL010701	0.0	74.74%
*Bombyx*	BGIBMGA000230-TA	8e-108	63.21%
*Drosophila*	Plap-PA	9e-150	38.77%
EBI UniRef50	UniRef50_UPI00022C91B8	3e-163	40.68%	UPI00022C91B8 related cluster n=1 Tax=unknown RepID=UPI00022C91B8
NCBI RefSeq	XP_392743.2	1e-165	40.61%	PREDICTED: similar to phospholipase A2, activating protein [Apis mellifera]
NCBI nr blastp	gi\|350402175	1e-162	40.68%	PREDICTED: phospholipase A-2-activating protein-like [Bombus impatiens]
NCBI nr blastx	gi\|350402175	8e-163	40.68%	PREDICTED: phospholipase A-2-activating protein-like [Bombus impatiens]

Group
Gene Ontology	GO:0005515	1.2e-61	protein binding
KEGG pathway	ame:409219	3e-165
	K14018 (PLAA, DOA1, UFD3)	maps->	Protein processing in endoplasmic reticulum
InterPro domain	[4-296] IPR015943	1.2e-61	WD40/YVTN repeat-like-containing domain
	[4-296] IPR011046	1.7e-59	WD40 repeat-like-containing domain
	[512-758] IPR013535	3.1e-39	PUL
	[342-452] IPR015155	7.9e-37	PLAA family ubiquitin binding, PFU
	[220-258] IPR019781	1.7e-08	WD40 repeat, subgroup
	[219-258] IPR001680	9.2e-08	WD40 repeat
Orthology group	MCL11501		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS210122-TA
ATGGCTATTCCTGAATATAAACTAAGTTCTGTTTTGTGTGGCCATTCCATGGACGTTAGATGTGTAGCCACAACAAAAGAATCTTGTATACTTTCTGCTTCCCGAGATAGGACTGCTAGATTATGGCACCCGGAAGGGACTAAAGATTTCGTAAACGTAGTGACCTATAAAGGTCACGATAACTTCGTTTCTTGTGTTTGCTGGCTTCCACCTTGCGAAGCATTTCCTGAAGGACTGGTTGTTACTGGAAGCAATGATAATACTATACTAGGATATAATCTTCAGGATGGTGCAATTCAGATACATTTGAAAGGTCATAATAATGCAGTGTGTAGTGTTGCTCCAGGAAATGATTCAGGAATACTTTTGAGTGCAAGTTGGGACAACACATCCAGGATATGGAATATCAACTCCCCACAAATGTCACCAGTCGTACTCAAAGGTCACCAAGCTGCTGTGTGGTGTGTTATAGAATTGAGTAATGGAGTGTATGCCACTGCTTCGGCTGATAAAACTATCAAACTGTGGAGGAAAGATGGAGCTTTGATCAATACACTTTCTGGTCATACGGACTGTGTGAGAGGCTTGACAATAGCAAGTTCAGAAAGTTTCCTAAGTTGTTCCAATGACGCATCCATCAAGTTGTGGTCGAACAAAGGAGATTGCATCAACACATATTACGGACATTCTAATTATGTTTATGGTATAAGCAGCAATCCTGAAAGCGGTATGTTTGCTAGTTGTGGAGAAGATGGCGCATTGCGTCTTTGGAGCGGTACTGAGAGTATTGCACTAAGGCTGCCCGCACACTCTGTCTGGAGTATAGCCTGCCTTAATAACGGAGATGTTGTCACTGGTTCTAGTGATGGCATCATCAGAGTGTTTACAAAGGATCCAGTGAGATTCGCTGACGAGACAACACTGAAAAACTATGAGGAAGATTGTAAGAAAATGATTGAAGCGTCACAACAAGAAATAGGAGGTTTTAAACTCTCAGAACTTCCCGGACCGGAAGTTTTACTGGAGCCTGGCCGCACGGATGGTCAGACGAAGTTGGTGCGGAGAGGGGCCTCAGTGAAATGTTACGCGTGGCGCGCCGCGGGGGGAACGTGGGAGGAGCTTGGTGACGTCATGGGATCCACGCCCCCCACCCAAGGGAAAACCATGTACCAAGGACAGGAGTATGACTTCGTGTTCAGCGTTGACATCAAGGACGGTGCTCCGCCCATCAAGCTGCCATTCAACAAGACGGAGGACCCGTGGGTCGCGGCACAGGCGTTCATACACAAACACGAGCTGCCACAAGTATATTTAGAACAAGTCGCTAACTTTATAATAACGAATGCTAAGTTAGACTCCGTCCCAGCTTCTAGTAACGGGTACGCGGATCCGTTTACAGGAGAGTCTCGTTACGTGCCGAGTTCAGCTTCCCCGGCGGGCCCTACCGGGGGGCTCCCTACTGTTTCCTCGGGGCCCCTCAAAGACCCCTTCACTGGCGAAGGCGCCTACACAACCTCCAGCAATGAGAAACCCCTCATACCTCACGATGCATACATCAGGTTTGATGCGGCAAATCTTAAAGCTATACATGACAAACTAAAAGAGTTCAACAGTAAAGTGGGAGACGGTTTGAACGCGTTCACAGACGAACAGATTGAAAATATTGTGAAGTTAGGAGAAATGGACTGCACTTTCAATCCGGAAACCGTAACCCTGCTTAAGAAAATGCTAGAATGGCCCAAAGAAATTCTGTTCCCTGTACTCGACGTCACTAGATTGGCCGTAAGAAACAAAGATATCAACACTCAAATATTTGACACAACATATGGGCCAAACTTCGTTAAATATCTGCTGACATTGTTAAGTCCAGATAATCTGTCACCCAACCAGTTACTCTCTATACGTGTGTTAGTGAATGCGTTCAGTGCTCTGTCCGGCGAGATGCTAGTACTGTCAGCTCGTGAAAGACTTCTGGAAACTATGAACATGCTCACAAACATCAGTAACAACGCCCAGATAGCCGCTATGTCATTACTCCTTAACTTGTCGGTAGCTCTTTGTCAGCAGCCAGATAATATAGACCTAGCAGATTCTGTTGTTAATTTACTCAACAAAATAACAGATAATGAGGCTTACTTCAGAGGTCTTGTTGCATTAGGCACTTTATTAGCGGAATCTCCAAACAAACTTATCATACAGACGAAGATTGTAACCAGCAATAATCTACATAACAGGTTGAAAAGAGACAGTTCCACAGAGATTCCCAACTTCAAGAAAATATCAATTTGTTCCCAACAAATATTAAGACTGTTATGA

Protein sequence:

>DPOGS210122-PA
MAIPEYKLSSVLCGHSMDVRCVATTKESCILSASRDRTARLWHPEGTKDFVNVVTYKGHDNFVSCVCWLPPCEAFPEGLVVTGSNDNTILGYNLQDGAIQIHLKGHNNAVCSVAPGNDSGILLSASWDNTSRIWNINSPQMSPVVLKGHQAAVWCVIELSNGVYATASADKTIKLWRKDGALINTLSGHTDCVRGLTIASSESFLSCSNDASIKLWSNKGDCINTYYGHSNYVYGISSNPESGMFASCGEDGALRLWSGTESIALRLPAHSVWSIACLNNGDVVTGSSDGIIRVFTKDPVRFADETTLKNYEEDCKKMIEASQQEIGGFKLSELPGPEVLLEPGRTDGQTKLVRRGASVKCYAWRAAGGTWEELGDVMGSTPPTQGKTMYQGQEYDFVFSVDIKDGAPPIKLPFNKTEDPWVAAQAFIHKHELPQVYLEQVANFIITNAKLDSVPASSNGYADPFTGESRYVPSSASPAGPTGGLPTVSSGPLKDPFTGEGAYTTSSNEKPLIPHDAYIRFDAANLKAIHDKLKEFNSKVGDGLNAFTDEQIENIVKLGEMDCTFNPETVTLLKKMLEWPKEILFPVLDVTRLAVRNKDINTQIFDTTYGPNFVKYLLTLLSPDNLSPNQLLSIRVLVNAFSALSGEMLVLSARERLLETMNMLTNISNNAQIAAMSLLLNLSVALCQQPDNIDLADSVVNLLNKITDNEAYFRGLVALGTLLAESPNKLIIQTKIVTSNNLHNRLKRDSSTEIPNFKKISICSQQILRLL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: