MonarchBase - Protein-coding gene

DPOGS210896
Transcript	DPOGS210896-TA	2913 bp
Protein	DPOGS210896-PA	970 aa
Genomic position	DPSCF300045 - 739773-745736
RNAseq coverage	113x (Rank: top 59%)

Annotation
*Heliconius*	HMEL013300	0.0	68.10%
*Bombyx*	BGIBMGA003775-TA	0.0	64.35%
*Drosophila*	pex1-PA	1e-91	27.48%
EBI UniRef50	UniRef50_D6WNC9	1e-106	29.60%	Putative uncharacterized protein n=3 Tax=Endopterygota RepID=D6WNC9_TRICA
NCBI RefSeq	XP_397107.3	2e-98	29.12%	PREDICTED: similar to lethal (3) 70Da CG6760-PA [Apis mellifera]
NCBI nr blastp	gi\|328787017	2e-101	28.82%	PREDICTED: peroxisome biogenesis factor 1-like [Apis mellifera]
NCBI nr blastx	gi\|350416782	3e-102	28.88%	PREDICTED: peroxisome biogenesis protein 1-like [Bombus impatiens]

Group
Gene Ontology	GO:0005524	5.3e-34	ATP binding
	GO:0000166	1.4e-11	nucleotide binding
	GO:0017111	1.4e-11	nucleoside-triphosphatase activity
	GO:0007031	9.4e-08	peroxisome organization
	GO:0005777	9.4e-08	peroxisome
KEGG pathway	ame:413666	6e-98
	K13338 (PEX1)	maps->	Peroxisome
InterPro domain	[716-844] IPR003959	5.3e-34	ATPase, AAA-type, core
	[712-848] IPR003593	1.4e-11	ATPase, AAA+ type, core
	[90-145] IPR015342	9.4e-08	Peroxisome biogenesis factor 1, N-terminal
Orthology group	MCL12438		Single-copy universal gene

Nucleotide sequence:

>DPOGS210896-TA
ATGTTGGGGGGAAACAAATTAAAAGTATCATTTACACATGAAAGATCTTGTTTCGGATATATTAGTACTAAACATAGTACGAACAATGAACAGTCACAATGTGTGCAAGTATTGTATAGAGAGAAACAAATATTTCTCTGGGCAGTATTCAACAGTAATATTCCAGAGGGTAACATAGCGTGTAATCCTGTCTTCAGTAAAGTTGTTGGGTTAGACGAGGGTGTGGAGGTGTTTGTGGCTCCGTATGGAGACGTTAAGGTTCTAGACCAGTTGTACATTGACACCGATAGCCCCGATGACCAGGAAATACTCGAACACAATGTGGAGGTTTTGCAATTAAGGATTTTAGACCAATTAAGGCTTGTGGCTGCTGATCAGAAGGCTGTTGTGTGGATATCTACATCTATGCCTATCGTTTTCACTCCAAAGACGACCGGTCTACTGGTCAATCATAGCAGAATCATTGTCAAAATAGATGCTTTCAACAGTCTCGGTAGTGACTTTAGTAATCAGGGGGCGGCAACAAAGGGATCACACCAAAAATATAATAACATAGGTATTATCAACGATGGTCTTCTCAGTCCATACTTAAATCCACAAAACAGATTAATATTAAGAGCTCTGCCTATAGAGGGCGACGGGAAGAAAAATTTAATACATCCCTATACTGTGTTCATACATGAAGACTTGATTGATGAAAGTTATAAAGATTTAATGGTGATCCTGGCCACTATGAACCACATTCCATCGGTGTTGCAAGAAGATGAGGTTGAATCCCATAAAATAGACGGCATTTGTGTGGAAATAGTCACCATAGACAATACGGTCTTCAGAAGTCTCTGTAGAGAGGTTTACAATGAAAATATACCGACTGTACTCATACCGAAGTCACTGAACGTTATAATAAATGTTGAGATGGGTGTGAAGCTAATTTTTAACATAATCGGTGATAAAGTAGAGCTTCCCGATCACGTGGACATCATAACGTACTCGGAGAAAACTCAAACGGAGATTGATGTTATAGAAAAGTTTAAGAAGTGTGTCGTCGAAAACACACACTCCGGTAAAATGTTCCTCATAAATGACGGCATGGTGAAGCAGAACACACACATCAGTCACGGGTTTCTGAGGTTCAAGTTGCAACCTGAAAGGTTAAAATACACTATGCTGAACTCAGAGTCGTTTAGGAACTGCAGTGTGGCCGCCAAATGCTTGACTGATGCAGACTTCGACTGTCCCAAGAAAGTAACACATCAACTAGAATATGACTTTAAGAATTATTGTCGCAGTATAAAGTCAAGTCAGGAGCTGGTTGATGATATCCTGTCACACATACATTTTGAGATACAAAGGGAGGCGAGTTTCAAAGGGGTATCGGAGATCAAGAGCAATGTCCTTATAACCGGTTCAAGCGGCGCGGGAAAGTCTGCTATATGTCATATAGTACAAAAAGAATTAACTCTCTGGTCCCACATACTACACTGCCGGGCGCTCAAAGGCCGGAAGGACGTCACTGAAGTCATAGGGAAAGCTATACTGATGTGTCAGGAACATAGTCCATCAGTGCTGATATGTGACGACCTCGATGCTTTAATACCGCCGAACACAGAGGGCGCCTCCCCACAAGACATCGCATACTATCAGAGATTGGCGTCGTGTATTAAACAGATGTTACAGTCTTGTTCGTCTGTGTGCGTGTTGATGACGTCACTCAGTCTGAGGTCGTTGCACCCGGTCCTGAGACAGTTCAGCGGGCGACCCCTGTTCACGGCACACTTTGACATACCGCAGATGAATCAGGATGATAGAATAGAAGTTTTCAAACACTTACTGAATGATAAAATCCGCGAGTCGGTGCTGGTGGAGGAGCAGGACGTGGCGACCCTGGCCACCGACACGGCCGGCTGTAACGTCCGGGAGATACTGGAGTACTTCAATAAGAGAATATTCAAGGCCGTCAAGAATAAGTCCAAGCCGTCAGACAGGCCGCGTCTAATAGCCGACATATCCAAGGAGCTGGAGAAGGCGAACACCTTCGATATATGGGGTTCTGTGGGGGGGATGCACGACGTGAAGAGACAGATCACTGAGGCCATATTCTGGCCAATCATGTACCCGAGTCTGTTCCCATCATCTTCATGTGGCATCTTGCTGTATGGGCCTCCGGGGTCGGGGAAGTCGCTGATAGGATCCTGCTTGTCCTCGTTGACCAACATGAGGGTCCTCACAGTCAAGGGACCGGAATTACTGTCTAAATACATCGGGCAAAGCGAGAAGGCTGTCCGGGATATATTCGATAAAGCGGACATGCAGCGTCCCTGTATCCTGTTCTTCGACGAGTTCGACAGTCTGGCGCCCAAACGCGGCCACGACTCCACGGGTGTGACGGACCGCGTGGTGAACCAGCTGCTGTCTCGGCTGGACGGGGCGGAGGGCGGCGCGCGCGGGCCCGTGCTGGCGGCCACCTCGCGCCCGGACCTGGTGGACCCGGCGCTGCTGCGGCCCGGCCGGCTCATGCTGCACCTGTACTGTGGCCTGCCCGACCAGGCCGACCGTGTGGAGGTGCTCCGGTGCCTGTCGAGGAGCGTGTGCCTGTCCCGGGAGGTGGATCTGTCGTGGCTGTCGTGTCGTACTGAAGGCTACTCCGCCGCCGACCTCAAGTCCCTGCTAGTGACGGCGCAGCTCACCAGGCTCGAGAAGCAATTGGCCGCGAGCGACGACAAAACCTTGGAGTCGGTGGTAGTGTTGAAGGAGGACGTAGAGGACGCGCTCCGGGAGACTTCGCCCTCGCTGTCACCAGAACAGAGGCTGTTCTATGACACTATCTACCGTCGTTTCCGCGGGGAGCCGCTCTCCCCGCAACAGACGCGCCTGCAGCATCGCCTCGACCGCCAGAGAGTCACACTCGCCTGA

Protein sequence:

>DPOGS210896-PA
MLGGNKLKVSFTHERSCFGYISTKHSTNNEQSQCVQVLYREKQIFLWAVFNSNIPEGNIACNPVFSKVVGLDEGVEVFVAPYGDVKVLDQLYIDTDSPDDQEILEHNVEVLQLRILDQLRLVAADQKAVVWISTSMPIVFTPKTTGLLVNHSRIIVKIDAFNSLGSDFSNQGAATKGSHQKYNNIGIINDGLLSPYLNPQNRLILRALPIEGDGKKNLIHPYTVFIHEDLIDESYKDLMVILATMNHIPSVLQEDEVESHKIDGICVEIVTIDNTVFRSLCREVYNENIPTVLIPKSLNVIINVEMGVKLIFNIIGDKVELPDHVDIITYSEKTQTEIDVIEKFKKCVVENTHSGKMFLINDGMVKQNTHISHGFLRFKLQPERLKYTMLNSESFRNCSVAAKCLTDADFDCPKKVTHQLEYDFKNYCRSIKSSQELVDDILSHIHFEIQREASFKGVSEIKSNVLITGSSGAGKSAICHIVQKELTLWSHILHCRALKGRKDVTEVIGKAILMCQEHSPSVLICDDLDALIPPNTEGASPQDIAYYQRLASCIKQMLQSCSSVCVLMTSLSLRSLHPVLRQFSGRPLFTAHFDIPQMNQDDRIEVFKHLLNDKIRESVLVEEQDVATLATDTAGCNVREILEYFNKRIFKAVKNKSKPSDRPRLIADISKELEKANTFDIWGSVGGMHDVKRQITEAIFWPIMYPSLFPSSSCGILLYGPPGSGKSLIGSCLSSLTNMRVLTVKGPELLSKYIGQSEKAVRDIFDKADMQRPCILFFDEFDSLAPKRGHDSTGVTDRVVNQLLSRLDGAEGGARGPVLAATSRPDLVDPALLRPGRLMLHLYCGLPDQADRVEVLRCLSRSVCLSREVDLSWLSCRTEGYSAADLKSLLVTAQLTRLEKQLAASDDKTLESVVVLKEDVEDALRETSPSLSPEQRLFYDTIYRRFRGEPLSPQQTRLQHRLDRQRVTLA-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: