MonarchBase - Protein-coding gene

DPOGS213564
Transcript	DPOGS213564-TA	1488 bp
Protein	DPOGS213564-PA	495 aa
Genomic position	DPSCF300033 - 34186-40012
RNAseq coverage	5080x (Rank: top 2%)

Annotation
*Heliconius*	HMEL010864	0.0	82.83%
*Bombyx*	BGIBMGA011844-TA	0.0	78.18%
*Drosophila*	Pdi-PA	2e-155	55.84%
EBI UniRef50	UniRef50_P54399	4e-153	55.84%	Protein disulfide-isomerase n=65 Tax=Eukaryota RepID=PDI_DROME
NCBI RefSeq	NP_001037171.1	0.0	78.18%	protein disulfide isomerase [Bombyx mori]
NCBI nr blastp	gi\|358443112	0.0	84.02%	control protein HCTL033 [Heliconius erato]
NCBI nr blastx	gi\|358443112	0.0	84.02%	control protein HCTL033 [Heliconius erato]

Group
Gene Ontology	GO:0005783	2.3e-150	endoplasmic reticulum
	GO:0016853	2.3e-150	isomerase activity
	GO:0045454	3.9e-32	cell redox homeostasis
	GO:0015035	4e-08	protein disulfide oxidoreductase activity
	GO:0009055	4e-08	electron carrier activity
	GO:0006662	4e-08	glycerol ether metabolic process
KEGG pathway	cqu:CpipJ_CPIJ005219	5e-162
	K09580 (PDIA1, P4HB)	maps->	Protein processing in endoplasmic reticulum
InterPro domain	[26-495] IPR005792	2.3e-150	Protein disulphide isomerase
	[24-134] IPR012336	1.6e-42	Thioredoxin-like fold
	[34-130] IPR005788	1.1e-37	Disulphide isomerase
	[27-129] IPR013766	3.9e-32	Thioredoxin domain
	[45-53] IPR005746	4e-08	Thioredoxin
Orthology group	MCL12361		Single-copy universal gene

Nucleotide sequence:

>DPOGS213564-TA
ATGCGTGCCGTTTTATTAACAGTAGCGATAGCCCTTCTGGGTTCCGCTTATGGAGACGAAATACCCACTGAAGACAATGTACTTGTTCTAAGCAAACCTCTTTTTGATTCTGTTATTTCAAGCAACGACTACGTTTTAGTGGAATTCTATGCGCCATGGTGCGGCCACTGCAAGTCTCTCGCGCCGGAATACGCAAAAGCCGCCACAAAACTTGCCGAAGAAGATTCTCCTATAAAGTTGGCTAAAGTAGATGCTACTCAAGAACAAGATTTGGCTGAGTACTACAAAGTTAAGGGATACCCAACCCTTATTTTCTTCAAGAAAGGCAGCAGTATTGACTACACAGGCGGACGACAGGCTGATGACATCATTGCATGGCTAAAGAAGAAGACTGGTCCTCCGGCAGTCGAAGTTGCCTCGGCAGAACAAGCTAAAGAACTCACTGTTGCCAACCTCGTTGTTGTATTTGGTTTCTTCCCAGACCAATCATCTGAACGGGCATTAGCTTTCCTTAACACCGCTGGAGTTGTCGACGACCAGATCTTTGCTATTGTATCTGATGAGAAAGTTATCGAAGAGATGGAAGCTAAAGCTGGCGACATTGTTTTATACAAGAAATTCGAAGATCCCCAAGTCAAGTATGATGCTGAAGAGTTGAATGAAGACCTCCTCAAGAACTGGGTGTTCATGCAGAGCATGCCCACAATCGTCGAATTCTCTCATGAAACAGCGTCCAAGATCTTCGGTGGTCAGATCAAATACCACCTCCTTCTATTCCTGTCCAAGAAAGACGGTCACTTCGAGAAATACATCGATGAGTTGAAACCTGTTGCCAAGAACTACCGGGACAAGATCATGACCGTCTCCATCGACACAGACGAAGATGACCATCAGAGAATCCTGGAGTTCTTTGGTATGAAGAAGGATGAGGTCCCATCCGTACGTCTCATAGCCCTGGAACAAGACATGGCCAAGTACAAGCCAGCGGCCGATGAACTTAATGCCAACACTGTTGAGGAATTCGTTCAGTCTTTCTTCGCCGGCACTCTGAAGCAGCATTTGTTGAGCGAGTCTCTCCCCGCGGACTGGGCCGACAAACCCGTGAAAGTGCTAGTCGCTTCCAACTTCGATGAAGTCGTCTTTGATAATGAAAAGACTGTGCTCGTGGAGTTCTACGCGCCGTGGTGCGGCCACTGCAAGCAACTGGTGCCTATCTACGACAAACTCGGTGAGCACTTCGAGAAGGACAGCGACATCGTGATCGCCAAAATTGACGCCACCGCCAACGAGCTGGAACACACCAAGATCACCTCCTTCCCGACCATCAAGCTCTACACCAAGGACAATCAGGTTCGTGAGTACAACGGTGAGCGTACTCTGAGCGCGCTCACAAAGTTCGTGGAAACCGGCGGGGAGGGCGCCGAGCCCGTGCCGGTGGACGAGGAGTCCGACAGCGACGACCACGAACAACCCCGAGACGAGCTATAA

Protein sequence:

>DPOGS213564-PA
MRAVLLTVAIALLGSAYGDEIPTEDNVLVLSKPLFDSVISSNDYVLVEFYAPWCGHCKSLAPEYAKAATKLAEEDSPIKLAKVDATQEQDLAEYYKVKGYPTLIFFKKGSSIDYTGGRQADDIIAWLKKKTGPPAVEVASAEQAKELTVANLVVVFGFFPDQSSERALAFLNTAGVVDDQIFAIVSDEKVIEEMEAKAGDIVLYKKFEDPQVKYDAEELNEDLLKNWVFMQSMPTIVEFSHETASKIFGGQIKYHLLLFLSKKDGHFEKYIDELKPVAKNYRDKIMTVSIDTDEDDHQRILEFFGMKKDEVPSVRLIALEQDMAKYKPAADELNANTVEEFVQSFFAGTLKQHLLSESLPADWADKPVKVLVASNFDEVVFDNEKTVLVEFYAPWCGHCKQLVPIYDKLGEHFEKDSDIVIAKIDATANELEHTKITSFPTIKLYTKDNQVREYNGERTLSALTKFVETGGEGAEPVPVDEESDSDDHEQPRDEL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: