MonarchBase - Protein-coding gene

DPOGS213506
Transcript	DPOGS213506-TA	1002 bp
Protein	DPOGS213506-PA	333 aa
Genomic position	DPSCF300033 - 1082141-1083491
RNAseq coverage	151x (Rank: top 53%)

Annotation
*Heliconius*	HMEL003555	5e-44	78.57%
*Bombyx*	BGIBMGA011786-TA	1e-128	74.14%
*Drosophila*	CG4623-PA	1e-56	37.67%
EBI UniRef50	UniRef50_E7E275	1e-142	73.19%	Ganglioside-induced differentiation-associated-protein n=1 Tax=Bombyx mori RepID=E7E275_BOMMO
NCBI RefSeq	NP_001186866.1	2e-143	73.19%	ganglioside-induced differentiation-associated-protein [Bombyx mori]
NCBI nr blastp	gi\|315633209	4e-142	73.19%	ganglioside-induced differentiation-associated-protein [Bombyx mori]
NCBI nr blastx	gi\|315633209	1e-140	73.19%	ganglioside-induced differentiation-associated-protein [Bombyx mori]

Group
Gene Ontology	GO:0005515	2.6e-09	protein binding
KEGG pathway	ecb:100052190	2e-07
	K01800 (E5.2.1.2, maiA)	maps->	Styrene degradation
			Tyrosine metabolism
InterPro domain	[29-108] IPR012336	6.3e-20	Thioredoxin-like fold
	[179-294] IPR010987	3.1e-14	Glutathione S-transferase, C-terminal-like
	[36-101] IPR004045	2.6e-09	Glutathione S-transferase, N-terminal
	[207-284] IPR004046	2.3e-07	Glutathione S-transferase, C-terminal
Orthology group	MCL16248		Patchy

Nucleotide sequence:

>DPOGS213506-TA
ATGCATTATGTACAAAAATATTTGGATAAATTGCAGGCACCAAAGTTAAATAACACATCTTTAAGTAATGGATACAAAACAAATATATTTTTATATTGCAATTATTACAGCTTTTACTCTCAAAAGGTTTTGATGGCACTATACGAAAAAAATATAGACTTCGAACCAATAGTTATAGATATAACTAAAGGTGAACAGTATTCTCAATGGTTTCTGGAACTTAATCCTCGGGGAGAAATCCCAGTTCTTAAAGTAAACAAATCCATTATTCCGGATTCCACCAGAATTTTAGATTATTTGGAGATGTACCTGGATCAAGAGAACCCACCATTACTGGAGGTTTCTCAAGATCCGAAAGTAATGATGAACATTGTTAAGTTTCGGGAACTAATTGAAGCCCTGCCTGCTGGTGTAATTACTGTGGGATCATTCTTCCATCCACATCTTTCTGGACGGCCCAAATTACCATTCATTTTGCCAGTTAGAGAAGTGCTCAAAAGTGGTGATTTAAGTAATTCTAAAAATCTAAGAAGGTTAGCTGAAGAAAATCCAAAGGCCAAGAGTGTTCTTCTATACAAAGCAGAGATACAGGATCGAAAACAAGAAATACTTACTAATGAAGAAGAATATCTTAAAATCATTAATATAGTTGATGATGTACTGTCACAAGTTGAAGAGCAGTTGAAAAAACAAAATGATGATAGTTGGCTTTGCTGTGATAAATTTAGTATTGCTGATATTAATTTGGCTGTGCTTTTACAACGTTTGTGGGAGTTGGGGCTGGATGAGCGCTTTTGGGCATTCGGCAAACGCCCCTACATTGAGAATTACTTCGTCCGTGTCAAACAAAGAGATTCTTTCCAAAAGACCATTCCTGGCCTACCGGTCCATGTTAAAATGATTTTAACATCACAACCGCCTATATATGTTGCTTCGGCGGGAATTGTGTCCATTTCTCTTGTGATAACATTGGCATATCTTTTCAAAAAATTAATATGGTAA

Protein sequence:

>DPOGS213506-PA
MHYVQKYLDKLQAPKLNNTSLSNGYKTNIFLYCNYYSFYSQKVLMALYEKNIDFEPIVIDITKGEQYSQWFLELNPRGEIPVLKVNKSIIPDSTRILDYLEMYLDQENPPLLEVSQDPKVMMNIVKFRELIEALPAGVITVGSFFHPHLSGRPKLPFILPVREVLKSGDLSNSKNLRRLAEENPKAKSVLLYKAEIQDRKQEILTNEEEYLKIINIVDDVLSQVEEQLKKQNDDSWLCCDKFSIADINLAVLLQRLWELGLDERFWAFGKRPYIENYFVRVKQRDSFQKTIPGLPVHVKMILTSQPPIYVASAGIVSISLVITLAYLFKKLIW-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: