MonarchBase - Protein-coding gene

DPOGS203035
Transcript	DPOGS203035-TA	981 bp
Protein	DPOGS203035-PA	326 aa
Genomic position	DPSCF300068 + 686818-688769
RNAseq coverage	25x (Rank: top 77%)

Annotation
*Heliconius*	HMEL014079	5e-110	61.64%
*Bombyx*	BGIBMGA002976-TA	3e-101	57.19%
*Drosophila*	Wwox-PA	2e-52	38.00%
EBI UniRef50	UniRef50_Q9NZC7	7e-46	37.37%	WW domain-containing oxidoreductase n=82 Tax=Coelomata RepID=WWOX_HUMAN
NCBI RefSeq	XP_001962175.1	2e-53	39.00%	GF15334 [Drosophila ananassae]
NCBI nr blastp	gi\|307188223	2e-55	39.81%	WW domain-containing oxidoreductase [Camponotus floridanus]
NCBI nr blastx	gi\|332018946	6e-55	41.31%	WW domain-containing oxidoreductase [Acromyrmex echinatior]

Group
Gene Ontology	GO:0005488	1.1e-40	binding
	GO:0008152	2.2e-15	metabolic process
	GO:0016491	2.2e-15	oxidoreductase activity
KEGG pathway	dre:393887	7e-40
	K00100 (E1.1.1.-)	maps->	Linoleic acid metabolism
			Bisphenol A degradation
			Fructose and mannose metabolism
			Butanoate metabolism
			Tetrachloroethene degradation
InterPro domain	[27-282] IPR016040	1.1e-40	NAD(P)-binding domain
	[31-164] IPR002198	2.2e-15	Short-chain dehydrogenase/reductase SDR
	[32-49] IPR002347	3.1e-06	Glucose/ribitol dehydrogenase
Orthology group	MCL10674		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS203035-TA
ATGCTAAAAGCACTCCAGAAGAGCTTCGAATTCAAAAGTATATTTGGACAAACTGCCGAAGAGGTCGTGAATAACGTAGATTTGTCAAATAAAACATGCCTCATTACGGGGGCCAGCAGCGGCATCGGTCTAGAGATTGCTCGATGTCTTAATAGTCGCGACTGTAACTTACTAATGGCTTCTCGAAATGTTTACAAAGCGAATCTTCTTGCCAACAAAACCTGTCTAAACAACCAGAGAATTCGGCACTACCAAATAAATCTTGCTTCCTTGGCTTCTGTGAGACAATGTGCCCAAGAAATCATTGAAAATGAAAGACAAATAGATATAGTGATTCTTAATGCCGCCACCTTTGGTATACCATGGACTGTTACTAAAGATGGCCTGGAAACAACCTTCCAAGTTAATTTCCTAAGTCAATACTATTTGTTGCTGTGCCTGGGTAAGATGCTGGCTCCTGACGCCAGGGTGGTATTTACCTCCTCCGAATCTCATAGAAACATAAAATGGCCAGAAAAAAATAGATTCAATCCGGTGTTCGAGAACCTTTCACTCCTCAAACACGAATACACGTCCATCAAGTCGTATAATATATCGAAGCTGTGTTGTTTATTACTCATGCACTATTTGAGCTACCAGTGGTCTAATAGTGAGAGGAGCTTCTTGTGTGCACACCCGGGTTCTTTCATCAAAACTGGTCTCTGTCGCAACTGGTGGCCTTACGAGGCACTGTACACAATTATGTTACCATTCTCAAAGTCTATTATGCAAGGTGCTAGTACCATACTTTATTGCGCAACTTCGCCAAATTTAAAAGGTGCTACAGGTATGTACTTCAGCAACTGTAACCACTGTAATGAAAGTGACCTCGCCAAGGATATATACTTCTCATTTAGGATTCACGACTTGATTCTCGACATACTGCGAGACCGTGTACAAGATTTAGATAAATTGACTAAGGAACTGCGAGTGAATAAATAA

Protein sequence:

>DPOGS203035-PA
MLKALQKSFEFKSIFGQTAEEVVNNVDLSNKTCLITGASSGIGLEIARCLNSRDCNLLMASRNVYKANLLANKTCLNNQRIRHYQINLASLASVRQCAQEIIENERQIDIVILNAATFGIPWTVTKDGLETTFQVNFLSQYYLLLCLGKMLAPDARVVFTSSESHRNIKWPEKNRFNPVFENLSLLKHEYTSIKSYNISKLCCLLLMHYLSYQWSNSERSFLCAHPGSFIKTGLCRNWWPYEALYTIMLPFSKSIMQGASTILYCATSPNLKGATGMYFSNCNHCNESDLAKDIYFSFRIHDLILDILRDRVQDLDKLTKELRVNK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: