MonarchBase - Protein-coding gene

DPOGS203541
Transcript	DPOGS203541-TA	999 bp
Protein	DPOGS203541-PA	332 aa
Genomic position	DPSCF300055 + 268906-269904
RNAseq coverage	777x (Rank: top 17%)

Annotation
*Heliconius*	HMEL013203	1e-91	62.02%
*Bombyx*	BGIBMGA004341-TA	2e-72	49.47%
*Drosophila*	CG7675-PB	5e-56	38.59%
EBI UniRef50	UniRef50_G6D279	4e-56	45.65%	Putative RDH13 n=2 Tax=Eumetazoa RepID=G6D279_DANPL
NCBI RefSeq	XP_002115352.1	1e-64	43.00%	hypothetical protein TRIADDRAFT_28989 [Trichoplax adhaerens]
NCBI nr blastp	gi\|196010976	2e-63	43.00%	hypothetical protein TRIADDRAFT_28989 [Trichoplax adhaerens]
NCBI nr blastx	gi\|195997053	8e-63	44.79%	hypothetical protein TRIADDRAFT_18543 [Trichoplax adhaerens]

Group
Gene Ontology	GO:0005488	1.4e-69	binding
	GO:0008152	4.7e-25	metabolic process
	GO:0016491	4.7e-25	oxidoreductase activity
KEGG pathway	dre:436597	1e-52
	K11153 (RDH12)	maps->	Retinol metabolism
InterPro domain	[46-326] IPR016040	1.4e-69	NAD(P)-binding domain
	[54-191] IPR002198	4.7e-25	Short-chain dehydrogenase/reductase SDR
	[55-72] IPR002347	3.4e-15	Glucose/ribitol dehydrogenase
Orthology group	MCL25010		Lepidoptera specific

Nucleotide sequence:

>DPOGS203541-TA
ATGTTGTACTACATTGCATATATTTTGCTCACGATATTACTTTTAGCGGTCAAAGTCGTGGTTGGTTTCTTCTTATTTGTATTTTTGTGTTTTGCCATCGCAAGGCTGTGGTTTGAACCAATAAAGGGTGTGTGTAGAGCCAAAACCAAGCTTCATGGAAAAGTGGCACTGATCACCGGCGGGAATTCGGGAATAGGGCTGGAAACGGCGAAGGATTTGGCGCAGAGAGGCGCTAGGGTCGTCATAGCCAGCAGAAATGATAAAAAATCAGCGGAAGCCGTCGAAGAAATCAAACGGATCACTGGAAACGAGAAAGTGGAATATAGACATTTAAATCTTAGAGACATGGACAGCGTCAGGGAGTTCGCAAAGAAATTCAACGAAGAGTTCGACCGTTTAGACCTTCTGGTAAACAACGCTGGCATCGGAGCAGCGAAGAACGCGCTGACAGCTGACAATATAGACATCCTGATGGCCATCAACTACGTGGGTCCGTTCCTCCTCACGCACTTACTACTAGATAAAATTAAAGCCACTAAAACAAGTAGAATCGTCATAGTGTCGTCATACCTCCACTTCCACGCCAACTTTGAGCTGGACGACCTCACGAGGGTTACAACAAAAAATACATTGATCAAGTACTGTAATGCAAAACTCTGCGATGTTCTGTGGACGAAGGAGCTCTCCAGAAGATTGCCAGCAGGTGTAACGGTGAACGTACTCCATCCAGGTCTAGTGAAGACCAACATTTTTGATACCTTACACAAATGTTTAAAGAATCCGCTGTATGTTATTATCGATCTGCTTTTCAAAACGGCGAAAGAAGGTGCACAGACTGTTATATACCTGTGTGTAGATCCAGCAGTCGAGAACATGACAGGAGGCTACTACATGGACTGTAAGAAAATACCCTCGTCGAAACTATCGGAAGATGAAGACCTCGCGAAAGCATTGTGGGACAAAACATTAGAGTTGGTTTGCGTCAAACCCGTCATATAA

Protein sequence:

>DPOGS203541-PA
MLYYIAYILLTILLLAVKVVVGFFLFVFLCFAIARLWFEPIKGVCRAKTKLHGKVALITGGNSGIGLETAKDLAQRGARVVIASRNDKKSAEAVEEIKRITGNEKVEYRHLNLRDMDSVREFAKKFNEEFDRLDLLVNNAGIGAAKNALTADNIDILMAINYVGPFLLTHLLLDKIKATKTSRIVIVSSYLHFHANFELDDLTRVTTKNTLIKYCNAKLCDVLWTKELSRRLPAGVTVNVLHPGLVKTNIFDTLHKCLKNPLYVIIDLLFKTAKEGAQTVIYLCVDPAVENMTGGYYMDCKKIPSSKLSEDEDLAKALWDKTLELVCVKPVI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: