MonarchBase - Protein-coding gene

DPOGS215135
Transcript	DPOGS215135-TA	1299 bp
Protein	DPOGS215135-PA	432 aa
Genomic position	DPSCF300427 - 9670-13876
RNAseq coverage	25x (Rank: top 77%)

Annotation
*Heliconius*	HMEL022552	5e-159	68.09%
*Bombyx*	BGIBMGA001678-TA	9e-141	65.23%
*Drosophila*	nvd-PA	3e-75	38.23%
EBI UniRef50	UniRef50_Q1JUZ2	6e-158	62.84%	Rieske-domain protein Neverland n=3 Tax=Obtectomera RepID=Q1JUZ2_BOMMO
NCBI RefSeq	NP_001037626.1	1e-158	62.84%	neverland [Bombyx mori]
NCBI nr blastp	gi\|301072746	3e-158	61.84%	Rieske-domain protein neverland [Spodoptera littoralis]
NCBI nr blastx	gi\|301072746	5e-159	61.84%	Rieske-domain protein neverland [Spodoptera littoralis]

Group
Gene Ontology	GO:0051537	1.4e-29	2 iron, 2 sulfur cluster binding
	GO:0055114	1.4e-29	oxidation-reduction process
	GO:0016491	1.4e-29	oxidoreductase activity
KEGG pathway	rha:RHA1_ro02490	2e-26
	K00517 (E1.14.-.-)	maps->	Naphthalene and anthracene degradation
			Stilbenoid, diarylheptanoid and gingerol biosynthesis
			Limonene and pinene degradation
			gamma-Hexachlorocyclohexane degradation
InterPro domain	[77-215] IPR017941	1.4e-29	Rieske [2Fe-2S] iron-sulphur domain
Orthology group	MCL16272		Insect specific

Genotypes for resequenced monarchs and outgroup Danaus species

Nucleotide sequence:

>DPOGS215135-TA
ATGGCGGCCCATGACGCATTGACGTTTGACGCGAACCCGTGTCACGACCCGTTTTACGTTTTGAACGTTCTGTTTCACGCAGTTGCAGATTACGGCTTCAGATATTTCAAATTAGGGATATTTCTCTCGATACTTATAATAATATGTTTAATTATATACAAATCTTACTGCTCTCCGGTTATATACAAGAAGGAATTATCTGAAGTAGGCTACGAACACCTCTCCAAGGGGTCAGATAGACCCCTGCACATCCTGAGAGCTCAGAATACAAGACGTTTGGGGGATAAACTGCCCCCGCCCTACCCTAATGGATGGTTCGCTCTGGTTGAGAGTCGGGACTTGAAGGTCGGGTCAGTAATACCCGTGGATGCTATGGGTCTTAACTTCTGCGTATACCGAGGGGAGGACGGTGTTGCCAGGATAGTGGACGCCTATTGTCCCCACTTGGGTGCGAATTTAGCCGTGGGTGGAACCGTCTGTGGTAATTGCATAGAGTGTCCTTTCCACCAGTGGAGGTTTGGGGAGAATGGAGATTGCGTGAGCATACCTAACGTTGAGGCGGTACCAAAAGGCATATCCATCAAGACCCACCACGCCATGGAAATTGATGGGGCGGTGTGGGTGTGGTATGATGTCGAAGGTCGGGAGCCTCTATGGACGGTGGACAGAATCCCGGAACTAGACACGTGGGGATACAGGGGACGGAACGAGTTCATAGTTAACGCTCACTTGCAGGAAATACCCGAGAACGGTGCGGATGTTGCTCACCTGAACGCGGTGCACACAGTCTCCATGCTGAGTGACGTCGGGTTTAAATATCCATTCCTCAATCATTTTATTGGCTACCACACTTGGAACGCTGAATGGTTGAAGGGTGACGACCACACCGCCTCTATGAAAATAACTCAAAAATACCTCATCATGAAATTAGACATCTTCCCGATAGATGTCACTGTGACACAGATAGGTCCAGCGCACGTTCGTCTTATGTTCACCTCTCCTCTGGGCCCCATGGTTGTTCTTCAGTCAGTGACGCCGCTCGGACCTCTGTTGCAGCGCGTGATACATCGCGTGTACACCCCCACGTTGAACGCGCCGCTGGGCGCTGCACTAGTCGTTTTGGAAGCCTACCAGTTCCAACGCGACGTTGCGATATGGAACAGCAAGAGATACGTCAATTCACCTACTTACGTCAAATCGGACAAAACGATACGTGCTTTCAGAACATGGTTCTCTCAGTTCTACAGCAAGAACAGTATACCACTGAGAGACGCTATGCAGAACCCATTGGACTGGTAG

Protein sequence:

>DPOGS215135-PA
MAAHDALTFDANPCHDPFYVLNVLFHAVADYGFRYFKLGIFLSILIIICLIIYKSYCSPVIYKKELSEVGYEHLSKGSDRPLHILRAQNTRRLGDKLPPPYPNGWFALVESRDLKVGSVIPVDAMGLNFCVYRGEDGVARIVDAYCPHLGANLAVGGTVCGNCIECPFHQWRFGENGDCVSIPNVEAVPKGISIKTHHAMEIDGAVWVWYDVEGREPLWTVDRIPELDTWGYRGRNEFIVNAHLQEIPENGADVAHLNAVHTVSMLSDVGFKYPFLNHFIGYHTWNAEWLKGDDHTASMKITQKYLIMKLDIFPIDVTVTQIGPAHVRLMFTSPLGPMVVLQSVTPLGPLLQRVIHRVYTPTLNAPLGAALVVLEAYQFQRDVAIWNSKRYVNSPTYVKSDKTIRAFRTWFSQFYSKNSIPLRDAMQNPLDW-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: