MonarchBase - Protein-coding gene

DPOGS203391
Transcript	DPOGS203391-TA	918 bp
Protein	DPOGS203391-PA	305 aa
Genomic position	DPSCF300003 + 845650-846567
RNAseq coverage	16x (Rank: top 81%)

Annotation
*Heliconius*	HMEL008815	6e-94	55.56%
*Bombyx*	BGIBMGA002052-TA	2e-88	48.20%
*Drosophila*	CG3731-PB	7e-64	38.51%
EBI UniRef50	UniRef50_P31930	4e-62	37.99%	Cytochrome b-c1 complex subunit 1, mitochondrial n=91 Tax=Eukaryota RepID=QCR1_HUMAN
NCBI RefSeq	XP_309120.3	2e-65	38.93%	AGAP000935-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|147902934	9e-66	38.64%	ubiquinol-cytochrome c reductase core protein I [Xenopus laevis]
NCBI nr blastx	gi\|260809835	4e-63	40.94%	hypothetical protein BRAFLDRAFT_287788 [Branchiostoma floridae]

Group
Gene Ontology	GO:0046872	2.2e-53	metal ion binding
	GO:0003824	2.2e-53	catalytic activity
	GO:0006508	6.1e-20	proteolysis
	GO:0004222	6.1e-20	metalloendopeptidase activity
	GO:0008270	6.1e-20	zinc ion binding
KEGG pathway	xla:379401	1e-66
	K00414 (QCR1, UQCRC1)	maps->	Huntington's disease
			Oxidative phosphorylation
			Alzheimer's disease
			Cardiac muscle contraction
			Parkinson's disease
InterPro domain	[92-304] IPR011237	2.2e-53	Peptidase M16, core
	[93-305] IPR011249	4.4e-30	Metalloenzyme, LuxS/M16 peptidase-like, metal-binding
	[44-218] IPR007863	6.1e-20	Peptidase M16, C-terminal
Orthology group	MCL34498		Lepidoptera specific

Nucleotide sequence:

>DPOGS203391-TA
ATGCTTAAGCATGATGAATCAACAGTAAATATATTATATGACTATTTACATTCAACAGCGTTCCAAGGTACCCAGTTAGGACAAACTATTATGGGAACTAGTAACAACTTGTGTAAATTTCAAATGCCTTCTGTTAGAAATCTTGTAAAGAAAATGTTTATTCCACAAAGAACTGTATTAGCTGCCGTTGGTGGTGTCACTCACGATACGATGGTGAACATTGGGAATAAATATTTTAGGAAAACTAAAGACCCCAAATGTATCTTTTTAGGCCCTTGTAGATATACAGGATCCGAAATATCCTACAGAGATGATTCAATGCCCATGGGGCATGTAGCGATAGCTGTGGAAGGCCCTCCCTTTTCCAGTAAAGATAAAATCTTTATGGATCTAGCTGCCTCATACATAGGGGGTTGGGACACCTCTCAACCTGGCGGAACAAACCACGGAACTTACACCGCATTGATGGGCTCAGCAGGACGTAATTGCGAGTCTTATAAAACTTTCCAATTTGTCTATAACGACACCAGTCTATGGGGAGCACAATTTATATCACCGAGAATTGATTTAGACGACATGTTATACATCATTCAGGACACTTGGATGAGATTATGTGACTTGATTACTGACGGTGAACTAATAAGGCCCAAAAGTGAATTAAAATCAAAGATTTTGATGCAAAATCAAAGTACAGAAAAAGCTTGTCACGATATCGGACAACACCTACTGCGAACTGGCAATCGACCGACTATTGCTGATAGATTTCGTGAAATTGATAATATAACTGCTAAGCAGTTAAAAAAGGTTTGCGATAAATACATATATGATAGATGTCCAGTGGTAGTGGGAATTGGTTCCATAGAATGCTTATATCCGTATACAAATGTAAGAGATGCCATGCGTTGGCTAAGAGTGTAA

Protein sequence:

>DPOGS203391-PA
MLKHDESTVNILYDYLHSTAFQGTQLGQTIMGTSNNLCKFQMPSVRNLVKKMFIPQRTVLAAVGGVTHDTMVNIGNKYFRKTKDPKCIFLGPCRYTGSEISYRDDSMPMGHVAIAVEGPPFSSKDKIFMDLAASYIGGWDTSQPGGTNHGTYTALMGSAGRNCESYKTFQFVYNDTSLWGAQFISPRIDLDDMLYIIQDTWMRLCDLITDGELIRPKSELKSKILMQNQSTEKACHDIGQHLLRTGNRPTIADRFREIDNITAKQLKKVCDKYIYDRCPVVVGIGSIECLYPYTNVRDAMRWLRV-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: