MonarchBase - Protein-coding gene

DPOGS214331
Transcript	DPOGS214331-TA	1074 bp
Protein	DPOGS214331-PA	357 aa
Genomic position	DPSCF300020 - 558192-562147
RNAseq coverage	321x (Rank: top 36%)

Annotation
*Heliconius*	HMEL007606	7e-172	80.56%
*Bombyx*	BGIBMGA003989-TA	5e-147	69.97%
*Drosophila*	CG10512-PA	2e-111	54.26%
EBI UniRef50	UniRef50_A7UUE0	3e-111	55.65%	AGAP006576-PA n=26 Tax=Eumetazoa RepID=A7UUE0_ANOGA
NCBI RefSeq	XP_316604.4	4e-112	55.65%	AGAP006576-PC [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|158296085	8e-111	55.65%	AGAP006576-PC [Anopheles gambiae str. PEST]
NCBI nr blastx	gi\|158296085	9e-109	55.65%	AGAP006576-PC [Anopheles gambiae str. PEST]

Group
Gene Ontology	GO:0008152	5.5e-137	metabolic process
	GO:0055114	5.5e-137	oxidation-reduction process
	GO:0016491	5.5e-137	oxidoreductase activity
KEGG pathway	pab:PAB1791	1e-55
	K05884 (E1.1.1.272)	maps->	Cysteine and methionine metabolism
InterPro domain	[1-357] IPR003767	5.5e-137	Malate/L-lactate dehydrogenase
Orthology group	MCL13445		Insect specific

Nucleotide sequence:

>DPOGS214331-TA
ATGGGTAAAGTCGCTACTACAGAGGCGCTTCGTTTTATGACTGATTGCTTAAAAGCTGCGGGAGCTCGTGCTTATCCTGCACACCAACAAGCAGAATTATTACTGGAAGCCGATCGACTTGGACATCCGAGCCACGGACTTAACAGATTAGAATATTACGTCAATGATATCTTAGGCGGTGGCTGTCAACCCAACAATCAGCCAAAGATCTTAAAGCAGAGCCCGTCGACGGCGTGGGTTGATGCCCAAAATGTTCTGGGGGCCACAGTCAGTCATTTTGCAATGGACATCGCTATTGAGAAAGTAAAACAGACAGGCGTCGGATGGGTAACTGTTAAAGCATCAAATCATAATGGCATGGCGGGTTTCTGGGCAAAAAAGGCTGCAGATCAGGGCTTAATTGGTATGGCATTCACAAATACATCCCCGCTACTAGCACCAACGCGAAGCAAAAAGTCTGCTCTCGGTACTAACCCGTTGTCAGTTGTGGCGCCCGGAGCTGATGGAGAGACCTTTTACCTGGACATGGCCACCACAGCTGTTGCCGTGGGAAAGATAGAAATGAAAAGGCGGAAAGGTGAGACATTGCCCAATGGTTGGGCTCAGGGTCCTGACGGCAAAGAAACACAAGACGCTGAACTGGCTTTCAACACGGGATGTTTGTTCCCGCTAGGTGGTAGGGAAGAAACCTCAGGCTACAAAGGCTACGGTTTGGCCGCCATGGTAGAACTCTTCTGCGGTATCTCGTCAGGTTCAAACTACGGGCACCACATCCGCTCGTGGTCCCACAGCGGCGAGGGCGGATCATCCAACATTGGACACTGCTTCGTTGCAGTCAACTTCGAGAACTTCGCGCCTGGCTTTAAAGACAGGCTTGCGGATTGTATGACGCATTGGAGGAATTTGGATCCGGCGGATGAAAAGCTGCCAGTGTTAGCGCCCGGGGACAAAGAGAAGGAAGCAGCACAACTGACTGATGCGAGCGGCACGGTCTCCTACGTCGAGCAGCAGATAAAGTCTAGCTCCGCTCTGGCTGAACGATTAAAAGTTACTCCCATGGAGTTATGCCGTTAA

Protein sequence:

>DPOGS214331-PA
MGKVATTEALRFMTDCLKAAGARAYPAHQQAELLLEADRLGHPSHGLNRLEYYVNDILGGGCQPNNQPKILKQSPSTAWVDAQNVLGATVSHFAMDIAIEKVKQTGVGWVTVKASNHNGMAGFWAKKAADQGLIGMAFTNTSPLLAPTRSKKSALGTNPLSVVAPGADGETFYLDMATTAVAVGKIEMKRRKGETLPNGWAQGPDGKETQDAELAFNTGCLFPLGGREETSGYKGYGLAAMVELFCGISSGSNYGHHIRSWSHSGEGGSSNIGHCFVAVNFENFAPGFKDRLADCMTHWRNLDPADEKLPVLAPGDKEKEAAQLTDASGTVSYVEQQIKSSSALAERLKVTPMELCR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: