MonarchBase - Protein-coding gene

DPOGS201807
Transcript	DPOGS201807-TA	1737 bp
Protein	DPOGS201807-PA	578 aa
Genomic position	DPSCF300145 + 116672-130147
RNAseq coverage	645x (Rank: top 20%)

Annotation
*Heliconius*	HMEL003569	95.16%
*Bombyx*	BGIBMGA013235-TA	84.87%
*Drosophila*	slgA-PE	67.19%
EBI UniRef50	UniRef50_B3MRV8	66.84%	GF20923 n=22 Tax=Bilateria RepID=B3MRV8_DROAN
NCBI RefSeq	NP_996527.1	68.63%	sluggish A, isoform G [Drosophila melanogaster]
NCBI nr blastp	gi\|24643717	68.63%	sluggish A, isoform A [Drosophila melanogaster]
NCBI nr blastx	gi\|24643717	68.63%	sluggish A, isoform A [Drosophila melanogaster]

Group
Gene Ontology	GO:0004657	1.6e-225	proline dehydrogenase activity
	GO:0055114	1.6e-225	oxidation-reduction process
	GO:0006562	3.8e-102	proline catabolic process
	GO:0006537	3.8e-102	glutamate biosynthetic process
KEGG pathway	dpo:Dpse_GA12802	0.0
	K00318 (E1.5.99.8)	maps->	Arginine and proline metabolism
InterPro domain	[22-572] IPR015659	1.6e-225	Proline oxidase
	[205-551] IPR002872	3.8e-102	Proline dehydrogenase
Orthology group	MCL12426		Single-copy universal gene

Nucleotide sequence:

>DPOGS201807-TA
ATGGCTCTGCTACGTCGACTGGCTGTGAACGCGCCCCGAGGCGTCCGAGTTTTGTCCACGCCGCCACCGTCTCGTGACGAACTAGATCTAACCTTCAACAGTCCGAGAGATGCTTTCAAGAGCAAGAAAACTAGCGAATTGGTCCGGGCGTACCTCGTATATCAAATATGTTCGATCAACTGGGTTGTCGAGAACAATGCTATGCTGATGAAACGCCTCCGCCAGCTGGTCGGTCAGAGGCTGTTCGAAGCCATCATGAAGGCCACCTTCTACGGCCAGTTCGTCGCCGGCGAGGACCAGATCAAGATACAACCGACGCTTGACAGGCTGCGGTCGTTCGGTGTAAAGCCGATCCTCGATTATTCCGTGGAGGAAGATCTCTCCCAGGAGGAGGCTGAGAAGCGCGAAGTGAGCGCTTCGATATCGACGTGCGGCGACACGCAGGAGGAGGGTCAACTGAAGCAGTACCACGTGGAGCAGAGATTCGCTGATCGCCGGTACAAGGTCACCAGCGCTAGAACATACTTCTACCTGAACGAGGCCTCATGCGAGAAGAACATGGAAGCGTTTATGAACAGCATCGACACCGTCGCCAAAATAACCAAGAGCACTGGACTTATGGCCGTGAAACTAACAGCCCTTGGCAGACCACAGTTACTTCTCCAACTGTCCGAGGTGATAATGCGCGCCCGTAGCTATATGCAGCAGATAGCTGGCGGTACTGGGAACGTACTCGCCCATCATAAGACCATCGAAGACCTGCAGAGATACTTAGGGGATTACAGCGCTCGGCCCGAAGTACAGGACTTTATGAACAAAGTCACCTCCGACACGGAAGGTATCGTCCATCTTTTCCCGTGGTCGAACATTCTGGATAAGGATATGGGTTTGTCAGATTCATTCCGCGTCCCTGACCCGAAGACCGGTCAGATGCGACGCCTCATCTCCCAGATATCGCCCAAGGAGGAGGAAATGTTCAGGAACATGCTGCGGCGTCTCAACAATATAATACAGGTGGCCAACGAGCATGACGTCAGGATTATGATAGACGCCGAACAGACATACTTTCAGCCGGCCATCTCGAGGATCTGTCTCGAAATGATGAGGAGGTATAACAAGAACAAATTCCTCGTATTCAATACATACCAGACCTATCTGAAGAACACGTACAACGAGATAGTGACTGATCTCGAACAGGCGCAGCGTCAGAACTTCTACTGGGGTGCCAAGCTGGTCCGGGGGGCCTACATAGAGCAGGAGCGTGCCCGTTCAGCCGCTATGGGCTACGAGGATCCCACGTGTGAGAGCGTCGACGCTACGACAGCATCATTCCACCGCTGTCTCAAGGAAATACTCAGCCGGGTTAAGAACGAGCAAAACGATCGTCTCGGTATAATGGTGGCCTCTCACAATGAGGACACCGTCCGTTATGCCATCCAGTTAATGAAGGAACACGGCATCGGGCCGGGGGATAAGGTGGTGTGCTTCGGGCAACTGCTGGGGATGTGTGATCACATCACATTCCCATTGGGTCAAGCTGGTTATTCGGCTTATAAGTATGTTCCTTACGGTCCTGTGCTGGAAGTGCTGCCATACTTGTCCCGTCGAGCAAATGAGAACAGAGGCTTCCTCCAGAAGATAAAGAAGGAGAAGGGTCTGCTTCTAAAAGAGATATTCCGTAGAATGTTCAGCGGACAGCTGTTCTACAAACCGTCTGGGAACTATACACCGGTTTAA

Protein sequence:

>DPOGS201807-PA
MALLRRLAVNAPRGVRVLSTPPPSRDELDLTFNSPRDAFKSKKTSELVRAYLVYQICSINWVVENNAMLMKRLRQLVGQRLFEAIMKATFYGQFVAGEDQIKIQPTLDRLRSFGVKPILDYSVEEDLSQEEAEKREVSASISTCGDTQEEGQLKQYHVEQRFADRRYKVTSARTYFYLNEASCEKNMEAFMNSIDTVAKITKSTGLMAVKLTALGRPQLLLQLSEVIMRARSYMQQIAGGTGNVLAHHKTIEDLQRYLGDYSARPEVQDFMNKVTSDTEGIVHLFPWSNILDKDMGLSDSFRVPDPKTGQMRRLISQISPKEEEMFRNMLRRLNNIIQVANEHDVRIMIDAEQTYFQPAISRICLEMMRRYNKNKFLVFNTYQTYLKNTYNEIVTDLEQAQRQNFYWGAKLVRGAYIEQERARSAAMGYEDPTCESVDATTASFHRCLKEILSRVKNEQNDRLGIMVASHNEDTVRYAIQLMKEHGIGPGDKVVCFGQLLGMCDHITFPLGQAGYSAYKYVPYGPVLEVLPYLSRRANENRGFLQKIKKEKGLLLKEIFRRMFSGQLFYKPSGNYTPV-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: