MonarchBase - Protein-coding gene

DPOGS204504
Transcript	DPOGS204504-TA	2736 bp
Protein	DPOGS204504-PA	911 aa
Genomic position	DPSCF300002 + 1727001-1733098
RNAseq coverage	520x (Rank: top 24%)

Annotation
*Heliconius*	HMEL013077	76.15%
*Bombyx*	BGIBMGA007848-TA	78.49%
*Drosophila*	CG6385-PA	49.83%
EBI UniRef50	UniRef50_A1ZAZ2	49.83%	CG6385 n=27 Tax=cellular organisms RepID=A1ZAZ2_DROME
NCBI RefSeq	XP_308638.4	56.31%	AGAP007123-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|158286237	56.31%	AGAP007123-PA [Anopheles gambiae str. PEST]
NCBI nr blastx	gi\|158286237	56.31%	AGAP007123-PA [Anopheles gambiae str. PEST]

Group
Gene Ontology	GO:0055114	3.1e-68	oxidation-reduction process
	GO:0016491	3.1e-68	oxidoreductase activity
	GO:0006546	1.8e-43	glycine catabolic process
	GO:0004047	1.8e-43	aminomethyltransferase activity
	GO:0005737	1.8e-43	cytoplasm
KEGG pathway	dpo:Dpse_GA19555	0.0
	K00314 (E1.5.99.1)	maps->	Glycine, serine and threonine metabolism
InterPro domain	[36-394] IPR006076	3.1e-68	FAD dependent oxidoreductase
	[537-770] IPR006222	1.8e-43	Glycine cleavage T-protein, N-terminal
	[775-870] IPR013977	3.1e-14	Glycine cleavage T-protein, C-terminal barrel
Orthology group	MCL12721		Single-copy universal gene

Nucleotide sequence:

>DPOGS204504-TA
ATGTTTAAAGTAATTAGAGATAGGTGTATAAGAACGAAAGCGGCGAGTTACTTGAAGAGCACAAACGGGAGAAAGTATTACAGCAATGAAGTAGTTACATCAGCCGATATTGTTGTCATAGGTGGTGGTATCGCGGGCTGTAATACTTTATATCAGTTGTCGAAAAGAGGAGTCAACGCTGTTCTCTTGGAAAGGAACAAATTGACGAGTGGTACAACATGGCATACGGCTGGTCTGGTATGGTCTCTCCGACCCAGTGATTTGGAAATTAAATTGCTACAAGATTCTAGACAAGTTTATAGTTCACTAGAGCAAGAGACAGGAGATTATGCAGGATGGATCAATAATGGAGGCATGTTTATATCGCGAAGCAAGCTTCGAACGGAAGAATACTTAAGGTTACACACATTAGGGAAAGCAATGGGTATTCCGAGCGAAATTCTTGATCCAAATGAAGCTCAGAAGTTATTCCCACTTTTGGACCCATCAGTATTTAAAATGGCACTCTATTCACCTCTCGACGGCACTATAGATCCCGCAATGGCTTGTAACGCCCTCGTCAAAGCAGCCTCCAAGAATGGTGGAAAGATATACGAAGATTGTCCGGTAATTGATATTCATTACGCTCATAACTTGCTCGGACATAAAGAAGTCACCGGGGTTCATACAGAAAAGGGATTTATCAGGACCAAGTGTGTAGTAAATTGTGGTGGTGTATGGGGTGCTCGTATAGCAAGGTTCGCTGGAGTGCCATCTTTGCCACTGATTCCATTTAAACACGCCTACGTAGTATCCGACGCCATCCCAGAAATCAGAGGTTGCCCGAACGTTAGGGACCATGATGTCAATTTATATTTCAAAATACAAGGCGAAAGCTGTAATATTGGTGGATATGAAAATAATCCAATAATGCTTGATCAGGTTGCAGATAGTCAAAGCTTCCATTTATACGATTTGGACTGGGATGTGTTCAGTGTTCATATGAACAGTGCTACGTCACTTTGTCCGAAACTCGGAAAAGTAGGGATAAAAAGCACAGTTTGTGGTCCCGAGTCATTTACACCCGACCACAAGCCGCTAATGGGAGAAGATTGCAATGTTTTTGGTTTGTACCATAACTGTGGATACAATTCCTCCGGCATGATGTTTTCTGCTGGGACAGCCATACAATTAGCTGAATGGATCATTAGTGGAAGGCCACACTACAACATGTTTACATTCGACATTGCTCGTTTTACGTCCGGCCAACTAGCACGACCGCACTGGGTCCGTGAGAGCAGTCACGAGGCGTATGTTAAGAACTACAGTATCGTGTTCCTGAACGACGAACCCCTCGCTGGTAGAGATGCGAGTCATGACGCTCTTCATCAGGAGCTGATAGATGATGGCGCTGTGATGCAGGCGAGAGCCGGCTGGGAACGTCCAGGGTTCTTTGTACCCGGGGAAAAGATCAGGGTCCAACAATATGACTGGGGTGGCGTGAATGACTACCCTCGTAATTTGGATCAAAGATATGAAGATCTTCTTAGAGGAGATTACACGTTCGGATTTTCAAAACATCATGATATCATCGGGTCGGAGGCGTTGGCGTGTAGGAATGCTGCGGCTTTATTCAATATGTCTTACTACGGAAAGTTTTACTTAACAGGACCTGATGCTCAGAGAACTGCTGAACTAGCTTTTACCGCTGACTTGAGCAAGAAACATGATGGTGTTGTTTATACTCTTATACTCAATGAGAAAGGTGGAGTGGAGGCAGATTTGACTGTCAGCGTCCTTGATGGAGGAAGTGGGCAGCTACATGAACCGATATTTAAAGGTCGTGGTTACTACGTGGTGACAAGCGGCTTCAGTGCGAATCACACAGCGTCTATCATCCGTCACATTATTTACAAACACAAACTTCGCGCCAATCTCACTGACGTTAGCAAACAGCTTTGCATTCTAGCCATTAATGGTCCTAACAGCCAGCGCATACTGCAGGGATACACAAGCGCGGGTCTATCAAATGATGCTTTCCCGTTGTACTCACATCGCAGCATCAAGGTATCCAAAGGGCCTCACTCTCCTGACAATAAGGCCTACACTTGTCGTGCTTTAAGAGTGTCTTGGACAGGCGAGCTCGGCTGGGAGCTTCATGTGCCTTCCTCGCACGCAGTTCAAGTCTACAAAGCTTTAACTCAGAACAGCGGACTGAAAAACGCTGGCTGGAGATCACTTACATCTTTAAGTACTGAAAAAGGTTTCCATCTTTGGAATGCTGATCTGAGAACCGATGATAATCCGGTAGAAGCAAACCTGTCATTTGCATGTCGCAAGGATGGGGAGTACATTGGCAACGAAAGCGTAACAAGGGCTAGGCAAAATGGAGTAACAAAGAAATATGCCTTCTTCACCCTCGACGATAAGGTCGCATTATTTGGACAAGAAGCTATATACAGAAATGGAGAGCCTGTCGGCCACCTTCGAAGAGGGGATTATGGCTTCTTCCTTGACAAATCCATTGGTGTAGGCTACGTTACCAATAATGGTTCAATGGTCACTAAAAATTACTTACAGGATGGTGAATACGAAATTGAAGTTATGGGAAAAAGATACAAAGCCAACCTTCACCTAAAGTCTCCATTTGATCCAAAAGGACAAAGGATGCTTGGTAATTATGGAGAAATGGGCATGGATGAAAACACACACGAACCTCATGCTGGACAAAATGAAAGAGCTGGTGGTAGCGAATAG

Protein sequence:

>DPOGS204504-PA
MFKVIRDRCIRTKAASYLKSTNGRKYYSNEVVTSADIVVIGGGIAGCNTLYQLSKRGVNAVLLERNKLTSGTTWHTAGLVWSLRPSDLEIKLLQDSRQVYSSLEQETGDYAGWINNGGMFISRSKLRTEEYLRLHTLGKAMGIPSEILDPNEAQKLFPLLDPSVFKMALYSPLDGTIDPAMACNALVKAASKNGGKIYEDCPVIDIHYAHNLLGHKEVTGVHTEKGFIRTKCVVNCGGVWGARIARFAGVPSLPLIPFKHAYVVSDAIPEIRGCPNVRDHDVNLYFKIQGESCNIGGYENNPIMLDQVADSQSFHLYDLDWDVFSVHMNSATSLCPKLGKVGIKSTVCGPESFTPDHKPLMGEDCNVFGLYHNCGYNSSGMMFSAGTAIQLAEWIISGRPHYNMFTFDIARFTSGQLARPHWVRESSHEAYVKNYSIVFLNDEPLAGRDASHDALHQELIDDGAVMQARAGWERPGFFVPGEKIRVQQYDWGGVNDYPRNLDQRYEDLLRGDYTFGFSKHHDIIGSEALACRNAAALFNMSYYGKFYLTGPDAQRTAELAFTADLSKKHDGVVYTLILNEKGGVEADLTVSVLDGGSGQLHEPIFKGRGYYVVTSGFSANHTASIIRHIIYKHKLRANLTDVSKQLCILAINGPNSQRILQGYTSAGLSNDAFPLYSHRSIKVSKGPHSPDNKAYTCRALRVSWTGELGWELHVPSSHAVQVYKALTQNSGLKNAGWRSLTSLSTEKGFHLWNADLRTDDNPVEANLSFACRKDGEYIGNESVTRARQNGVTKKYAFFTLDDKVALFGQEAIYRNGEPVGHLRRGDYGFFLDKSIGVGYVTNNGSMVTKNYLQDGEYEIEVMGKRYKANLHLKSPFDPKGQRMLGNYGEMGMDENTHEPHAGQNERAGGSE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: