MonarchBase - Protein-coding gene

DPOGS206271
Transcript	DPOGS206271-TA	2844 bp
Protein	DPOGS206271-PA	947 aa
Genomic position	DPSCF300290 - 193570-212266
RNAseq coverage	38x (Rank: top 73%)

Annotation
*Heliconius*	HMEL016898	3e-57	61.46%
*Bombyx*	BGIBMGA010748-TA	1e-59	70.67%
*Drosophila*	Nmnat-PA	8e-44	39.92%
EBI UniRef50	UniRef50_UPI00021A85D3	7e-46	46.74%	UPI00021A85D3 related cluster n=2 Tax=unknown RepID=UPI00021A85D3
NCBI RefSeq	XP_973580.1	3e-50	52.49%	PREDICTED: similar to nicotinamide mononucleotide adenylyltransferase 1 [Tribolium castaneum]
NCBI nr blastp	gi\|91089959	6e-49	52.49%	PREDICTED: similar to nicotinamide mononucleotide adenylyltransferase 1 [Tribolium castaneum]
NCBI nr blastx	gi\|91089959	3e-47	49.27%	PREDICTED: similar to nicotinamide mononucleotide adenylyltransferase 1 [Tribolium castaneum]

Group
Gene Ontology	GO:0016779	2.7e-89	nucleotidyltransferase activity
	GO:0009435	2.7e-89	NAD biosynthetic process
	GO:0009058	4.2e-19	biosynthetic process
KEGG pathway	tca:662389	8e-50
	K06210 (NMNAT)	maps->	Nicotinate and nicotinamide metabolism
InterPro domain	[4-733] IPR005248	2.7e-89	Probable nicotinate-nucleotide adenylyltransferase
	[3-173] IPR014729	1.9e-32	Rossmann-like alpha/beta/alpha sandwich fold
	[9-170] IPR004820	4.2e-19	Cytidylyltransferase
Orthology group	MCL10620		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS206271-TA
ATGTCGCAAGGAAAAATTGTATTAATGGCTTGCGGCAGCTTCAGTCCGCCGACTTACATGCATTTACGAATGTTCGAAATAGCAAAGGATTATATTCACTCATTGGGTCTGGGTACGATAATTGGTGGAATCGTCTCACCGGTTCACGACGCATACGGTAAAAAGGATCTAGTCGCTGCACATCACAGAATCTCAATGCTGAAGCTGGCATTGCGTTCATCGGGATGGATTAAGGTTTCCGAGTGGGAGACCCAACAGGCTGGTTGGACGAGGACCAAGGTTTCCTTACAATATCATCAGGATGCCATAAACAACAACTTAACCGGCAACAATGACAACCCGCCATCTTGGTTGCCGGATGACATGTTGAATGTGAACAACATCGAGCCGCGGGATTTCAATAATAAATTGAACGAACGATTGAATGGCAACGCGGAGGATAGGGTGACGGTGAAGCTGTTGTGCGGAGCGGATCTGTTGGAATCATTCGCCACTCCCGGACTTTGGTCGGATGAAGATGATGCCATAAACAACAACTTAACCGGCAACAATGACAACCCGCCATCTTGGTTGCCGGATGACATGTTGAATGTGAACAACATCGAGCCGCGGGATTTCAATAATAAATTGAACGAACGATTGAATGGCAACGCGGAGGATAGGGTGACGGTGAAGCTGTTGTGCGGAGCGGATCTGTTGGAATCATTCGCCACTCCCGGACTTTGGTCGGATGAAGATATGGAAGCCATAGTTGGTCGCCACGGCTTGGTTGTGGTGAGTCGCGCGGGCTGCGATCCGGGGAGATTCATCTACGAATCGGACATGCTGTATAAATATAGGGATGCCATAAACAACAACTTAACCGGCAACAATGACAACCCGCCATCTTGGTTGCCGGATGACATGTTGAATGTGAACAACATCGAGCCGCGGGATTTCAATAATAAATTGAACGAACGATTGAATGGCAACGCGGAGGATAGGGTGACGGTGAAGCTGTTGTGCGGAGCGGATCTGTTGGAATCATTCGCCACTCCCGGACTTTGGTCGGATGAAGATATGGAAGCCATAGTTGGTCGCCACGGCTTGGTTGTGAGGAATGTTACTCTAGTGACGAATTACATAGCCAACGAGGTGTCCTCGACCGTCCTGAGGAGGTTGATGCGGCGCGGAGAGAGCGCCAAGTATCTGACTGAAGATAGCGTGCTGGCTTACATCAGGCAGAACTGTCTGTATGGAGCCGAGCCGTTTGTCACTGAGTATAACATACTTAATGACCTAATAGACAATTACGATAAGTCACCCCAAGACATAGTAATGGCGTCGCCGGAGGAGGCCAGCTTCAAGAACATACTGATATCGATCAGAGATAAACCGTCTATAGTCGACGAGACGATAACCGTGAAACGAAAGATAACCAACTTCCTTACACCGCACACCGACACGGTCAGCCCGGCGCAAGGCCCGAGACCAAAGATGGCCTACATAGAGAAGGCACCCAGCACATACATACCCGGGAAGGCCGTCAAGATCATAAGCGACAAGAAACAGCACAGACTAGAGGACGAGGTAAGTTGTGATAAGTACAGCTCGCTCGACAGCTACCTGGCCAAGGAGGAAGGCGACATCTACCAGCGGAGAGTCAGCGAGAGCAACATAACCAAAGAGAAGAAGAGGTGCTCGGCGTCGACTATCAGGAAACTGAAGTCCGATGACATGAAGAAGAGCAAGTCGGAGGATGCCATAAACAACAACTTAACCGGCAACAATGACAACCCGCCATCTTGGTTGCCGGATGACATGTTGAATGTGAACAACATCGAGCCGCGGGATTTCAATAATAAATTGAACGAACGATTGAACGGCAACGCGGAGGATAGGGTGACGGTGAAGCTGTTGTGCGGAGCGGATCTGTTGGAATCATTCGCCACTCCCGGACTTTGGTCGGATGAAGATATGGAAGCCATAGTTGGTCGCCACGGCTTGGTTGTGGTGAGTCGCGCGGGCTGCGATCCGGGGAGATTCATCTACGAATCGGACATGCTGTATAAATATAGGAGGAATGTTACTCTAGTGACGAATTACATAGCCAACGAGGTGTCCTCGACCGTCCTGAGGAGGTTGATGCGGCGCGGAGAGAGCGCCAAGTATCTGACTGAAGATAGCGTGCTGGCTTACATCAGGCAGAACTGTCTGTATGGAGCCGAGCCGTTTGTCACTGAGTATAACATACTTAATGACCTAATAGACAATTACGATAAGTCACCCCAAGACATAGTAATGGCGTCGCCGGAGGAGGCCAGCTTCAAGAACATACTGATATCGATCAGAGATAAACCGTCTATAGTCGACGAGACGATAACCGTGAAACGAAAGATAACCAACTTCCTAACACCGCACACCGACACGGTCAGCCCGGCACAAGGCCCGAGACCAAAGATGGCCTACATAGAGAAGGCACCCAGCACATACATACCCGGGAAGGCCGTCAAGATCATAAGCGACAAGAAACAGCACAGACTAGAGGACGAGGTAAGTTGTGATAAGTACAGCTCGCTCGACAGCTACCTGGCCAAGGAGGAAAGCGACATCTACCAGCGGAGAGTCAGCGAGAGCAACATAACCAAAGAGAAGAAGAGGTGCTCGGCGTCTACTATCAGGAAACTGAAGTCTGATGACATGAAGAAGAGCAAGTCGGAGGTAAGTAAGCTGTGTGATAAGATGAAAAGCATTAAAATAAAGGAAACAAAGAACTATAAGACGAGGAGTTGCAATGACATCGTCAAGTTAATACTCACCAAACATGGCATTCATGTCATAAGCGACACAGAGGCCATTGTGTGA

Protein sequence:

>DPOGS206271-PA
MSQGKIVLMACGSFSPPTYMHLRMFEIAKDYIHSLGLGTIIGGIVSPVHDAYGKKDLVAAHHRISMLKLALRSSGWIKVSEWETQQAGWTRTKVSLQYHQDAINNNLTGNNDNPPSWLPDDMLNVNNIEPRDFNNKLNERLNGNAEDRVTVKLLCGADLLESFATPGLWSDEDDAINNNLTGNNDNPPSWLPDDMLNVNNIEPRDFNNKLNERLNGNAEDRVTVKLLCGADLLESFATPGLWSDEDMEAIVGRHGLVVVSRAGCDPGRFIYESDMLYKYRDAINNNLTGNNDNPPSWLPDDMLNVNNIEPRDFNNKLNERLNGNAEDRVTVKLLCGADLLESFATPGLWSDEDMEAIVGRHGLVVRNVTLVTNYIANEVSSTVLRRLMRRGESAKYLTEDSVLAYIRQNCLYGAEPFVTEYNILNDLIDNYDKSPQDIVMASPEEASFKNILISIRDKPSIVDETITVKRKITNFLTPHTDTVSPAQGPRPKMAYIEKAPSTYIPGKAVKIISDKKQHRLEDEVSCDKYSSLDSYLAKEEGDIYQRRVSESNITKEKKRCSASTIRKLKSDDMKKSKSEDAINNNLTGNNDNPPSWLPDDMLNVNNIEPRDFNNKLNERLNGNAEDRVTVKLLCGADLLESFATPGLWSDEDMEAIVGRHGLVVVSRAGCDPGRFIYESDMLYKYRRNVTLVTNYIANEVSSTVLRRLMRRGESAKYLTEDSVLAYIRQNCLYGAEPFVTEYNILNDLIDNYDKSPQDIVMASPEEASFKNILISIRDKPSIVDETITVKRKITNFLTPHTDTVSPAQGPRPKMAYIEKAPSTYIPGKAVKIISDKKQHRLEDEVSCDKYSSLDSYLAKEESDIYQRRVSESNITKEKKRCSASTIRKLKSDDMKKSKSEVSKLCDKMKSIKIKETKNYKTRSCNDIVKLILTKHGIHVISDTEAIV-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: