MonarchBase - Protein-coding gene

DPOGS204223
Transcript	DPOGS204223-TA	3138 bp
Protein	DPOGS204223-PA	1045 aa
Genomic position	DPSCF300046 - 734794-746244
RNAseq coverage	819x (Rank: top 16%)

Annotation
*Heliconius*	HMEL015141	0.0	77.60%
*Bombyx*	BGIBMGA007502-TA	0.0	82.48%
*Drosophila*			%
EBI UniRef50	UniRef50_Q13423	0.0	58.46%	NAD(P) transhydrogenase, mitochondrial n=372 Tax=root RepID=NNTM_HUMAN
NCBI RefSeq	XP_970382.1	0.0	68.11%	PREDICTED: similar to nadp transhydrogenase [Tribolium castaneum]
NCBI nr blastp	gi\|91083631	0.0	68.11%	PREDICTED: similar to nadp transhydrogenase [Tribolium castaneum]
NCBI nr blastx	gi\|157133017	0.0	70.18%	nadp transhydrogenase [Aedes aegypti]

Group
Gene Ontology	GO:0050661	3.4e-196	NADP binding
	GO:0016021	3.4e-196	integral to membrane
	GO:0055114	3.4e-196	oxidation-reduction process
	GO:0008750	3.4e-196	NAD(P)+ transhydrogenase (AB-specific) activity
	GO:0015992	9.1e-178	proton transport
	GO:0016491	2.5e-48	oxidoreductase activity
KEGG pathway	tca:658942	0.0
	K00323 (NNT)	maps->	Nicotinate and nicotinamide metabolism
InterPro domain	[582-1039] IPR012136	3.4e-196	NADP transhydrogenase, beta subunit
	[41-549] IPR004571	9.1e-178	NAD(P) transhydrogenase, alpha subunit
	[185-348] IPR007698	2.5e-48	Alanine dehydrogenase/PNT, C-terminal
	[42-175] IPR007886	2e-44	Alanine dehydrogenase/PNT, N-terminal
Orthology group	MCL17748		Patchy

Nucleotide sequence:

>DPOGS204223-TA
ATGTGCGGATGTGTGAGGGTACTCCGCCTTGGCAGTCCACTAAAAAAATCATGGCAACGCAGATTGTTTTCTTCATCTTCTTCGCCGCCAACGCAAGGAGTGCCATACACCAAACTTAGTGTCGGAATTCCCAAAGAGATATGGCAAGATGAAAGGAGAGTTGCCATAGTACCAGCTGTAGTAAGTAAATTAGTTAAAAAAGGTTTTACAGTTAATGTAGAAGAAAATGCTGGTACATTAGCAAATTTTCCAAATAAGACTTATGAAGAAGTTGGAGCTAAAATAACTAGTGTAAAGGACGCCTACGGCTCAAATATAATTCTTAAAGTACGTCCGTTGGCTGAAAGCGAACTTCAAAATGTTAACGAGGAATCAACGCTTATATCATTTTTCTACCCAGCACAAAACCAAGCACTTATACAAAAATTGGCTGCTAAAAAGGTGAATGCATTTGCAATGGACTGCATTCCTCGGATAAGCCGTGCGCAGGTGTTCGACGCGTTGAGCTCTATGGCGAACGTTGCTGGCTATCGAGCTGTCATTGAAGCCGCAGCACATTTCCCACGTTTCTTCTCCGGCCAGATGACGGCAGCGGGTCGCGTGCCGCCATGCCGCGTGTTGGTGGTTGGCGGAGGGGTAGCGGGGTTGGCGGCCGCGGCCCAGGCGAGATGTATGGGGGCCGCAGTCCGGGCCTTCGACACACGACCGGCTGTGAGGGAACAGATCGAGAGTCTCGGTGCACAGTTCATTACTATGGAAGTTAAGGAGGAGGGGGCTGGTGCTGGTGGGTACGCAAAGGAAATGAGTGAGGAGTTCCTTCAGGCGGAGCGTGCTTTGTTGGGACGGGAGGCTCGGAATTCAGACGTCGTGATCAGCACAGCACTCATACCAGGGAAACCGGCGCCGCTGCTCATATTAGAGGATGCTGTCAAAGATATGGCTCCTGGCAGCGTGATAGTTGATCTAGCCGCTGAGATGGGTGGAAACATTGAGACGACCACTAAGGGCAAGGTGACCAGGGTTCATGACGTCACACACATCGGCCTCACAGACCTACCAAGTCGAATGCCCGCACACGCCTCCACACTCTACGCCAACAATATTTCTGCATTCTTATTAAGTTTAGGTACTAACGATCACTTCCACATCAATCTGGAGGATGAAGTGACTCGTGGGGCGATAGTCCTTAAAGCTGGTGAATTACTATGGCCACCGCCGCCCGCACCCTTGGTTGCACCCGACGCGGCCCCCAAAACTGTAACCCCTGTCAAGGTCGAGCCTCCCAACCCCTTCAATGAAACCTTGAAGGATACCTTCTTATATTCTACCGGTCTGGCAAGTCTTATCGGTCTCGGTATGGCATCGCCGAATCCGGCCTTCACCACTATGACCACCACCTTGGCTTTATCTGGTGTCGTGGGTTACCACACGGTGTGGGGCGTGGTGCCGGCGCTGCACTCTCCTTTGATGTCCGTCACTAACGCCGTGTCGGGCATTACGGCTGTGGGTGGACTACTGTTGATGGGAGGAGGATATCTGCCAGAAACACCTGTACAGTGGCTAGCGAGTACAGCGGCTTTGATCTCCTTTGTCAACGTATTCGGCGGGTTCATGGTCACACAGCGTATGTTGGATATGTTCAAAAGGCCAGGTGATCCGCCAGAGTATGGATATCTGTACGCTATACCTGCTGCCGCGCTTTTGGGAGGATACATCACAACAGCGATGCAGGGTTACCCTGAAGTCCACCAGATGGCGTACCTAGCTTCGTCGTTATGCTGCGTCGGAGCACTCGCCGGCCTGAGCTCACAGACGACAGCCAGGAAGGGAAACTATTTGGGAATGATTGGTGTATCCGGCGGTATAGCGGCCACACTGGGAGCATTGACTCCAACATCCGAAGTATTGGCGCAAATGGTTGGCGTGGCGGGCATTGGCGGTCTACTTGGTGGTGTCATCGCTAAGAAAATTGAAATCACTGATTTGCCACAACTTGTGGCTGGATTCCACAGCTTGGTGGGCATGGCCGCTGTATTAACATGTCTAGCGACGTACATGCACGACTTCCCCGCCATGGCGCTGGACCCCACCGCCGCCACGCTCAAGACGTCTCTCTTCCTCGGCACATACATCGGTGGAATAACATTCACTGGGTCGTTAGTGGCTTACGGTAAACTTCAAGGCGTGTTGTCCTCGGCCCCACTATTACTGCCGGGTCGTCATGCTCTGAACGCGGCGCTGGCCACGGGAGCCCTGGGCTGTGGCGGAGCCCTGCTCGCCTTCCCCGAAGCCCCCGGCCTGCCGCTACTGTCCGCCGCCGCCGTCCTCAGCGGCATCCAGGGCCTCACACTCACATCTGCTATTGGTGGTGCTGACATGCCGGTGGTGATCACAGTCCTGAACAGCTACTCCGGCTGGGCGCTGTGTGCTGAAGGGTTCATGTTGAACAACTCCCTCATGACCATCGTCGGCGCACTCATCGGCAGCTCCGGAGCCATTCTATCTTATATAATGTGCAAGGCTATGAATCGTTCGTTGCCGAATGTAATCCTAGGTGGGTACGGTGTAACGGGGTCCGGATCAGCTCGCCCGGAAGGCGCCACCCACACCGAGATGAACGTCGACAGCGTAGCAGACCTCGTTCACCGCGCCTCCTCCATCATTATAACTCCCGGTTATGGTCTGTGTGTGGCCAAAGCTCAGTATCCCATCGCCGAATTGGTGGACATTCTTAAAGGCATCGGAAAAAAAGTGCGCTTTGCTATACATCCAGTTGCTGGACGTATGCCCGGTCAACTGAACGTGCTGCTCGCTGAAGCCGGTGTGCCCTATGACGACGTGTTCGAGATGGAGGAAATCAACGATGAATTCCCGGAAACTGACTTGGTCTTAGTTATAGGCGCCAACGACACCGTGAACAGTGCTGCTGAGGACGACCCGGAGTCTCCCATAGCCGGCATGCCGGTGCTCAAAGTGTGGAAGGCGAACCAAGTGGTAGTGATGAAGAGGTCTATGGGTGTCGGCTACGCGGCAGTTGATAACCCCATATTCTACAACCCCAACACCGCCATGTTGTTGGGAGACGCCAAGAAGACTTGCGACGCACTTCTCGACAGAATCAAACATCTCGCTGCATAA

Protein sequence:

>DPOGS204223-PA
MCGCVRVLRLGSPLKKSWQRRLFSSSSSPPTQGVPYTKLSVGIPKEIWQDERRVAIVPAVVSKLVKKGFTVNVEENAGTLANFPNKTYEEVGAKITSVKDAYGSNIILKVRPLAESELQNVNEESTLISFFYPAQNQALIQKLAAKKVNAFAMDCIPRISRAQVFDALSSMANVAGYRAVIEAAAHFPRFFSGQMTAAGRVPPCRVLVVGGGVAGLAAAAQARCMGAAVRAFDTRPAVREQIESLGAQFITMEVKEEGAGAGGYAKEMSEEFLQAERALLGREARNSDVVISTALIPGKPAPLLILEDAVKDMAPGSVIVDLAAEMGGNIETTTKGKVTRVHDVTHIGLTDLPSRMPAHASTLYANNISAFLLSLGTNDHFHINLEDEVTRGAIVLKAGELLWPPPPAPLVAPDAAPKTVTPVKVEPPNPFNETLKDTFLYSTGLASLIGLGMASPNPAFTTMTTTLALSGVVGYHTVWGVVPALHSPLMSVTNAVSGITAVGGLLLMGGGYLPETPVQWLASTAALISFVNVFGGFMVTQRMLDMFKRPGDPPEYGYLYAIPAAALLGGYITTAMQGYPEVHQMAYLASSLCCVGALAGLSSQTTARKGNYLGMIGVSGGIAATLGALTPTSEVLAQMVGVAGIGGLLGGVIAKKIEITDLPQLVAGFHSLVGMAAVLTCLATYMHDFPAMALDPTAATLKTSLFLGTYIGGITFTGSLVAYGKLQGVLSSAPLLLPGRHALNAALATGALGCGGALLAFPEAPGLPLLSAAAVLSGIQGLTLTSAIGGADMPVVITVLNSYSGWALCAEGFMLNNSLMTIVGALIGSSGAILSYIMCKAMNRSLPNVILGGYGVTGSGSARPEGATHTEMNVDSVADLVHRASSIIITPGYGLCVAKAQYPIAELVDILKGIGKKVRFAIHPVAGRMPGQLNVLLAEAGVPYDDVFEMEEINDEFPETDLVLVIGANDTVNSAAEDDPESPIAGMPVLKVWKANQVVVMKRSMGVGYAAVDNPIFYNPNTAMLLGDAKKTCDALLDRIKHLAA-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: