MonarchBase - Protein-coding gene

DPOGS213456
Transcript	DPOGS213456-TA	1548 bp
Protein	DPOGS213456-PA	515 aa
Genomic position	DPSCF300100 - 523345-529562
RNAseq coverage	207x (Rank: top 46%)

Annotation
*Heliconius*	HMEL016824	8e-140	85.30%
*Bombyx*	BGIBMGA004482-TA	2e-123	73.31%
*Drosophila*	CG8207-PA	3e-99	61.00%
EBI UniRef50	UniRef50_G1REB0	7e-93	39.32%	Uncharacterized protein n=6 Tax=Hominoidea RepID=G1REB0_NOMLE
NCBI RefSeq	XP_552528.1	5e-105	62.67%	AGAP011723-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|57909371	1e-103	62.67%	AGAP011723-PA [Anopheles gambiae str. PEST]
NCBI nr blastx	gi\|57909371	5e-102	62.67%	AGAP011723-PA [Anopheles gambiae str. PEST]

Group
Gene Ontology	GO:0009058	7.5e-25	biosynthetic process
	GO:0016779	7.5e-25	nucleotidyltransferase activity
KEGG pathway	aga:AgaP_AGAP011723	2e-104
	K00966 (E2.7.7.13)	maps->	Amino sugar and nucleotide sugar metabolism
			Fructose and mannose metabolism
InterPro domain	[3-200] IPR005835	7.5e-25	Nucleotidyl transferase
	[375-407] IPR001451	1e-06	Bacterial transferase hexapeptide repeat
Orthology group	MCL13476		Single-copy universal gene

Nucleotide sequence:

>DPOGS213456-TA
ATGTTGAAGGCTGTGATTCTTATAGGTGGACCACAAAAAGGTACAAGATTCCGTCCTCTATCTTTAGACACACCTAAACCTTTATTCCCTATAGCTGGCCTTCCTTTGATCCAGCACCATATTGCCGCTTGTGTAAAGCTTGGAGAATGCAAAGAAGTTCTTATAATAGGATCATATACCACAACTACTATGGCCCAATTTGTTAGTGATATGCAAAAAGAATACAAAATAATTATAAGATATCTTCAAGAATTCACTCCGCTGGGCACCGGCGGTGGTTTGTACCACTTCAGAGATCAAATCCGTGCGGGCAATCCGACGGCATTCTTTCTATTGAATGGTGATGTGTGTGCCGACTTCCCTCTCAAAGAACTGTGGACCTTCCATGAGAAAACATCACAATCGTTGATAACAATTATGGGCACTGAAGCTACGCGACAGCAGTCAGTTCACTACGGCTGTATAGTTCGAGAGCCAACCAGCAATTCGGTCACACATTATGTTGAAAAACCAAATAGTTATATATCTACATTGATCAATTGTGGGGTGTATGTGTGTTCGTTGCAAATTTTTCACACCATGGCCGATGCATTTCAAAGGAAACAGGAGGGATTTTATAGTGGCAATGGTCAAAATGGTTCACACCCCGGTTATATGTCCTGGGAACAAGATGTGCTAGCGCCTCTAGCAGGGACAAATAAGGTGTTCGCTCTGCAGATAACAATTATGGGCACTGAAGCTACACGACAGCAGTCAGTTCACTACGGCTGTATAGTTCGAGAGCCAACCAGCAATTCGGTCACACATTATGTTGAAAAACCAAATAGTTATATATCTACATTGATCAATTGTGGGGTGTATGTGTGTTCGTTGCAAATTTTCCACACCATGGCCGATGCATTTCAAAGGAAACAGGAGGGATTTTATAGTGGCAACGGTCAAAATGGTTCACACCCCGGTTATATGTCCTGGGAACAAGATGTGCTAGCGCCTCTAGCAGGGACAAACAAGGTGTACGCTCTGCAGGTGACCAATTGGTGGTCGCAGGTCAAGACAGCTGGTTCAGCGATCTACGCGAACAGACATTACCTGGAACTTCATCCGTCAACACCTGCAACCACTTGTCACATAATACCAGATGTATACATACATCCGACCGCTACAGTACATAGCAGCGCTGTTATAGGACCAAACGTGTCTATTGGCGCGGGGGTCACCATACAGGCGGGGGTACGAATAAAAGAGTCCATTGTTCTTAACAACGCGACTGTACATGAACACGCGCTTGTTATGTATACTGTTGTCGGTCAAGAGGCGTCAGTGGGTGAATGGTCCAGGGTTGAAGGCACTCCTTCAGACCCGGACCCCAACAAACCGTTTGCCAAAATGGACAATACACCGTTGTTCAACAGCGACGGAAGACTTAACCCCTCGATAACTATACTTGGGGCGGGTGTGGTGGTGCCGGATGAGATGATTCTTCTTAATTCCATAGTACTACCGCACAAACACCTGACGAGGAGCTTTAAACATGAGATCATATTATAG

Protein sequence:

>DPOGS213456-PA
MLKAVILIGGPQKGTRFRPLSLDTPKPLFPIAGLPLIQHHIAACVKLGECKEVLIIGSYTTTTMAQFVSDMQKEYKIIIRYLQEFTPLGTGGGLYHFRDQIRAGNPTAFFLLNGDVCADFPLKELWTFHEKTSQSLITIMGTEATRQQSVHYGCIVREPTSNSVTHYVEKPNSYISTLINCGVYVCSLQIFHTMADAFQRKQEGFYSGNGQNGSHPGYMSWEQDVLAPLAGTNKVFALQITIMGTEATRQQSVHYGCIVREPTSNSVTHYVEKPNSYISTLINCGVYVCSLQIFHTMADAFQRKQEGFYSGNGQNGSHPGYMSWEQDVLAPLAGTNKVYALQVTNWWSQVKTAGSAIYANRHYLELHPSTPATTCHIIPDVYIHPTATVHSSAVIGPNVSIGAGVTIQAGVRIKESIVLNNATVHEHALVMYTVVGQEASVGEWSRVEGTPSDPDPNKPFAKMDNTPLFNSDGRLNPSITILGAGVVVPDEMILLNSIVLPHKHLTRSFKHEIIL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: