MonarchBase - Protein-coding gene

DPOGS201225
Transcript	DPOGS201225-TA	1560 bp
Protein	DPOGS201225-PA	519 aa
Genomic position	DPSCF300037 - 556930-561612
RNAseq coverage	467x (Rank: top 27%)

Annotation
*Heliconius*	HMEL008947	4e-80	33.52%
*Bombyx*	BGIBMGA008002-TA	2e-176	61.76%
*Drosophila*	CG7910-PA	2e-107	40.27%
EBI UniRef50	UniRef50_D6W8X8	1e-115	45.71%	Putative uncharacterized protein n=1 Tax=Tribolium castaneum RepID=D6W8X8_TRICA
NCBI RefSeq	XP_967870.1	2e-116	45.71%	PREDICTED: similar to amidase isoform 1 [Tribolium castaneum]
NCBI nr blastp	gi\|91076824	4e-115	45.71%	PREDICTED: similar to amidase isoform 1 [Tribolium castaneum]
NCBI nr blastx	gi\|91076824	5e-118	46.90%	PREDICTED: similar to amidase isoform 1 [Tribolium castaneum]

Group
Gene Ontology	GO:0016884	2.6e-177	carbon-nitrogen ligase activity, with glutamine as amido-N-donor
KEGG pathway	dpo:Dpse_GA20678	2e-104
	K01426 (E3.5.1.4, amiE)	maps->	Styrene degradation
			Benzoate degradation via CoA ligation
			Arginine and proline metabolism
			Tryptophan metabolism
			Phenylalanine metabolism
			Cyanoamino acid metabolism
InterPro domain	[24-519] IPR000120	2.6e-177	Amidase
	[28-518] IPR023631	1.4e-102	Amidase signature domain
Orthology group	MCL15412		Insect specific

Nucleotide sequence:

>DPOGS201225-TA
ATGGAGGTAGGAGTTTGGATAGTTGGCGTGTTATTAAGGGTCCTGTGCTTCATCACGGCTCCGTTTTTCTGGCTGCGAACCCGCAAGGAGCAGAGAGTGCCTCCGATCAAGGACCCACTGCTTATGAAAAGCGCGACAAAGTTGGCGGCTGAAATACGTAACGGGGAGTTGACTAGTGAAAATCTAGTGTCGAGATACGTATTGAGGATACAAGAAGTCAATCCGTACATCAATGCCGTGGTCGAAGATCGTTTCCAAGCCGCTATGGAGGAGGCGAGGGATGTTGATAGGAAGATATCCGAGGCTCGAGGAAGAGGGGACCTGGACAAGTTGGTAGCTGACAAACCATTGCTCGGTGTACCTTTCACTGTTAAGGAAAGTTGCTCACTCGCCGGTATGTCCAACTCCGTGGGTTGCTTGGAGTTTTTGGGTCGTCGGGCGTTAACAGACGGCGGGGGTGTGAGTCGCGTGCGGGCCGCGGGTGGAATCCCCCTGCTGGTGTCAGCGACCCCTGAACTGTGTCTGGGCTGGGAGACGACCAGCTTACTGCGAGGGCACACCAACAACCCCTATGGCCTCGCGAGGACGCCGGGAGGATCTTCAGGAGGGGAGGCGGCGTTAGTATCGTCGGGAGCGTCTGTCATATCAGTGTCGTCGGACATCGCCGGCTCCATCAGGATACCCGCAGCTTTCTGCGGTCTCTATGGACACAAACCCACGCCAGGTATAATTCCAATCTCCGGTCACATTCCGACTCTCCAGGACGAGCAATACGCTCGTTTCCTGACCGTGGGTCCCATCACTCGTTACTCCGAGGACCTGCCGCTGATGATGAAGGTGTTGGCGGGGGACAGGGCGCACGAATTGGATCTCGACACGCCAGTCGCCTTACACGAGTTAAAGGTGTACTTCATGACGGAGGCGTCTCGCTCCGTGGCGTTCTCCCCGGTGGAGCTGAGCATTCAGCGAGCGATCTTGGCGGCCGTGCAGCACCTGAAGAGCCGCGGCGCCACCGTCTGTGAGGACAAGTTCAACGACTTCGAGGACGCGGTCGAGATGTCGGCGTCGGTGTTCTTCTCGATGAAAGACATTCCCAACATGTTGCAGGACCCGGCCAACCCTAAGCGCGAGAAGAACCTGATACTTGAAACTTTGAAGACGTTACTCGGCTCGGGGTCGAGGACTTTGCAGGCGCTCGGCTTCGAGGTTCTGAAGAGGAAGAGGCTGTTCGTACCCAAAGAGAAGGTCCCCCACTACATAGAGAGGACTGACAGACTGAGAGAAACGATGGAGCGCGCCCTGGGCTGTTCCGGCGTGTTCCTGTTCCCGAGTCACTCGTGTTCGTGTCACGCCCACGGCGGCGTGTTCGTAAAGGCGGCGGGCGTTGTGTACACGATGCCGTTCAACGCGCTGGGTCTCCCGGCTACGTCGGTCCCGATCCCGGGCCCCGGGCCTCGGCCCGTCGCCGTGCAGGTGGTGGCGGGCCCAGGACAGGATCGGCTCTGCCTGGCGGTCGCCCGGGAGTTGGAGAACAAGTTCGGTGGCTGGACTCCCCCTTAA

Protein sequence:

>DPOGS201225-PA
MEVGVWIVGVLLRVLCFITAPFFWLRTRKEQRVPPIKDPLLMKSATKLAAEIRNGELTSENLVSRYVLRIQEVNPYINAVVEDRFQAAMEEARDVDRKISEARGRGDLDKLVADKPLLGVPFTVKESCSLAGMSNSVGCLEFLGRRALTDGGGVSRVRAAGGIPLLVSATPELCLGWETTSLLRGHTNNPYGLARTPGGSSGGEAALVSSGASVISVSSDIAGSIRIPAAFCGLYGHKPTPGIIPISGHIPTLQDEQYARFLTVGPITRYSEDLPLMMKVLAGDRAHELDLDTPVALHELKVYFMTEASRSVAFSPVELSIQRAILAAVQHLKSRGATVCEDKFNDFEDAVEMSASVFFSMKDIPNMLQDPANPKREKNLILETLKTLLGSGSRTLQALGFEVLKRKRLFVPKEKVPHYIERTDRLRETMERALGCSGVFLFPSHSCSCHAHGGVFVKAAGVVYTMPFNALGLPATSVPIPGPGPRPVAVQVVAGPGQDRLCLAVARELENKFGGWTPP-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: