MonarchBase - Protein-coding gene

DPOGS215088
Transcript	DPOGS215088-TA	894 bp
Protein	DPOGS215088-PA	297 aa
Genomic position	DPSCF300187 + 214847-218605
RNAseq coverage	1429x (Rank: top 9%)

Annotation
*Heliconius*	HMEL021736	1e-139	80.94%
*Bombyx*	BGIBMGA007187-TA	2e-135	80.81%
*Drosophila*	CG8132-PA	1e-84	54.61%
EBI UniRef50	UniRef50_UPI000224781E	1e-99	60.00%	UPI000224781E related cluster n=2 Tax=unknown RepID=UPI000224781E
NCBI RefSeq	XP_001599587.1	5e-101	58.51%	PREDICTED: similar to ENSANGP00000002264 [Nasonia vitripennis]
NCBI nr blastp	gi\|345492977	4e-99	60.00%	PREDICTED: hypothetical protein LOC100114668 [Nasonia vitripennis]
NCBI nr blastx	gi\|322800350	4e-97	62.13%	hypothetical protein SINV_03107 [Solenopsis invicta]

Group
Gene Ontology	GO:0006807	1.4e-84	nitrogen compound metabolic process
	GO:0016810	1.4e-84	hydrolase activity, acting on carbon-nitrogen (but not peptide) bonds
KEGG pathway	nvi:100114634	2e-100
	K13566 (NIT2)	maps->	Alanine, aspartate and glutamate metabolism
InterPro domain	[22-291] IPR003010	1.4e-84	Nitrilase/cyanide hydratase and apolipoprotein N-acyltransferase
Orthology group	MCL11261		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS215088-TA
ATGTGTGATAGTGCAATAGATGCGGTACATCCGCGATTTTCAAAGAAACCGATGTTTTATCAAACTGGGTTTAAAATAGCGCTCATCCAACTATCTGTTGGCCCGGACAAAGCAAAAAATGTAGCCGCTGCTGTCAGTGAGATACACAAAGCTAAAGCGAAAGGGGCTCATGTAGTAGCTCTGCCAGAGTGTTTCAACTCTCCATATGGAACTAAATATTTCAATGAGTACGCGGAGGAAGTACCGTCGGGGGCCACGAGCCGAGCGTTATCAAGAGCAGCGGCGGAGGCGGGCGTGTGTGTGGTCGGAGGGACCGTGCCTGAGCGGTGTGGCGATAGACTATATAACACTTGTACCGTTTGGGATGACAGTGGGAAGCTACTGGCTCAGTATAGAAAGATGCACCTCTTTGATATAGACATCCCGAACAAGATAACGTTCAAGGAATCCGAAGTACTGAGCGCTGGTGACCAAGTGACTACCTTCGACTACCGCGGAGTTAGAATCGGTATCGGGATATGTTACGACATACGCTTCCCCGAACTCGCGCATCTCATGGCCCAACAAGGGTGTTCCATGTTGCTGTACCCGGGCGCGTTCAATATGACGACCGGCCCCAAGCACTGGGAGCTGCTGGGCCGGGCTCGGGCCAACGATTGTCAGTTGTGGGTGGGCCAGATCAGCCCGGCGAGGGACGCGGCCGCGGGGTACGTCGCCTGGGGACATTCCATCCTCGTCGACCCCTGGGGTCAGGTCAAGGGTCAGCTTGACGAACGACCCGGCGTCATTATCGAGGACATCGATCTGAAGGTAGTTGAAGAAGTCAGGTGTCAAATACCAATAAGAATACAAAGAAGAACCGATGTCTACGACACGGTGTCCGTGAAACAGTGA

Protein sequence:

>DPOGS215088-PA
MCDSAIDAVHPRFSKKPMFYQTGFKIALIQLSVGPDKAKNVAAAVSEIHKAKAKGAHVVALPECFNSPYGTKYFNEYAEEVPSGATSRALSRAAAEAGVCVVGGTVPERCGDRLYNTCTVWDDSGKLLAQYRKMHLFDIDIPNKITFKESEVLSAGDQVTTFDYRGVRIGIGICYDIRFPELAHLMAQQGCSMLLYPGAFNMTTGPKHWELLGRARANDCQLWVGQISPARDAAAGYVAWGHSILVDPWGQVKGQLDERPGVIIEDIDLKVVEEVRCQIPIRIQRRTDVYDTVSVKQ-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: