MonarchBase - Protein-coding gene

DPOGS203051
Transcript	DPOGS203051-TA	1362 bp
Protein	DPOGS203051-PA	453 aa
Genomic position	DPSCF300206 + 47243-48839
RNAseq coverage	218x (Rank: top 45%)

Annotation
*Heliconius*	HMEL016147	5e-154	63.04%
*Bombyx*	BGIBMGA006541-TA	5e-117	53.79%
*Drosophila*			%
EBI UniRef50	UniRef50_E1ZZM4	7e-31	31.15%	Uncharacterized protein C17orf85 n=6 Tax=Formicidae RepID=E1ZZM4_CAMFO
NCBI RefSeq	XP_001605907.1	2e-26	28.65%	PREDICTED: hypothetical protein [Nasonia vitripennis]
NCBI nr blastp	gi\|307188717	2e-30	31.15%	Uncharacterized protein C17orf85 [Camponotus floridanus]
NCBI nr blastx	gi\|332030494	2e-35	26.98%	Uncharacterized protein C17orf85 [Acromyrmex echinatior]

Group
Gene Ontology	GO:0000166	1.6e-08	nucleotide binding
KEGG pathway
InterPro domain	[93-144] IPR019416	1.4e-12	Protein of unknown function DUF2414
	[103-161] IPR012677	1.6e-08	Nucleotide-binding, alpha-beta plait
Orthology group	MCL17807		Insect specific

Nucleotide sequence:

>DPOGS203051-TA
ATGGAACACGACAAAGAGGAAGGAGAAATGAGCGATGACCATGAAATGCTTATTGACGATCAACCCCTTGATAGTCCAACTAAAAGCACTGTGGTTTTTATCGCAGATAAAAATGGACTTTTGGTTCAACAATTAGAAAAAGTTGATGCTTGTAGACTTGAGGAAAGGGCTAAAAGATTTGGTTTAAACTTGACTGGAAATAGGATTGTAACACAAAAACAGATTGACGAACTGTATAATAATTTTGGTATTGAAGGTGGAAATGAAAGACATTTCAGATTTGATACACTTCATTTAAATGGTGTCAATGGTTTAATAACAAAGGATATATTTGAGTATTTGGTAGATTACAAGCCAGTATCTCTAGAATGGGTTGATGATAATTCATGTAATGTTGTTTGTCAGGACCATATATCTGCTGCATTGGCATTATTGGTACATTCCAGGGAAATTAAAAGTGAACACATTAAAGATATGCTGCAAAAAAAATCTTCACATTACTGGAGAGAAGGTGTTCCACACCCAAATAAAGACTTGATTTTAATGAGATTTGCTACAAATAGTGATAAGAAGTCAACAAAAGTTGAACCTGAACAAAAACATAGACTAGACTCTGACAAGAATATAAATAATGAGGGTAAGAATCCCTGGGGTGACTTGTGCAGGTCCTGGGGCATCTATGATCACCAAGAAGTGTTTCAAAGAAATTTATCAAAAACTGACTATGAGGAAGAACTTGAAGAACCATTTGAAAAAGTCCAAGTTAGGAACAAGAAGCTAGCTTCACGGCTTGGTAAAAGAAACCATAGTATAGAGGTTGCCACCAGTGATTCCGATTCTGAGTGGAAGAAGAAGTCTAAGACACCCAGAATGAGAATGCGAGCTGACGATGAGGAGTCAAAGCAAAAGAATCACAATCAAACGAAACAAAATGATTCAGATGAAGATGATTATGCACCCTTGTCAATAGAAATTCTGAACTCCAGTAGTAAATTCACTTCTAAACATTCGAAGAGAATATCTGAGAAATTTAGGAATTCAGACCAACATTTCAAGAGCATGCCTCGGAATGTACACTCAAGATTAGGTATCAAAGTAGTGGATAATGAAAGAAGTTATAGTGATGAATCTTCATCAAATGAATCAGACTATAATGTAACAAGCCGGGTGCAAAAAGTAACAACTGGTTCTAAAAATACATCAAATGTTTGGTCACGATTGGAGATTAAACCCAAGAATTCAGGACAGAAAGATTTGAGACAAATATTAACAACACGTAAACCTAAACATAAAGACGATTTAAGAGACAGACTTGGGAAGTCAAAACAATGTAATATTCGCATAGAAATAGACAATAGTTAA

Protein sequence:

>DPOGS203051-PA
MEHDKEEGEMSDDHEMLIDDQPLDSPTKSTVVFIADKNGLLVQQLEKVDACRLEERAKRFGLNLTGNRIVTQKQIDELYNNFGIEGGNERHFRFDTLHLNGVNGLITKDIFEYLVDYKPVSLEWVDDNSCNVVCQDHISAALALLVHSREIKSEHIKDMLQKKSSHYWREGVPHPNKDLILMRFATNSDKKSTKVEPEQKHRLDSDKNINNEGKNPWGDLCRSWGIYDHQEVFQRNLSKTDYEEELEEPFEKVQVRNKKLASRLGKRNHSIEVATSDSDSEWKKKSKTPRMRMRADDEESKQKNHNQTKQNDSDEDDYAPLSIEILNSSSKFTSKHSKRISEKFRNSDQHFKSMPRNVHSRLGIKVVDNERSYSDESSSNESDYNVTSRVQKVTTGSKNTSNVWSRLEIKPKNSGQKDLRQILTTRKPKHKDDLRDRLGKSKQCNIRIEIDNS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: