MonarchBase - Protein-coding gene

DPOGS212498
Transcript	DPOGS212498-TA	2049 bp
Protein	DPOGS212498-PA	682 aa
Genomic position	DPSCF300222 + 163662-169068
RNAseq coverage	155x (Rank: top 53%)

Annotation
*Heliconius*	HMEL009506	2e-127	67.84%
*Bombyx*	BGIBMGA010224-TA	2e-96	58.36%
*Drosophila*	CG7183-PA	9e-33	33.33%
EBI UniRef50	UniRef50_E2BN32	7e-43	42.39%	Uncharacterized protein C3orf19-like protein n=4 Tax=Formicidae RepID=E2BN32_HARSA
NCBI RefSeq	XP_001603880.1	2e-39	40.06%	PREDICTED: similar to GA20163-PA [Nasonia vitripennis]
NCBI nr blastp	gi\|307180415	9e-43	39.80%	Uncharacterized protein C3orf19-like protein [Camponotus floridanus]
NCBI nr blastx	gi\|347965547	6e-53	30.10%	AGAP001231-PB [Anopheles gambiae str. PEST]

Group
KEGG pathway
Orthology group	MCL12523		Single-copy universal gene

Nucleotide sequence:

>DPOGS212498-TA
ATGAATGGACAAAATTCAAAAGAGATTTTCTTTGATAAATCAATTTTATTAAGTTTGAAGGCAGAATTACTGAAGAAAAAAGAGGAGGCTTTAGAAAAGAAACACTTGCCTCAGCATAATGTTCAGAACTTCAAGCCTTCTATTAGTGAAAAGAAAAACAAATCTGAGAGCAATAAAACCAGTTTAAAAGACAAGTTAAAAGTTATTGACACTGATGAGTTTGAAGCATGCAGGAAGTCAAAAGCTGCCTTAGAGAAGAAAGCTGAATTGTATGAGCATTTAGCAGATAATGTGGGAGATTCAAAGCTTGCTGGTCAGTTTTTGGTAGATTTTAAGGGTAAAAAACAAGAGACCATACAACATCCGAAACAAGATGAAACGGAGGAAAAAGAAGATGTTTTTCATGAAGAAGATGAAAGCGAATGGATCGAATTTACCGACTTCTTGGGGAGGACACGTAAGTGTCTTAAGTCAGATTTGGATTATTACCAGAGACGTGATCAGGAGTTAAAGAAAATAGTCACAAATGAACCCGCAGACGATAAAACTGATACAATGGAGCAGAGTTCGAAAGAAGCAGAGAAGCCATTGTTAGTGCAGAAGACGAATGACTATCTCCAGTCATTGAGAGAGAAATGGGAGCAAAAGGAAAGAGAGCTGTTAGCTAAAGAGAAGGATATCCATTATCAGGACTTACTATTTGATGAGGCAAGAATCCACGGCGTGGGCTACTACTCCTTCAGTACAGATGAGACGGAAAGAAAGAAACAAATGGAGGAATTGATAAAGACGAGGAAAGAAACATTAAAAGCACAGGAAGAGGCCGAGAAGCTTAGGAAAGAGAGAGATGATATGATAGCAGCTAGAGTTGCAGCTGCTAGAGCGAGACAGAGAATGAGGGCGGGGCTACCACCAGAAGATCCTGAAGTGCCTTCTGAGCAGAGTTCGAAAGAAGCAGAGAAGCCATTGTTAGTGCAGAAGACGAATGACTATCTCCAGTCATTGAGAGAGAAATGGGAGCAAAAGGAAAGAGAGCTGTTAGCTAAAGAGAAAGATATCCATTATCAGGACTTACTATTTGATGAGGCAAGAATCCACGGCGTGGGCTACTACTCCTTCAGTACAGATGAGACGGAAAGAAAGAAACAAATGGAGGAATTGATAAAGACGAGGAAGGAAACATTAAAAGCACAGGAAGAGGCCGAGAAGCTTAGGAAAGAGAGAGATGATATGATAGCAGCTAGAGTTGCAGCTGCTAGAGCGAGACAGAGAATGAGGGCGGGGCTACCACCAGAAGATCCTGAAGAAAAGAAAAAAGATTTTACCACATGCCTATTACAATTCCTCACTCAACAAAAGGACGAAGCTGACAAAAAAGCGAAGGAAGAAGAGGAGAAGGCTAAGAAAGAAAGAGAAGAAGAGAGACAGAAGCTTCGTGAAGCTTACATACGAGAATGGGATGTAGGGAAGGATGGACTTCAGGGAAATGTAAAGAAGTTCAGAGAAATGTCCCAAGAAGAGTACGTCGAACAGCAGAGAGCTAAGAGGATAAACGAATTCGCACCACCACAGTCCTCTACGAGAGAAAAATCAATGTATACCTTCAACAAGGACGGCAGAAAAATCGATAGTGATAATAAAACGAAATCCTGGTCCGAGGTCAGACCGATGAATACTCCGCCGCCGCCGAATATATCGGATATAACCGATGATACAAACAAAGGGTTATATTTTACAACCAAGAAACCCGAAACTATAGTTAAATATAAAAATTTCATCAAGGCAATCGAACCTACGGCTATTGTCAATGAATTAAGTGATGATGAAGAGGATGTACAAAGACAGTCTGAAGGAAACGTTAGTTGTAATAAAGCAGAAATATCGCCTCCACCGACATACGAATATTACGGCCCTGAGGCTAAATATAGAAAAGCCGATAAACCTTTCAAATCAGATATACGAGAAGCCATGGAACAAGGCGCGCGAAGTCTGGAGACTAAGGAGAGCAGTAGAAAAATAGGAAAGCAGTACGATTTCACTTTTGATTGA

Protein sequence:

>DPOGS212498-PA
MNGQNSKEIFFDKSILLSLKAELLKKKEEALEKKHLPQHNVQNFKPSISEKKNKSESNKTSLKDKLKVIDTDEFEACRKSKAALEKKAELYEHLADNVGDSKLAGQFLVDFKGKKQETIQHPKQDETEEKEDVFHEEDESEWIEFTDFLGRTRKCLKSDLDYYQRRDQELKKIVTNEPADDKTDTMEQSSKEAEKPLLVQKTNDYLQSLREKWEQKERELLAKEKDIHYQDLLFDEARIHGVGYYSFSTDETERKKQMEELIKTRKETLKAQEEAEKLRKERDDMIAARVAAARARQRMRAGLPPEDPEVPSEQSSKEAEKPLLVQKTNDYLQSLREKWEQKERELLAKEKDIHYQDLLFDEARIHGVGYYSFSTDETERKKQMEELIKTRKETLKAQEEAEKLRKERDDMIAARVAAARARQRMRAGLPPEDPEEKKKDFTTCLLQFLTQQKDEADKKAKEEEEKAKKEREEERQKLREAYIREWDVGKDGLQGNVKKFREMSQEEYVEQQRAKRINEFAPPQSSTREKSMYTFNKDGRKIDSDNKTKSWSEVRPMNTPPPPNISDITDDTNKGLYFTTKKPETIVKYKNFIKAIEPTAIVNELSDDEEDVQRQSEGNVSCNKAEISPPPTYEYYGPEAKYRKADKPFKSDIREAMEQGARSLETKESSRKIGKQYDFTFD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: