MonarchBase - Protein-coding gene

DPOGS200014
Transcript	DPOGS200014-TA	1254 bp
Protein	DPOGS200014-PA	417 aa
Genomic position	DPSCF300225 - 233892-239358
RNAseq coverage	31x (Rank: top 75%)

Annotation
*Heliconius*	HMEL004522	7e-85	71.12%
*Bombyx*	BGIBMGA007977-TA	4e-12	25.82%
*Drosophila*	CG14142-PB	1e-84	45.79%
EBI UniRef50	UniRef50_Q7QC29	4e-115	53.33%	AGAP002421-PA n=2 Tax=Anopheles RepID=Q7QC29_ANOGA
NCBI RefSeq	XP_001601488.1	6e-115	51.07%	PREDICTED: similar to ENSANGP00000014790 [Nasonia vitripennis]
NCBI nr blastp	gi\|307196680	1e-114	52.27%	UPF0526 protein [Harpegnathos saltator]
NCBI nr blastx	gi\|347967834	9e-113	53.33%	AGAP002421-PA [Anopheles gambiae str. PEST]

Group
KEGG pathway
Orthology group	MCL16134		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS200014-TA
ATGAACACTATAATAAGGAAACAGGCGCTAGGAACATCGCAGGAAGAGTTTTATGAACGTGTGTTATACGCAAGAAACCGGCAAGTTGGTGCTCGACCTTCAGTGGTTGGTGGCAAACCTATTACTGAAGATTTGGCTATTGAGCTTCGTATAACAGCCTTTGGAACTGCGTCATGTCCGCCTCGTGGGGAGTGGATACACACTCCACTTGTGATGAGGCCACCTGATCATCCTTTAGCGTATGGCCTGGCAGCTCCCAGAAATGGAACTCGATCCCTACTGTCGGGTCTTCAGGCTCACATCATCAAATGGCTTCTGTTCGACTCCCGGCCTCTGACAAAAGATAACAAATCTGTGGAACCACCTGACAGTTACCTTCGTCCATCCGAAGAACGTCAAGAGGAAGCACTGTGGCGGGCGTGCAGTGAAGTTATCTGGCGCTGCGGTGGGGGTTTTAATGCCCAAACCGATACCAAGGTTACGGTGACACTTCCGACCAATCAAGTATACATACAACATAGTTCACAATATTACCAAGATGGAATCACTGAGATGCTGCACTTGTTTGAATTCAAAAGTTTGGAGGACCTGCAGATTTTTTTGAAGCGATATTTGTATTTGTTTCAGTCTGAAGACGGCTCCGGATCCTTGTTGCTGCTCTACGCCTGCATTTTATCAAGGGGTTGCGAGAATGTTAAAAAAGATCTTGATGGTAAACTGACCTATTTAGTTTCCACGCAAGTTGAAGGGTCTCTTAACGTGACGACTCTCCTACTCACGGGCCGTGCTACACCTTATTTGCATAACGGAGTACAATATGTGGGCGATGAAGATCATTATGCAATGCCGCAATTTGGCGTTCTATCCAGAAGTTCAGTAGGTCTTCTCGTATGGTACGGAAATGAGGAAAACGTCGGCTGCAACGTATCCAAACAGTACCCTGGATCTCGTCTGAAAACACCAGCAATGCCTATTTGGGTAACAAGTTGCTCAGGACACTATGGGGTACTGTTCAATACTAATCGCGAGCTTCTGAGAAACTATCACGCTGAAAGAAGGTTTGATATTCACTATTACACCTGTGGTGGATGCCACGTTCTCTTGAATGTGGACACTCGAGCTCACGAAGACATGGTGCAATTGAGAAATGATGACATCAGCGCCACACCGCTTGAGAAACTCATTCACACTAAGTGGCAAGACGCCAAGATCACTTGGTCTGGCCCCGTGCCCTTTGCGGATTCTCCCAACTAG

Protein sequence:

>DPOGS200014-PA
MNTIIRKQALGTSQEEFYERVLYARNRQVGARPSVVGGKPITEDLAIELRITAFGTASCPPRGEWIHTPLVMRPPDHPLAYGLAAPRNGTRSLLSGLQAHIIKWLLFDSRPLTKDNKSVEPPDSYLRPSEERQEEALWRACSEVIWRCGGGFNAQTDTKVTVTLPTNQVYIQHSSQYYQDGITEMLHLFEFKSLEDLQIFLKRYLYLFQSEDGSGSLLLLYACILSRGCENVKKDLDGKLTYLVSTQVEGSLNVTTLLLTGRATPYLHNGVQYVGDEDHYAMPQFGVLSRSSVGLLVWYGNEENVGCNVSKQYPGSRLKTPAMPIWVTSCSGHYGVLFNTNRELLRNYHAERRFDIHYYTCGGCHVLLNVDTRAHEDMVQLRNDDISATPLEKLIHTKWQDAKITWSGPVPFADSPN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: