MonarchBase - Protein-coding gene

DPOGS202836
Transcript	DPOGS202836-TA	2400 bp
Protein	DPOGS202836-PA	799 aa
Genomic position	DPSCF300018 + 896818-905624
RNAseq coverage	367x (Rank: top 32%)

Annotation
*Heliconius*	HMEL006291	1e-120	53.67%
*Bombyx*	BGIBMGA010509-TA	0.0	52.17%
*Drosophila*	CG7206-PB	3e-14	33.80%
EBI UniRef50	UniRef50_Q4RJ23	1e-33	38.37%	Chromosome 1 SCAF15039, whole genome shotgun sequence n=4 Tax=Tetraodontidae RepID=Q4RJ23_TETNG
NCBI RefSeq	XP_002422891.1	1e-24	29.45%	ubiquitin-protein ligase BRE1, putative [Pediculus humanus corporis]
NCBI nr blastp	gi\|47222183	5e-33	38.37%	unnamed protein product [Tetraodon nigroviridis]
NCBI nr blastx	gi\|307177599	4e-42	24.58%	Uncharacterized protein C1orf26 [Camponotus floridanus]

Group
Gene Ontology	GO:0005515	2.8e-05	protein binding
KEGG pathway
Orthology group	MCL22240		Insect specific

Nucleotide sequence:

>DPOGS202836-TA
ATGAGTTCCAAGAAATCTGATAATAATAAGCTACCAGATGGTTGGGTACTATGTCAATCAAAATCAATTCCGGGAAGGAAGTATTTTTTTAACAAAAAAACTGGGAAATCTTCGTGGTCCCAGCCCCAGGCTGATGACAAATCTGGTAGGATGACGTGTAAAAAAGAAAAATTAAGGAGACAAGAAAGAAAGCGGAGAGAGGAACTCGCCAAAAAGGCAGCCAAAAGGAAAAGTGATGTTAATGATGGAAGTGATTCAAGGAAAAGAACCAAAGGTGCTTCTGATGCAGGGTGCAGCTCTAGAGGTAGGCTGAAAGAAAGTCCTCATCATCATAGAAGGAGAAAAGAGTCATCACAACCATCACACAGCACTCCAAAAACCACTCCATCAAAATGTACACTCAGTAACTCTGTGTCTCCACAAAAACATTCCTCTTCAAAAAATACAGCAAATACAAGGCTTTCAAATCTAAGAGCAAAACTGGCAGCAGAAGTAAGAGAAGAAGACCTCAATCTTAAAAAGAAGGTCAGTCCTAAAACAAATAACGAAACACCACAGAAGAGTCAAAGAAGTGAGCAGAAAAGTCCCAGCCTAAATGATTCCAAATCAACTCAATCACCGAGCAGTGATAGTTCTCAATCAATGCCCTCACCCTCGCAGTTCTTTGCTGCTAATAAGATCATATCTTCAATGAAGGCTCAGTTGCCTGAGGAGTATTGTAATAAAGAGAAACAGAAGGATACTTTTGCGGATATTGAAAAGGGTATATGTAGCCAAACAACCGAGTACCCGTTTTCAAAGCACCCCGCTACACCCCCACAGTTCTCGGAAGCCAGCAAATTAGTATCGGCTATAAAATCCAAATTGGCATACAAAGGCTCCTCTTCGAAGGAAGGACTCAAAACATTTCCGTCAGCCAATGCCAGGCTGGAAGTTTTGAGGGCGAATCTGAGTATGGAGGCAGAACAAGAAATGGGGGATAGTTTTTTAAGTAAAAGTAATGATTCAGAACAAAGGGACATATCAGAGGCAATGGAGGTTGAAGAAATAAAAGAGGCCAAACATAATGAGACGTTTCTGAGGGACAGCACGTCGGGAGACGACCTGGTTTTGGTCATTGACACTAATATATTTATTCATGACCTTGACTTCATCAAGGTCGTCCTCAACTCACATATCAAAGGCTACAGCGAACAACCAACAGTCCTCGTTCCCTGGCGAGTGATCAACGAGCTCGACCGTCTTAAAGACAACAACAACGGTAACGGTTCCCTCTGCAAGAGGGCCAAGGCTGCTATGGACTATCTGTATAAATCACTACCAGAGAACAGCAGAATTAAAGGTCAATCATTGAGGGATGCCAATTCTCACATATACCCGTGCGAGGTTCCAGACGATGAAATATTGAACTGCAGCCTGCAGCAGCTGGAGAGAGACAAGAATGTTATACTGCTGACCAACGATAAGAACCTGTGTAACAAGGCCAGCATCAATAACGTGAAACACAGCAACGTCAGCGAACTGCAGAAACTGGTGGAGAACAAGCCACAGCCGCAGACCAGCGACCTGCGGGCCACCGTCAAGAGATACACCGAAGGAGTCTACCACCTCCTTGCCAACATACTGGAGAATGAGATGCGAGCCAAGTACAATGAGCTCTGGCAGCACGTGGTGTTCAAGCCGCCGCCCTGGTCGCTGGACGACGTCCTGCAGTGCCTGCTGAAGCATTGGATCGCCGTCTTCAACGAGGTGTTCCCCAGGATCGAGCATCTGTTGGCCGACCTCCGAACCAGCCTCATAACGATCGAGAAAAAAGAGCCGAGCACCCTGACGCAGTCCGAGGTGTCGACGTTTAAGGAGTTGTGTGTGGACGTGACCCGCCGCTGTCAGATCATCCCGGAGTACATGGAGCTGGCTAAGACCACCCTCGCGCAGCTGACGCGAGACGGAATCGCCCCGGACACCGTGGACGCCTTCGAGGCGCTCTGGACCGTGCTCTCCAGCTACTGCGCCAAGCTGGCTTCAGCGTTGGGCGTGTCTCACTGTATCGAGGACTCGGTGGGCGGCGAGGAGGGTCTGCAGCAGCTGGTGTCCAGGGTCGCCTCCGTCAGCTCGCACGTCAACAACCTGGCCGCCGCACTAGCTGGGGCCCTGGAGGGGGGAGCGGGCGGGGAGGGCGCGGAGGGTGTGAGTAGTCCGTCGTCTCGTCTGCAGCACGCCGTGCTATCCGCGCTGGCTGACTGCGGCCTGCGGGCGGCGCTGCGGCGGGACCAGCTGGTCGCCTTCTGCCAAGACTGCAGGAACATGTTGCAGGAGGCTCACGACAAGTTCTCGCAGCTGTCCGAGCTGCTGAGCGTGTGTCAGGGCAGACTGGCCACCGCCGTCCGCGACATGAACTGA

Protein sequence:

>DPOGS202836-PA
MSSKKSDNNKLPDGWVLCQSKSIPGRKYFFNKKTGKSSWSQPQADDKSGRMTCKKEKLRRQERKRREELAKKAAKRKSDVNDGSDSRKRTKGASDAGCSSRGRLKESPHHHRRRKESSQPSHSTPKTTPSKCTLSNSVSPQKHSSSKNTANTRLSNLRAKLAAEVREEDLNLKKKVSPKTNNETPQKSQRSEQKSPSLNDSKSTQSPSSDSSQSMPSPSQFFAANKIISSMKAQLPEEYCNKEKQKDTFADIEKGICSQTTEYPFSKHPATPPQFSEASKLVSAIKSKLAYKGSSSKEGLKTFPSANARLEVLRANLSMEAEQEMGDSFLSKSNDSEQRDISEAMEVEEIKEAKHNETFLRDSTSGDDLVLVIDTNIFIHDLDFIKVVLNSHIKGYSEQPTVLVPWRVINELDRLKDNNNGNGSLCKRAKAAMDYLYKSLPENSRIKGQSLRDANSHIYPCEVPDDEILNCSLQQLERDKNVILLTNDKNLCNKASINNVKHSNVSELQKLVENKPQPQTSDLRATVKRYTEGVYHLLANILENEMRAKYNELWQHVVFKPPPWSLDDVLQCLLKHWIAVFNEVFPRIEHLLADLRTSLITIEKKEPSTLTQSEVSTFKELCVDVTRRCQIIPEYMELAKTTLAQLTRDGIAPDTVDAFEALWTVLSSYCAKLASALGVSHCIEDSVGGEEGLQQLVSRVASVSSHVNNLAAALAGALEGGAGGEGAEGVSSPSSRLQHAVLSALADCGLRAALRRDQLVAFCQDCRNMLQEAHDKFSQLSELLSVCQGRLATAVRDMN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: