MonarchBase - Protein-coding gene

DPOGS210600
Transcript	DPOGS210600-TA	1908 bp
Protein	DPOGS210600-PA	635 aa
Genomic position	DPSCF300168 - 29343-32536
RNAseq coverage	199x (Rank: top 47%)

Annotation
*Heliconius*	HMEL005897	0.0	85.71%
*Bombyx*	BGIBMGA014415-TA	7e-52	81.30%
*Drosophila*	CG5222-PA	0.0	51.76%
EBI UniRef50	UniRef50_Q95TS5	0.0	51.76%	CG5222 n=30 Tax=Neoptera RepID=Q95TS5_DROME
NCBI RefSeq	XP_002433242.1	0.0	52.42%	conserved hypothetical protein [Pediculus humanus corporis]
NCBI nr blastp	gi\|242025660	0.0	52.42%	conserved hypothetical protein [Pediculus humanus corporis]
NCBI nr blastx	gi\|350408420	0.0	53.07%	PREDICTED: integrator complex subunit 9-like isoform 2 [Bombus impatiens]

Group
KEGG pathway
InterPro domain	[307-428] IPR022712	1.1e-11	Beta-Casp domain
Orthology group	MCL14249		Single-copy universal gene

Nucleotide sequence:

>DPOGS210600-TA
ATGAAACTGTATTGTTTAAGTAGCGACGCGGCCAAGCCATGCTTCGTGTTATCGTTCAAGGAGCTCTTGATCATGTTAGACTGTGGATTGTCAGCGCACTCCGTGTTGAACTTCCTTCCACTACCACCAGTACCAAGTACAAGACTTGCCTCACTGCCCAACTATACTCCACCACATGTCAACGACCCTCTACTAGAAGGGGAACTCAAGGAATGCTGCGGTCGTGTCTTTGTGGATAGTGTACCAGAATTCTGTCCACCCCTCGATAAGGTGGTAGACTTCTCCCAGCTGGACGTCATTCTAATATCCAACTACACATGTATGATGGCTCTGCCCTTCATAACGGAAGACACGGGTTTTAAAGGACAAGTTTACGCGACCGAGCCCACTCTCCAGATAGGCAGGTTCTACCTCGAGGAGCTCTCGGAGTGGGTGTCGGGGAGCGGCGGCGGCGCGGGCGCGGCCAAGAGATGGAAGGAGCTCGTACACTTGTTACCGCCGCCTCTGGCCTCTGCGCTCCGGCCGCGAGCCTGGCGTCGCCTGTTCTCGCCCGGGGCTCTAGCGCGCGCTCTGTCGAGGGTTCGGGTCGTGGGCTACGACGAGCGAGTCGACATCTACGGTGCGCTCGACGCCACAGCCGTCAGCTCGGGGTTCTGCCTCGGCTCCGCGAATTGGGTTCTGCGGTCGGCGCACGAAAAGGTGGCTTACGTGAGCGGCTCCAGCACCCTGACCACTCACCCGCGACCCATCAACCAGGCTGCGCTGCGAGGCGCCGATCTCCTGGTGCTGGCCGCCCTGACGCAGACTCCGGCGCACAACCCCGACCACATGTTGGGAGACCTGTGCGTGCACGCCACCGTGACACTGCGGGCGGGCGGCTCCGTGCTGTGTCCGGTGTACCCGAGCGGCGTGCTCTACGACTTGTTGGAGTGTCTCTCGGCTCACCTGGAAGGCGCGGGCCTAGCTCACGTGCCGCTGTACGTGGTCTCGCCCGTCGCCGACTCCTCCTTGGCTTATAGTAACATCCTCGCGGAGTGGGTATCGGTGGGTAAGCAGGCGCGCGTCTACCTCCCCGAGGAGCCATTTCCTCACGCGGCACTCGTCCGCGCGGGCCGCCTCAAGCACGCCCGCTCCCTACACGACGACGCCTTCAGCGCGGACTTCCGTCAGCCCTGCGTCGTATTCTGCGGTCATCCGAGTCTGCGGTTCGGAGCGGCCGTCCACCTCGTTGAGCTCTGGGCGAACAATCCCGCTCACGCCATAATATTTACCGAGCCGGACTTCCCTCACGCTGAGGCGCTCGCCCCCTTCCAGCCACTGAGCATGAAGGCCTTCCACTGTCCGATAGACACGTCCCTCAACTACTCACAGGCCAACAAGCTGGTCCGCGAGCTGCGGCCGCGCGAGTTGGCCCTGCCCGAGCAGTATGCGGCGTCCGGCGGGACGGCGGCGGGCGGCGGGGCGGCGGCGAGCGGCGGGGCAGGCGGAACGAGACCTCACATCGGCGCTGACGTGCCGACTGTGGTGGTCCGGCGCGGAGCCGCGCGGTCTCTGGGCCTCCGGGCCGGTCTGCGCGCAGCGCCCCTGACAGCCGCCTTGCGCGTGCGTGACGCGCGCCTCGAGCTTGTAGCACCGGCGGCGTGCGGAACTCCCGGCACGGAGGCAGCCCCGGCGCCCGTCCTACACTGGAGCGCCCTGGACGTGGAAGCGCTGGTGCGGGCGCTGGCAAGGGAGGGCGTGTCGGAGGCGCGGGTAGAGGCGGGCGCGGACGGCTGTATAGTGCATCTCCCGCGACACGACACGCTGGTCCACGTCGAGCGACACGCCACTCACGTGTTCTGCGAGGGTCGCTCGGACGTGCGTCAGGCGCTGAGACGGGCGCTGGCCGCGTGTCTGCCACACATCTAA

Protein sequence:

>DPOGS210600-PA
MKLYCLSSDAAKPCFVLSFKELLIMLDCGLSAHSVLNFLPLPPVPSTRLASLPNYTPPHVNDPLLEGELKECCGRVFVDSVPEFCPPLDKVVDFSQLDVILISNYTCMMALPFITEDTGFKGQVYATEPTLQIGRFYLEELSEWVSGSGGGAGAAKRWKELVHLLPPPLASALRPRAWRRLFSPGALARALSRVRVVGYDERVDIYGALDATAVSSGFCLGSANWVLRSAHEKVAYVSGSSTLTTHPRPINQAALRGADLLVLAALTQTPAHNPDHMLGDLCVHATVTLRAGGSVLCPVYPSGVLYDLLECLSAHLEGAGLAHVPLYVVSPVADSSLAYSNILAEWVSVGKQARVYLPEEPFPHAALVRAGRLKHARSLHDDAFSADFRQPCVVFCGHPSLRFGAAVHLVELWANNPAHAIIFTEPDFPHAEALAPFQPLSMKAFHCPIDTSLNYSQANKLVRELRPRELALPEQYAASGGTAAGGGAAASGGAGGTRPHIGADVPTVVVRRGAARSLGLRAGLRAAPLTAALRVRDARLELVAPAACGTPGTEAAPAPVLHWSALDVEALVRALAREGVSEARVEAGADGCIVHLPRHDTLVHVERHATHVFCEGRSDVRQALRRALAACLPHI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: