MonarchBase - Protein-coding gene

DPOGS208052
Transcript	DPOGS208052-TA	1797 bp
Protein	DPOGS208052-PA	598 aa
Genomic position	DPSCF300203 + 294482-313056
RNAseq coverage	107x (Rank: top 60%)

Annotation
*Heliconius*	HMEL017810	1e-143	62.16%
*Bombyx*	BGIBMGA001479-TA	5e-105	50.20%
*Drosophila*	CG42404-PE	2e-36	45.99%
EBI UniRef50	UniRef50_Q9VFA8	3e-34	45.99%	CG42404 n=7 Tax=melanogaster group RepID=Q9VFA8_DROME
NCBI RefSeq	NP_650437.3	6e-35	45.99%	CG42404 [Drosophila melanogaster]
NCBI nr blastp	gi\|386765830	1e-33	45.99%	CG42404, isoform D [Drosophila melanogaster]
NCBI nr blastx	gi\|345488191	2e-38	29.50%	PREDICTED: hypothetical protein LOC100121790 [Nasonia vitripennis]

Group
KEGG pathway
Orthology group	MCL20715		Insect specific

Nucleotide sequence:

>DPOGS208052-TA
ATGGCTCAAGGCGAGTGTATAGACTTCCGTGGCAGACATATATCAAACGGTTTGCATTATGTGCCCGGCCCCGATACATGTACGCTTTGCATCTGTGAAAATGGTTTGCCTAAAGTGTGTAAGGCTGTCTTGTGTTCACCCCCACAAGATTGCCGATCATTCCGTTTGGGCAATACTTGCTGTGAGTTCATTTGTCTTGATGATGTAGTGAAACCCACTGATGGGGCGGAGGCGAATATCAGGGTTGCGGCATCAGGAGCTGCTTCAGTGGTCCTGTTAACTATAGCCCTTGTTGTATATAGAGTGAGGAAACAAAAACGACGTAGGCCTCTGCATGCCGAAGACCAAAGAAGTTTGACTAGTATTGGATATATTAGTGGCAGTATGGGGTACATGGGAGGTACTTGTGAAACAGCTCAACTGGGTGCCTGGAAGCCTCCTTCGAACTATCTTCCTAGAGGAGAAGCACCACCACCATATGAAGAGGCTATGGCACAATGCAGATCTGATCCTATGAGAGTAACAAACGAAACATCTTTCCACCGTTCATACCCTTTGGAGCCTCGAGATGAAGTGTGCGCGACCCACGCCTATGTCAATCTACCACGACCACTCGTGCAGATGGCCAATACCCAGAATTGCTACAACGCTCCACTCCTACAACCAGTACACCCGCCTGAAGCCAGGGAGGCGATCGTCATGCCGCATCCATTGGTAGCTAATATGGGGGTTGGGGGTCGCCTGACGGGGTCGCTGGGGGCTATCAGCGCCCGCCTCAGCGTACCCCGCGATGACCACGAACGTGACAGAGTCGAACGTGTCGAACGACCCCACAATGTCCCCGGCTTCTACACCACACACACGGCATTACACCGCACTATACCACGTATATCGACAGCCCTGGACACGTCCACACTAGAAGCGATGGGTTTCAGTCGAGCGGACCGGTCCCTGGCGGGGGAGGTGAGGAGATCCTTCCACAGACCAGACGCCAGGGAGAGAGACAGACCTCACACCGGGAGGAGCGTGCCCAGGAACCTGAACATCGCGTCCGCCTCGCCCGCACACGAACAGGAAGACGATCTCGCTGTGCGGCCCCGTCTCCACAGTGTCCACAACGATGAAGACAAAAAGGAGTTGACACCACACAACCACCCGACACTACCTCTTACTGTGGACAAACCATCCTGCGAGTGTAGCTACGAGGCAGCTCGCGACGCTGACGATTATCGCAGCGAGTGTGAGAACTGTCACTCAACCAACAACTCGGGTTGGGAGGAGGGCGGTAGTGAGTGGTGCGGCGGAGGAACACAGACGCTGCAGAGACGAGCGCCGCCGCCGCCCGCACAGCCCGCCGCCACCGCTACACTGCCGCAGCCGGTCACTAAGGGACAGGGTCTCGCTGTGCGGCCCCGTCTCCACAGTGTCCACAACGATGAAGACAAAAAGGAGTTGACACCACACAACCACCCGACACTACCTCTTACTGTGGACAAACCATCCTGCGAGTGTAGCTACGAGGCAGCTCGCGACGCTGACGATTATCGCAGCGAGTGTGAGAACTGTCACTCAACCAACAACTCGGGTTGGGAGGAGGGCGGTAGTGAGTGGTGCGGCGGAGGAACACAGACGCTGCAGAGACGAGCGCCGCCGCCGCCCGCACAGCCCGCCGCCACCGCTACACTGCCGCAGCCGGTCACTAAGGGACAGGGCCGTAACGGAATGGGCAACCCTTCGAACTGGGAGAACTGGTTCAATACGATCCCAGACTCCGACAGCGAGTCAGAAGAGGAATGA

Protein sequence:

>DPOGS208052-PA
MAQGECIDFRGRHISNGLHYVPGPDTCTLCICENGLPKVCKAVLCSPPQDCRSFRLGNTCCEFICLDDVVKPTDGAEANIRVAASGAASVVLLTIALVVYRVRKQKRRRPLHAEDQRSLTSIGYISGSMGYMGGTCETAQLGAWKPPSNYLPRGEAPPPYEEAMAQCRSDPMRVTNETSFHRSYPLEPRDEVCATHAYVNLPRPLVQMANTQNCYNAPLLQPVHPPEAREAIVMPHPLVANMGVGGRLTGSLGAISARLSVPRDDHERDRVERVERPHNVPGFYTTHTALHRTIPRISTALDTSTLEAMGFSRADRSLAGEVRRSFHRPDARERDRPHTGRSVPRNLNIASASPAHEQEDDLAVRPRLHSVHNDEDKKELTPHNHPTLPLTVDKPSCECSYEAARDADDYRSECENCHSTNNSGWEEGGSEWCGGGTQTLQRRAPPPPAQPAATATLPQPVTKGQGLAVRPRLHSVHNDEDKKELTPHNHPTLPLTVDKPSCECSYEAARDADDYRSECENCHSTNNSGWEEGGSEWCGGGTQTLQRRAPPPPAQPAATATLPQPVTKGQGRNGMGNPSNWENWFNTIPDSDSESEEE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: