MonarchBase - Protein-coding gene

DPOGS210275
Transcript	DPOGS210275-TA	1923 bp
Protein	DPOGS210275-PA	640 aa
Genomic position	DPSCF300216 + 130472-140416
RNAseq coverage	147x (Rank: top 54%)

Annotation
*Heliconius*	HMEL008622	1e-177	65.89%
*Bombyx*	BGIBMGA000028-TA	2e-171	60.29%
*Drosophila*	CG8420-PA	6e-92	38.13%
EBI UniRef50	UniRef50_Q9VHH1	9e-90	38.13%	CG8420 n=5 Tax=melanogaster subgroup RepID=Q9VHH1_DROME
NCBI RefSeq	XP_001649376.1	3e-95	38.60%	hypothetical protein AaeL_AAEL004564 [Aedes aegypti]
NCBI nr blastp	gi\|157106557	5e-94	38.60%	hypothetical protein AaeL_AAEL004564 [Aedes aegypti]
NCBI nr blastx	gi\|195499341	2e-96	39.44%	GE25931 [Drosophila yakuba]

Group
KEGG pathway
Orthology group	MCL16079		Insect specific

Nucleotide sequence:

>DPOGS210275-TA
ATGAAAAAACCAGAAGAGTCCATCACAGTACTTAGCAATTATATCGCGAAGAAATATCTGGACGTGAACACTGACGTATCCAGCTACGTGAAGTCGGCCGTAGACTACGTGAAGCAAACGTTGAAAATGGCGCAATCGGCTTCCGAATCTTTGGCGTCGAGAGATTACAGCGCGTTGGCGGAGAGACTGACGGATACGTTAAACATGGACGTGATAGAACCAGTCCTAAGGGTGTACCGAGCATACACACACGCGAGGACGAACACACACTGCCAGGAACACCTCATGTGTCTCGTCAACAGACAAGTGAAGCAGGGAGGTCCAGGGTTCAAGGCGGGTCTTACTAAGATGAGCAGCCTGGCCGCCTGCGCCGCTCTCAGCTTTGAAAACGGAAGAGGTTTCTGGGATTTATACAACGCTGTGCAAGCGGATGTTGACTGTGAGGCCAAGTACCCCGCTGACTGTTCATCGTTCCATGAACACGAGCTGAAAGTTACAACTGAAGTCTACCACAAAATGGCGAAAGTACACGTATTAGTTTTAGTGGTATGCCAAATCCTGTGTCTGCCGACCCTGTGTTATAGTGATGATGATAATCCCTTCCTGGATCTCGCGTCCTCGTTCATACAGAACATGGCAAGCGACAGTGGGAAAGGAAACAATATGGATGGGTTGGCAGCCATAGGAAACATTGTGGGCAGTCTTATGCAAGGTGACAATGCTAAGAATTTGGGCTCATTATTTGGACAGGAAAATGGTGGAGCTGGTGACGTCCTTTCCGGTCTTGGAAGTCTGTTTGGGGGTCAGGATGGTAAGATAGATCCTGCGGTCATAGGATCTGTGGTCTCAATGTTCGCTTCCCAGATGGGTTCTAATCAGAACCAACGAAGAAAGAGAGAATCTGATACCAATGATATAAATTTGGACAGTATCCTTAGCATGGCGTCAGGATTTCTTGGTAACAAAAACGCAGCAGGAATGCTGCCATTAGTTATGAACGCTTTAAGCTCATTCTCCGAAGACGAAACATCGAAACGAGCTGATTCTCACAAAGACCACGCGTCTTTTCTGCCTCCGTTCCTCGAAAAGGCCCATCTATATTGGGACATCTTCATAAATTCTGAATTAGGCAAGGCAGTCTGGGAGAAATCCGGTTTCCAGCGAGCGATGAAGTCGTTTATGGGTCCCGACGGGAAAGTCAGCTTTGAACTGATGTTTAAAAACTTCGAGAATCATTCATTTAGGAGGCATTGGATCAAGGCTGTAGCGAAATACCTAACGGGTATGGTAGTTCATGTCTCGAAACCAGAAGTTTACCAGAGATATTTGTCGACGGTACAATACGTGCTGAACGGTTTCCTGAGCTCGCAAGGTCTACCTAAAAACACTCACTTCAATATGAAAAAACCAGAAGAGTCCATCACAGTACTTAGCAATTATATCGCGAAGAAATATCTGGACGTGAACACTGACGTATCCAGCTACGTGAAGTCGGCCGTAGACTACGTGAAGCAAACGTTGAAAATGGCGCAATCGGCTTCCGAATCTTTGGCGTCGAGAGATTACAGCGCGTTGGCGGAGAGACTGACGGATACGTTAAACATGGACGTGATAGAACCAGTCCTAAGGGTGTACCGAGCATACACACACGCGAGGACGAACACACACTGCCAGGAACACCTCATGTGTCTCGTCAACAGACAAGTGAAGCAGGGAGGTCCAGGGTTCAAGGCGGGTCTTACTAAGATGAGCAGCCTGGCCGCCTGCGCCGCTCTCAGCTTTGAAAACGGAAGAGGTTTCTGGGATTTATACAACGCTGTGCAAGCGGATGTTGACTGTGAGGCCAAGTACCCCGCTGACTGTTCATCGTTCCATGAACACGAGCTGAAAGTTACAACCGAAGTCTACCACAGTGAATTATAA

Protein sequence:

>DPOGS210275-PA
MKKPEESITVLSNYIAKKYLDVNTDVSSYVKSAVDYVKQTLKMAQSASESLASRDYSALAERLTDTLNMDVIEPVLRVYRAYTHARTNTHCQEHLMCLVNRQVKQGGPGFKAGLTKMSSLAACAALSFENGRGFWDLYNAVQADVDCEAKYPADCSSFHEHELKVTTEVYHKMAKVHVLVLVVCQILCLPTLCYSDDDNPFLDLASSFIQNMASDSGKGNNMDGLAAIGNIVGSLMQGDNAKNLGSLFGQENGGAGDVLSGLGSLFGGQDGKIDPAVIGSVVSMFASQMGSNQNQRRKRESDTNDINLDSILSMASGFLGNKNAAGMLPLVMNALSSFSEDETSKRADSHKDHASFLPPFLEKAHLYWDIFINSELGKAVWEKSGFQRAMKSFMGPDGKVSFELMFKNFENHSFRRHWIKAVAKYLTGMVVHVSKPEVYQRYLSTVQYVLNGFLSSQGLPKNTHFNMKKPEESITVLSNYIAKKYLDVNTDVSSYVKSAVDYVKQTLKMAQSASESLASRDYSALAERLTDTLNMDVIEPVLRVYRAYTHARTNTHCQEHLMCLVNRQVKQGGPGFKAGLTKMSSLAACAALSFENGRGFWDLYNAVQADVDCEAKYPADCSSFHEHELKVTTEVYHSEL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: