MonarchBase - Protein-coding gene

DPOGS201800
Transcript	DPOGS201800-TA	1797 bp
Protein	DPOGS201800-PA	598 aa
Genomic position	DPSCF300145 + 25468-55814
RNAseq coverage	551x (Rank: top 23%)

Annotation
*Heliconius*	HMEL007050	1e-80	85.34%
*Bombyx*	BGIBMGA013228-TA	2e-178	83.50%
*Drosophila*	CG32137-PB	4e-78	43.12%
EBI UniRef50	UniRef50_D2A6E0	2e-90	45.68%	Putative uncharacterized protein GLEAN_15685 n=2 Tax=Tribolium castaneum RepID=D2A6E0_TRICA
NCBI RefSeq	XP_968757.2	2e-90	45.58%	PREDICTED: similar to AGAP001308-PA [Tribolium castaneum]
NCBI nr blastp	gi\|270009052	6e-90	45.68%	hypothetical protein TcasGA2_TC015685 [Tribolium castaneum]
NCBI nr blastx	gi\|270009052	2e-96	45.66%	hypothetical protein TcasGA2_TC015685 [Tribolium castaneum]

Group
KEGG pathway
Orthology group	MCL13136		Single-copy universal gene

Nucleotide sequence:

>DPOGS201800-TA
ATGGTGTGTGAAATTAAAACTCCATTAAAACATGCTGGCCCAGAGCCCCGTAAAGCACGACGCAGATGCTTCACAGTCCGCTGCCCCAAACCGATTCCCACAACTGTTTCCGTCACATGTCTGAACAACTACTATTCGGTTAATAATTTATTGTTTATTTATCTGTCGCTGGAAATTATATATCTCGAGTGGTTTCCACACGCCGAGGACGCGGTTCGTGATATTTCGTGGCCTGATAGAGACGTGATAACGTTCGAGTACTGGATTCACAAGGCGCAGTTTACTGTAAGGTTACTGGAAACAGAATGGGGTCGTTGTCATGAAAAAAGTTTAGTTCACACTGACGGATACAAAAGAATTGCGAGAAGATGTACGCTATTGTTTGTTTACAAGAATCAAGAAAATAAGCCACTTTACATCAACTCCATGGTTCACATATCCACGAGCATCCAGGTCACGTCGATGGTCCTTATCTCGGAGTTGGAGCAAGAAAAGCATCTCCTGCGACGACGTTTGGACACCGAGCAAGGGGAATACGAAGCCAGGCTTGTGGAACTACAGAATGACATCAAAGAACTCACCGCCAAGATCGACTCCAAGGACAATTCAGTTAAACAAAGAGAAGAAGAAAAGACGGGTCTTATAGCAGAGTTGACAGCACAGAATTCTCGTCTAACTAATCAACTGAAGGAGTCATCTGCTGTCGAGGCGCAGCTCTTAGCGCAACTGGAGTTGCTCAAAGATCAGTGCTCCATAAGAAAGACAAGCTTGCAAGACCATGTCCAAAGCTTGGAATCCCTCAAAGCTGAGCTGGCTCTCATGAGTGATAAAAGGGCGGATTTGGAAAGACGGCTGACCACATCGCTAAAAGACAAAGACAGCTTAACACAGCAATTAGATGAAGCTAACGACAGGATCTCAGCCCTGGAGAGGCAGTTGAAGGAACAGGAACATCTATACCAGAACACGCTCAAGGAGTTGGAGCGTCTACAGAGATCTCACGACACGCTGGCAGAAAGAGTTGGATCTGATCCGGTGGAAATTACGAACACTCCGAGGTCCTTGCACGCGGAACTGGAATCGGAACCGGAAGAAGATGAGAACTGGCTAAGAACAGAGGCTGTTCAGGTCTTCAAGCAGTTGAGGGCATTAGCCCTCCAACTGAACACGGGCCACGACGATGATTCCGGTCTACATTCAGATCTATCTTTGTCGTCTCTCGATGGTGATGAAGGGGAGACTCTCCGTCGTGGAGCACTGTCCGCCGCTTGTGCTGATGCCGTTGCAGCGTATGCAGCATTAGAGGGATCCAGAGTGAGGGACTCCATCGCCTCCCACGCGCGTCGTGCTATGGAGAGAGAGAGACAGATTGATGAAAAGAATGAGATCATAGCGGAACTGTCGTCCAAGCTGTCAGTGGCGGAAGTTGAACTGCGAGCGTCAGCTGACGAGAGAGATAAGCTGCTGAACGACGCGACATACAGTAGCTTACAGCATGATGAAGCTGTCACCAAAGCCAGGCAGGAGAGAGATGAAGCTATAGAGAGGAAAAAGGCCAGCGAGGTCGCTCTGGCTAAGACACGCGTAGAATTGATGCAGGCTAACAGCCAGCTGTACGAGGCGGTGAGACAGAAGATAGACCTGGGCCAACAGCTGGAGCAGTGGCAGATGGACATGCAGGAACTCATAGATGAACAGATGAAGCACAAACTGACGTCCCAGGAGAAACGCCGCAAACTCCCCCCGCCGCGCGCACCGACTCGCACCGAGAGACTATTCGGGCTTTTTCACCGGTAA

Protein sequence:

>DPOGS201800-PA
MVCEIKTPLKHAGPEPRKARRRCFTVRCPKPIPTTVSVTCLNNYYSVNNLLFIYLSLEIIYLEWFPHAEDAVRDISWPDRDVITFEYWIHKAQFTVRLLETEWGRCHEKSLVHTDGYKRIARRCTLLFVYKNQENKPLYINSMVHISTSIQVTSMVLISELEQEKHLLRRRLDTEQGEYEARLVELQNDIKELTAKIDSKDNSVKQREEEKTGLIAELTAQNSRLTNQLKESSAVEAQLLAQLELLKDQCSIRKTSLQDHVQSLESLKAELALMSDKRADLERRLTTSLKDKDSLTQQLDEANDRISALERQLKEQEHLYQNTLKELERLQRSHDTLAERVGSDPVEITNTPRSLHAELESEPEEDENWLRTEAVQVFKQLRALALQLNTGHDDDSGLHSDLSLSSLDGDEGETLRRGALSAACADAVAAYAALEGSRVRDSIASHARRAMERERQIDEKNEIIAELSSKLSVAEVELRASADERDKLLNDATYSSLQHDEAVTKARQERDEAIERKKASEVALAKTRVELMQANSQLYEAVRQKIDLGQQLEQWQMDMQELIDEQMKHKLTSQEKRRKLPPPRAPTRTERLFGLFHR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: