MonarchBase - Protein-coding gene

DPOGS210057
Transcript	DPOGS210057-TA	1797 bp
Protein	DPOGS210057-PA	598 aa
Genomic position	DPSCF300017 - 926690-937060
RNAseq coverage	33x (Rank: top 75%)

Annotation
*Heliconius*	HMEL013360	1e-112	76.81%
*Bombyx*	BGIBMGA012697-TA	6e-101	61.69%
*Drosophila*	spz5-PA	4e-32	38.02%
EBI UniRef50	UniRef50_D6WMB7	1e-35	62.93%	Putative uncharacterized protein n=2 Tax=Tribolium castaneum RepID=D6WMB7_TRICA
NCBI RefSeq	XP_970793.1	2e-36	62.93%	PREDICTED: similar to GA22158-PA [Tribolium castaneum]
NCBI nr blastp	gi\|270008141	4e-35	62.93%	hypothetical protein TcasGA2_TC013304 [Tribolium castaneum]
NCBI nr blastx	gi\|270008141	1e-34	62.93%	hypothetical protein TcasGA2_TC013304 [Tribolium castaneum]

Group
KEGG pathway
Orthology group	MCL25999		Lepidoptera specific

Nucleotide sequence:

>DPOGS210057-TA
ATGATTTTCAAACAAAGCGAGTGCTATATACTGTGGGCTGCCACGAAAGGCGCGGGTTACAGTTGTCCCTACGGCCAGAACTGTTTGTATGAGCCGGCGCCCCCTGGACGCGCACCCGCCTGCGCTCAACCCGGCCTCACCTACTGCCTGCATCCGGATCCATATCCAGAGAAAGTGATCAGGAAACTGGTCGAAGCCGGTCAGTACGACATCCGGACGTTGCTATCCGACGAGAGTCGCGATAACTTCCAAGACAATAAGAAGACCACTTACCCGTACGGATACGGCCCCAACTCCTTACCACACGTCGACCAAATATCACTCGTCGACGATGGACACAAAGATTATAACACTAAGTACCACAAGTACAACCAAGGTGAGAAAGTGATCCGGAAACTGGTCGAAGCCGGTCAGTACGACATCCGGACGTTGCTATCCGACGAGAGTCGCGATAACTTCCAAGACAATAAGAAGACTACTTACCCGTACGGATACGGCCCCAACTCCTTACCACACGTCGACCAAATATCACTCGTCGACGATGGACACAAAGATTATAACACTAAGTACCACAAGTACAACCAAGATATATTTTCTGAGAAGGCTCCTCTCCAGCCTCCCTCGGCCGCAGATCCAACGCCGTATGATATCAAGGCCTATCAGGCCGCCAATTATTCCAAGTTCGGCTTCCAAGGATACACATCACCAACTTTTTGGGATCCCTCCATTAACCAGTTCCAATATGAAAACAGACGACTGAGAGAGAACGAAAATGTGAACCTTTACAATCCGAATTATTTCAATGGCCCGCTCTATCAAAACTATGAGTCGAATTGGTTGAGAGCGTCTAGCGGGGTCACGCAGTACAACCCGAGCGAATGGTGGAAATATATATCACCGTCTCGGTCAAACGCCGAGGTGTCCATCCAGCGCTCGATCACCTTCCCGACACGAACCACCACGAGCAGACACGCGACACACGCGCGCCGGAAACGGAACACGGAACTTGTGGAGGCTGCGGCGAGACGCACGTTAACAGGGGCTGAGGCGCTCAGGATCGCGCTGGGATTGGCTAACGAGGACTCGTCAGCGGAGCGTCCTCGCCGCCAGGCGTCCACGGGTGAGGAGTTATGCCGAGTCCGCACTCAGTTTATAAATCCTCGAGCCGCTCTCAATAACAAAGGCAGCTGGCGCTACGTCGTCAACATGCCGGATAACATGACACAACTAGTGCGAGCTGAGATATGCGCGTCAACAGAATGCAGTGGGTTATGCACCATACCTCTTGGCTACACTTCTAGATGCGAGCAAAAGTATATACAAAAACGTTTGGTAGCGTTGGAGTCCAGTGGACAGAACTTGTACACCGACGTGTTCTGGATCCCGAGCTGCTGCCAATTAAAAGAGGAAGCGGGGAAAAAATCAATGGTTGCGTTTTATGTTCTGTGCGTGAGACAGATCGGTTGTCATGACGACTACGCGGGGGACACGAGTGGCGGGAAAAAAAGGACTTATGACGCGGCCAAGAAAAGAAAATGGCGTCTCCGCTGCCCGCGGAAAGTTGACATTGCCGCTGCGATAGATTTTAAGCTTTTATTGTTCCGAGGATGTTTTGTGCGTCGTGCGAGAGAGAGGCAACATGGGGTGATCGACGAGATAACGAGGAGGGCGATGGAACTAGGTGAAGGGGATCAGCCTTCAGGTACTGTGGACCACGGGACGCGGGAAGCGGGACTCAGAACATGGGACACGGGACATGGGACGTGGGGTGCCGGCGAGGGGACCAGCCGTATATAG

Protein sequence:

>DPOGS210057-PA
MIFKQSECYILWAATKGAGYSCPYGQNCLYEPAPPGRAPACAQPGLTYCLHPDPYPEKVIRKLVEAGQYDIRTLLSDESRDNFQDNKKTTYPYGYGPNSLPHVDQISLVDDGHKDYNTKYHKYNQGEKVIRKLVEAGQYDIRTLLSDESRDNFQDNKKTTYPYGYGPNSLPHVDQISLVDDGHKDYNTKYHKYNQDIFSEKAPLQPPSAADPTPYDIKAYQAANYSKFGFQGYTSPTFWDPSINQFQYENRRLRENENVNLYNPNYFNGPLYQNYESNWLRASSGVTQYNPSEWWKYISPSRSNAEVSIQRSITFPTRTTTSRHATHARRKRNTELVEAAARRTLTGAEALRIALGLANEDSSAERPRRQASTGEELCRVRTQFINPRAALNNKGSWRYVVNMPDNMTQLVRAEICASTECSGLCTIPLGYTSRCEQKYIQKRLVALESSGQNLYTDVFWIPSCCQLKEEAGKKSMVAFYVLCVRQIGCHDDYAGDTSGGKKRTYDAAKKRKWRLRCPRKVDIAAAIDFKLLLFRGCFVRRARERQHGVIDEITRRAMELGEGDQPSGTVDHGTREAGLRTWDTGHGTWGAGEGTSRI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: