MonarchBase - Protein-coding gene

DPOGS211842
Transcript	DPOGS211842-TA	1497 bp
Protein	DPOGS211842-PA	498 aa
Genomic position	DPSCF300031 + 1087892-1091504
RNAseq coverage	75x (Rank: top 65%)

Annotation
*Heliconius*	HMEL006322	6e-124	55.98%
*Bombyx*	BGIBMGA006026-TA	3e-106	54.69%
*Drosophila*	l(2)gd1-PB	8e-69	38.95%
EBI UniRef50	UniRef50_D6WKC8	4e-97	47.34%	Putative uncharacterized protein n=2 Tax=Tribolium castaneum RepID=D6WKC8_TRICA
NCBI RefSeq	XP_971461.2	3e-97	46.97%	PREDICTED: similar to CG4713 CG4713-PA [Tribolium castaneum]
NCBI nr blastp	gi\|270007151	1e-96	47.34%	hypothetical protein TcasGA2_TC013686 [Tribolium castaneum]
NCBI nr blastx	gi\|270007151	8e-109	47.53%	hypothetical protein TcasGA2_TC013686 [Tribolium castaneum]

Group
KEGG pathway
InterPro domain	[129-187] IPR006608	5.2e-18	Domain of unknown function DM14
Orthology group	MCL11838		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS211842-TA
ATGTATAAAAAACCTACGTCCGGGAAAAAGACAAACTTGTCTCAGTTTGGTCTGATAGACATCCCAGATTTGGATGACGAAGAAGCAATGGATCTGTCTGATGATGATGTGGATTTAGAAGCAGAACTGGCAGCACTTAGCGGAGGAAAGAAGCAACAAAGACAACGCAAACCAGCTCCTGTACCAGCCAGTGACCTTGACGCTATGATCGCTGCGAGCTTGAAAGATATACCTTCAGATGAAGACGTGTCAGGTGATGAGGATGATCCAGATCTTCTAGACGAGCTTCAAGCCCTAGCGATAGATGACCAGCCTCAATTAGAACCTCCACGACCGAGGACAAGTCGACCGGCACCACCTCCACCGTCCGCTGAGAATAGTATTGTCAGCCTTCTACAAGAAAGAATCTCCAATTACGCTATCGCTGAGAAGAATGCTAAGGAAAGCGGGGAAAGTGGAAGAGCTAGACGGTTTGGTAGAGCCCTTAAGACACTCAACGACCTACTGAAGCAAGCTAAATCTGGAAAATCAATAAACAATGAGGACATTCCTCCACCAGTTAGTGTGGGGAAACCTAAATCGGATGTACCAAGAGAGATGCCATCGAATGACCCACAGCCAGAACCCACTAACACACTTCCTGAACCGCTGACACCAACACAAGTCCCCTTACCCCCGCCAAGAACCACTTCCATACCACCAAACCCTGAAGAACCTAGATCTCCTACTCCACCAGAACCCAAAGAACCTCCACCACTTCTATCAGATGTGGATCCTGCCAGGGCTCAAGGACTGCAATTGATACTGAATAGGAAGGCGGAATTCAAAGCAGCCGCCCTATCCAGCAAACACGCGGGAGACAAAACCTTAGCGCTGGAGTACCTCAAGGTTGTCAAACAGTTTGATATAGTGGTGGAGGCGTACAAATCTGGTCAAGAGATGGATCTCAGCGAACTGCCAACTCCTGAGGGCATCGCGGCCGCCGTCAAGGGACAGAAGGAAGAAGAACAAGTCCAGAACGCCGCAGAACCAGACCCTGAAGTCCCTCCGGAGCCAGTAGGTTTAATCACTGCCTCCTCTGTAGACGAGGCTCTGAGACAACGACTCGCGCATTTTCAGGAACAAGAAAGTAAGGCGAAGGACGAGGGGAACACGTCGAAGGCCCGTCGTATGGGGCGGATAGTGAAACAGTACCAGGACGCCATCAAGATGCATAAGGCCGGGCGTCCCATACCCACCGACGAGCTTCCCACGCCCAATGGATACGCACCCATACCCACTGGCGAGTCGCCCTCCCCGCGGCCCGCTCCGTCTGCTTCCCCCCGCCGTCCCGCCCCTACGTCTGCCCCGTCTGTCCCGTCCCCGTCCCCGTCTCCGTCCCCGTCCCGTGCCCCGTCCCGTTACGACAAACAGATTGCTCTATTGCTACACAAACAGAAGCAATTTAAAGAGGCAGCGCTGCAAGCTAAGAAGGACGGTCAGTTGAACTTATATTAA

Protein sequence:

>DPOGS211842-PA
MYKKPTSGKKTNLSQFGLIDIPDLDDEEAMDLSDDDVDLEAELAALSGGKKQQRQRKPAPVPASDLDAMIAASLKDIPSDEDVSGDEDDPDLLDELQALAIDDQPQLEPPRPRTSRPAPPPPSAENSIVSLLQERISNYAIAEKNAKESGESGRARRFGRALKTLNDLLKQAKSGKSINNEDIPPPVSVGKPKSDVPREMPSNDPQPEPTNTLPEPLTPTQVPLPPPRTTSIPPNPEEPRSPTPPEPKEPPPLLSDVDPARAQGLQLILNRKAEFKAAALSSKHAGDKTLALEYLKVVKQFDIVVEAYKSGQEMDLSELPTPEGIAAAVKGQKEEEQVQNAAEPDPEVPPEPVGLITASSVDEALRQRLAHFQEQESKAKDEGNTSKARRMGRIVKQYQDAIKMHKAGRPIPTDELPTPNGYAPIPTGESPSPRPAPSASPRRPAPTSAPSVPSPSPSPSPSRAPSRYDKQIALLLHKQKQFKEAALQAKKDGQLNLY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: