MonarchBase - Protein-coding gene

DPOGS204712
Transcript	DPOGS204712-TA	1683 bp
Protein	DPOGS204712-PA	560 aa
Genomic position	DPSCF300257 - 157936-161726
RNAseq coverage	2655x (Rank: top 5%)

Annotation
*Heliconius*	HMEL011710	0.0	72.74%
*Bombyx*	BGIBMGA008249-TA	0.0	67.89%
*Drosophila*	smg-PD	5e-33	33.44%
EBI UniRef50	UniRef50_E2C1I0	1e-43	30.93%	Sterile alpha motif domain-containing protein 4B n=8 Tax=Formicidae RepID=E2C1I0_HARSA
NCBI RefSeq	XP_001602138.1	3e-51	32.55%	PREDICTED: similar to MGC85099 protein [Nasonia vitripennis]
NCBI nr blastp	gi\|340720036	4e-51	31.99%	PREDICTED: protein Smaug homolog 2-like [Bombus terrestris]
NCBI nr blastx	gi\|340720036	4e-51	31.84%	PREDICTED: protein Smaug homolog 2-like [Bombus terrestris]

Group
Gene Ontology	GO:0005515	2.6e-15	protein binding
KEGG pathway
InterPro domain	[324-382] IPR013761	4.5e-23	Sterile alpha motif-type
	[323-384] IPR010993	2.6e-15	Sterile alpha motif homology
	[327-382] IPR021129	1.4e-12	Sterile alpha motif, type 1
	[322-385] IPR001660	4.4e-08	Sterile alpha motif domain
Orthology group	MCL12745		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS204712-TA
ATGAACGGGACGTTTTACGAGCAGCTCGGGGGTGTGGCCAAGATGTTCGAGCAGTGGGGCACCTGCGAGCGGACGGTGGTGGCCTGCGCCCTCGCTCGAAGAGTGCCGTGGCCAGGGTTGCGGTTGGTTCAGAGAGCGGTGGAGGCAGCCCTGCAGAACCATGTAGGGGATGAGCGACTCGAGAGAGATGCGAACGACGAAACGTTACTCGCCAGCCTCCTCGCGTCCAGAACTGATGAACACGATGAAGAAGATGGCGAACGTCTCAGACAGCTCCTTGCGCTGCTGCCTCTCCTCCGTACTGACAATGAGCGTGCTAAGAATGTGTACGTGTCGGCGACCCCCGGCCTGGTCCAGCGCTGTGTGGACTCATCCAGGTCACCTGCAACCCCACACCTGTGTAGACAGCTGCTGTCCTACCAACTGGTACATCCAGCCTTCACTGTACATGACCAGAGAACACTGACGCAATGGCTTCGCTATTTAGAAAATCACATATCTGGGAACAGAAACAGTGAGACGCCGTGGCAGCAGCGGATAGAACCGGCCCTGTTGCAGGACACGAACATCTGGTCGGCCAACAACACCTTCCGCCGCACCATCGGCAAGAACGTGGACTTCCGGGGGATGTTGGACTCGTTGGAGCACGCGGCCTACACGGACGTGTTGCAGGAGTCCTTCTCCAAGAACGGCAGGGACGTGGATATCGGCCTGGACGGAGACGCCGCCCACTACGAGGCGCAGACCAAGTCACACCGGTCTAATAGTCTCACGCCGCCCTCCACCAACTTCATGCAGATGTCCTCCTCGGCCGAGAACCTCAGCGACGAGCCGTTCGTCCAGAAACCGAGGAGCTTCTCGCTATCCAGCGAGCACAGTCTGACTCAGCTGCGGCCCATAGGGGTGACGTATGGAACCACCGGCAGCGAGACAAGGCTGGATGACCTCCGGACCAACAATTTTGCGGAACATCCCGGCATGTCCACCGTGGGGCAGTGGCTCAAGAGTCTCCGGCTGCACAAGTACGTGTGGCTCTTCACCAACATCACCTACGAGCAGATGATGGCCATGGACGACAAGTACCTGGAGAAACTGGGTGTGACGAAGGGCGCGCGTCACAAGATCCTGCTGTCGATCGCTCGTCTGTCGGAGCGGCCGTCTATCTTGGAGTCGGTTCGGAGTGAGCTGTCTTCAGGCCGGGTGTGCAGAGCTCTGGACCGTCTCCGGAGCGTGCTGCTCTCGCCTATGCCGCCCGGGGACCTGCCCCGGGCCGTGGTCGCAGCCCTACAACACGCGTCCGAGTGTTTGTCGGGAGGCGCGGGATCAGTGGTAGCGGAGAACGAGCCGGAGGCCGTTGACCCCATGTCGCTGCATTGCTGGCTCATAGAGAAGGCTCTCCACCACGAGTCGTTCTCGTGTCCGTCTCTCCAGTCATCTCTCCGCTGTCTCCGCCACCGCGTTCCACCTCGACAGTTCTTCCACCTTGTGGGAGACGCGCCTCACAGGAGACTCAAGCCCCGTTGGCGCGCCCCGGCCGCCGCCCGCCGCCGATGGGCGCCGCCCGCCCGCGGCAAGTCCAACTCGTACCCGCCGTTCCCGCCGCAGGTCGCACCGCCGCCGCCCCACGACTACTCCAGCCTGGACGCGCTCTGCCTGCAGATGACGGAGACGGCCATCGACTAG

Protein sequence:

>DPOGS204712-PA
MNGTFYEQLGGVAKMFEQWGTCERTVVACALARRVPWPGLRLVQRAVEAALQNHVGDERLERDANDETLLASLLASRTDEHDEEDGERLRQLLALLPLLRTDNERAKNVYVSATPGLVQRCVDSSRSPATPHLCRQLLSYQLVHPAFTVHDQRTLTQWLRYLENHISGNRNSETPWQQRIEPALLQDTNIWSANNTFRRTIGKNVDFRGMLDSLEHAAYTDVLQESFSKNGRDVDIGLDGDAAHYEAQTKSHRSNSLTPPSTNFMQMSSSAENLSDEPFVQKPRSFSLSSEHSLTQLRPIGVTYGTTGSETRLDDLRTNNFAEHPGMSTVGQWLKSLRLHKYVWLFTNITYEQMMAMDDKYLEKLGVTKGARHKILLSIARLSERPSILESVRSELSSGRVCRALDRLRSVLLSPMPPGDLPRAVVAALQHASECLSGGAGSVVAENEPEAVDPMSLHCWLIEKALHHESFSCPSLQSSLRCLRHRVPPRQFFHLVGDAPHRRLKPRWRAPAAARRRWAPPARGKSNSYPPFPPQVAPPPPHDYSSLDALCLQMTETAID-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: