MonarchBase - Protein-coding gene

DPOGS209904
Transcript	DPOGS209904-TA	1197 bp
Protein	DPOGS209904-PA	398 aa
Genomic position	DPSCF300049 + 439821-443158
RNAseq coverage	319x (Rank: top 36%)

Annotation
*Heliconius*	HMEL011845	3e-76	67.63%
*Bombyx*	BGIBMGA004143-TA	2e-64	65.79%
*Drosophila*	CG32486-PD	5e-84	44.29%
EBI UniRef50	UniRef50_Q7QKC6	8e-97	48.29%	AGAP002264-PA n=10 Tax=Eumetazoa RepID=Q7QKC6_ANOGA
NCBI RefSeq	XP_396554.2	7e-97	49.20%	PREDICTED: similar to CG32486-PD [Apis mellifera]
NCBI nr blastp	gi\|322784379	1e-97	50.26%	hypothetical protein SINV_04905 [Solenopsis invicta]
NCBI nr blastx	gi\|322784379	1e-97	49.74%	hypothetical protein SINV_04905 [Solenopsis invicta]

Group
KEGG pathway	vvi:100267231	3e-07
	K04506 (SIAH1)	maps->	Ubiquitin mediated proteolysis
			Wnt signaling pathway
			p53 signaling pathway
InterPro domain	[49-121] IPR013083	1.1e-08	Zinc finger, RING/FYVE/PHD-type
Orthology group	MCL13114		Single-copy universal gene

Nucleotide sequence:

>DPOGS209904-TA
ATGGCTGAGGTTCCAAACACCGAGCCTTTGCCCTCTTCTAGTGAGAATTCAGTTATCGCTTCTGATTGTAAAGACGATGAAGAGCCGTCGCCTAAAAAACGTAAAACCGCTTTAGATTCTGATCAAATTGAGAAATTGGAGCACAGATTGGGGGGCATTCTGTGCTGCGCAGTTTGCTTGGACTTGCCTCAAGCTGCCGTTTACCAGTGTAGTAACGGCCACCTAATGTGTGCGCCTTGCTTCACTCACTTGCTGGCGGACGCCAGACTCCGCGACGAGACGGCCACGTGTCCCAACTGTCGAGTGGATATCTCCAAGAACTCTGTCACGAGGAACCTGGCCGTGGAGAAGGCCGTGTCGGAGCTGCCGTCCGAGTGCAGACACTGCACCAAGGTGTTCCCTCGCCACTCCCTACAGTACCACGAGGAGAAGATATGCGAGGATCGGCCGTACAAGTTTAGACAGCTGGTAGTCGATTCCGGTCCTCGATCCCCTCTCGCTGGTTTGGTTCGCATTGTCAGCTCTGTGTACTTTCTACTCCTCGCCGCTCTCAGAAGACGCTTCTTCGTGTCGGAGCTGACGGCCACCAAGCGACCTAGGATGACGTCGTGTCGGTACTGCGTGTTGGGATGCTCGTACCGTGGAGCGGCGAGGGCGGCGGCGGCGCACGAGGCGATCTGCGCGCACCCGCGCCGCCCCGCCGCTGAGCTGATGAGCATGCTGGCGCGAAGACAGAAGGAGCACGAGCACAGTCTGGCGCACTACAGGGACCTCATGGACCTGCTCTCTTATGAGAAGATCACCTTCAACGACCTGCAGCTCCGTCCGTTCCGCACGGAGGAGCTTCACAAGCTGTACTTCGAGACTTCACGGTTCACCGCCTTCGGCTTCCAGTGGGTGGTGAAGGCCTTCGTCAACAAACACCAGCGAGACCCCACACAGAGCACGCAGAGAGAGATCACCTACCAGCTGGTGATGAAGAGCAAGCCGTTCGGGCCGATGTGTGTGAGGTGGGTGTGGACGCGCGGCCCCGGGGGCTCGGCGCCGCTGCTGCCCGAGGCGGCTCAGCACACCTTCACCGACGAGGAGGCTTCCCCCGCTAAAACTCTGCCCCTCGCCGACCCCGATGACGCCAATCGCCTGCTCGCCAGCAAAGCCGTGCACTTCCGATTAATAATGTTCTCATCACCCAAGTAA

Protein sequence:

>DPOGS209904-PA
MAEVPNTEPLPSSSENSVIASDCKDDEEPSPKKRKTALDSDQIEKLEHRLGGILCCAVCLDLPQAAVYQCSNGHLMCAPCFTHLLADARLRDETATCPNCRVDISKNSVTRNLAVEKAVSELPSECRHCTKVFPRHSLQYHEEKICEDRPYKFRQLVVDSGPRSPLAGLVRIVSSVYFLLLAALRRRFFVSELTATKRPRMTSCRYCVLGCSYRGAARAAAAHEAICAHPRRPAAELMSMLARRQKEHEHSLAHYRDLMDLLSYEKITFNDLQLRPFRTEELHKLYFETSRFTAFGFQWVVKAFVNKHQRDPTQSTQREITYQLVMKSKPFGPMCVRWVWTRGPGGSAPLLPEAAQHTFTDEEASPAKTLPLADPDDANRLLASKAVHFRLIMFSSPK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: