MonarchBase - Protein-coding gene

DPOGS210736
Transcript	DPOGS210736-TA	1410 bp
Protein	DPOGS210736-PA	469 aa
Genomic position	DPSCF300013 + 203827-207253
RNAseq coverage	380x (Rank: top 32%)

Annotation
*Heliconius*	HMEL007077	0.0	73.50%
*Bombyx*	BGIBMGA006267-TA	0.0	73.89%
*Drosophila*	CG13605-PB	2e-50	31.06%
EBI UniRef50	UniRef50_D6WEC9	1e-90	41.59%	Putative uncharacterized protein n=1 Tax=Tribolium castaneum RepID=D6WEC9_TRICA
NCBI RefSeq	XP_968664.1	3e-91	41.59%	PREDICTED: similar to CG13605 CG13605-PA [Tribolium castaneum]
NCBI nr blastp	gi\|91079492	5e-90	41.59%	PREDICTED: similar to CG13605 CG13605-PA [Tribolium castaneum]
NCBI nr blastx	gi\|91079492	1e-86	41.12%	PREDICTED: similar to CG13605 CG13605-PA [Tribolium castaneum]

Group
Gene Ontology	GO:0005515	4.7e-08	protein binding
	GO:0008270	4.7e-08	zinc ion binding
KEGG pathway	sbi:SORBI_10g011070	6e-09
	K10601 (SYVN1, HRD1)	maps->	Ubiquitin mediated proteolysis
			Protein processing in endoplasmic reticulum
InterPro domain	[407-454] IPR013083	4.6e-16	Zinc finger, RING/FYVE/PHD-type
	[410-447] IPR001841	4.7e-08	Zinc finger, RING-type
	[410-447] IPR018957	6.2e-08	Zinc finger, C3HC4 RING-type
Orthology group	MCL11753		Single-copy universal gene

Nucleotide sequence:

>DPOGS210736-TA
ATGGCTCAGCCGAGTCAAGTAACTCTTAATATAGAGGATGAGAACCCTGATTCAGTAGAAAATAGTAATCTTAATAATGCACTCCATAGAACGGACCCTCCATCCAGACCAATGGTCGCAAATAGAAGTAATTTAGGCCTCGGAGACAGACTTAATAGTGTTTTCAGGGAAATAAGACCGTTAGTAGAACATGCAAGAATGGGCAACAATTCAAGACTTTCTCTACCAACGTGGTTACCGAGGAATTCACTGGGCATCCACCAATCCGGGGAGGTGACGCAAAGACCACAGAGTTCTATAGCCCATGTAAATCTTGGCTCTACGGCTCAAACATACATTGTAACAGATAGAGGACTTCCCATGTCACCGAGACATCAGAATCACGGGATGAGCAACAGTGCTTCAAATGATTCAAATGTATCAGAAAGAGCACAGGATCAGGTAGACATAAATGTATCGGTGAATCCCTCAAACAATAATAATATTAATGACAATGCAGATAACGATAGTCAGAGTGAAGACGGAACCCAGCAGGTAGTTGATGTTAGAGCCACTTTGAACCTGTTGTTGCGTTATGCTCCGTTCTATATAATTCTATACATTAAATACATGTACGACAGTCGTGAGGGTATATTCACATTTGTGGTATTATTATGCACATTCTCACACGGAAATGGCTTGGTTAAGAGAGAAAATGGGAAGCAGATGAATAGGAGCTTACTAGCATTATTTAGTGAATTTGTATTTGCTACGAGTTCTATACTAATCGTCCACTTCCTGTGCGGTCATGGGAAGCTATTGGAAAATGTGGTGATGTTTCCTGTTTATACGGAGCCGATCACAGTTTGGGAACTGCTATGGCTTGTCATATTAACGGATCTCATTGTTAAGATTATAACGGTCAACATAAAGATCGTGATCACAATGTTGCCAGCTTTCATATTACCGTTCCAGAAGAGGGGTAAAGTGTATTTGTTCACGGAGGTGGTGTCTCAACTGTACCGCTCCATAATAACCATCCAGCCGTGGATCTTCTACCTGATGCAGTCCTACGAGGGCTCCGAGCGTATGGTGGGGATGTTCCTCACAGCGCTGTACGTCATCTCCAAGGTTGTGGAGTTACTGCTGAGGCTGAGGCTGGTGAAAAATGCCACTTGGACCTTGCTGCAGAGCGTCAGTCTGGGCACGAAGCCAACTTGCGAGCAGATGGTTGCCGCTGGTGATTCCTGTCCAATCTGCCACGACGACTACACCACACCAGTCAGGTTGACCTGCAGCCATATCTTCTGCGAGCTTTGCATCTCCGCGTGGTTGGATCGCGAGCACACTTGCCCGCTGTGCCGTGCCAAGGTCGCCGACGAACCGACTTGGAGAGACGGTTCAACCACATACGATTTCCAACTCTGTTAA

Protein sequence:

>DPOGS210736-PA
MAQPSQVTLNIEDENPDSVENSNLNNALHRTDPPSRPMVANRSNLGLGDRLNSVFREIRPLVEHARMGNNSRLSLPTWLPRNSLGIHQSGEVTQRPQSSIAHVNLGSTAQTYIVTDRGLPMSPRHQNHGMSNSASNDSNVSERAQDQVDINVSVNPSNNNNINDNADNDSQSEDGTQQVVDVRATLNLLLRYAPFYIILYIKYMYDSREGIFTFVVLLCTFSHGNGLVKRENGKQMNRSLLALFSEFVFATSSILIVHFLCGHGKLLENVVMFPVYTEPITVWELLWLVILTDLIVKIITVNIKIVITMLPAFILPFQKRGKVYLFTEVVSQLYRSIITIQPWIFYLMQSYEGSERMVGMFLTALYVISKVVELLLRLRLVKNATWTLLQSVSLGTKPTCEQMVAAGDSCPICHDDYTTPVRLTCSHIFCELCISAWLDREHTCPLCRAKVADEPTWRDGSTTYDFQLC-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: