MonarchBase - Protein-coding gene

DPOGS206017
Transcript	DPOGS206017-TA	3471 bp
Protein	DPOGS206017-PA	1156 aa
Genomic position	DPSCF300253 + 184050-204481
RNAseq coverage	458x (Rank: top 27%)

Annotation
*Heliconius*	HMEL006816	2e-123	43.66%
*Bombyx*	BGIBMGA012636-TA	0.0	62.06%
*Drosophila*	Nedd4-PJ	0.0	67.83%
EBI UniRef50	UniRef50_Q9VVI3	0.0	67.83%	E3 ubiquitin-protein ligase Nedd-4 n=15 Tax=Coelomata RepID=NEDD4_DROME
NCBI RefSeq	XP_002094996.1	0.0	67.83%	GE19920 [Drosophila yakuba]
NCBI nr blastp	gi\|383864855	0.0	66.83%	PREDICTED: E3 ubiquitin-protein ligase Nedd-4-like isoform 1 [Megachile rotundata]
NCBI nr blastx	gi\|347964500	0.0	48.92%	AGAP000787-PA [Anopheles gambiae str. PEST]

Group
Gene Ontology	GO:0006464	1.3e-153	protein modification process
	GO:0016881	1.3e-153	acid-amino acid ligase activity
	GO:0005622	1.3e-153	intracellular
	GO:0005515	1.1e-30	protein binding
KEGG pathway	dme:Dmel_CG42279	0.0
	K10591 (NEDD4, RSP5)	maps->	Ubiquitin mediated proteolysis
			Endocytosis
InterPro domain	[764-1155] IPR000569	1.3e-153	HECT
	[59-199] IPR008973	1.1e-30	C2 calcium/lipid-binding domain, CaLB
	[66-152] IPR000008	1.9e-21	C2 calcium-dependent membrane targeting
	[672-712] IPR001202	9.8e-19	WW/Rsp5/WWP
Orthology group	MCL11389		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS206017-TA
ATGAGAGATATACGTTCTCTGTCCATCATGCATAACGTAAGACCTGTCGAGTTTCCGACAAGGACTATGCAGGAGGAAAACCAGGCTCATAGGAACCGCTCATCTTCTTGGTCCTCTTGGAGACGGACCAATTTGCTCCGTAATAACGAACCCAGATATTCCCTGCAATATGAGACTGATGAGAATAGCTTCATGCTGAGGTTGAAGATAGTAGGAGCTTATTCACTAGCGAAGAAAGACATATTTGGTGCTAGCGACCCCTACGTCCGGGTGGAACTTCAGAAGGTTGACAGCGACTTCACGTTCGAGACATTTCTGACGAAAACTAAGAAAAGGACATTAAACCCGGTATGGAACCAGGAGTTCGTATTCCGGGTGAAGCCTCAAGAGCAGAAGCTGCTGATCCAGGTGTTCGACGAGAACCGCCTCACCCGGGACGACTTCCTAGGGATGGTGGAGCTGGCGCTGGCCGGCGTACCCTCGGAGAGCGCCACAAGCCCGCGACCGGCCAGCGTCAAATACCCCCTGCGTCCGCGCAGGTCCGTCGCTCGGTCCCGTGTCCGCGGGTCCCTGGAGGTGTACTGTGCTCTGACTGGGCGAGTCGATGAGCGAGCGTCGGAAAACGAACCCGCGCCGCCAGCTATCAACACGGTGACAGTACCGTCGCCAACCGGAGACGACTGGGAGTTGGTGGACGCACCAAACAATGTGTCAGGGGAGCCGCTGCCCGCGGGCTGGGAGGAGCGCCAGGACGCTAACGGCCGTACTTACTATGTGAACCACGTGGCCAGGTCCACGCAATGGGAGAGGCCTACGTTGATGTTAGTGACAGTACCGTCGCCAACCGGAGACGACTGGGAGTTGGTGGACGCACCAAACAATGTGTCAGGGGAGCCGCTGCCCGCGGGCTGGGAGGAGCGCCAGGACGCTAACGGCCGTACTTACTATGTGAACCACGTGGCCAGGTCCACGCAATGGGAGAGGCCTACGTTGATGCGTAATATGTCAACGGAGTCACAAGCTGAGCGTATGGAAACAGCAGCCACTGAGTTCCAAAGACGTTTCCATATCTCGGCTGATGAAGACCGGCCTCCAGCGAGACAGGCACAGGAGGAATCGAATGATAGACAGCCGGACAATCCTACCGAGCACACGGCCCACGCTTCACCGATACTATCATCTGAGATCAGTCAGGAATCGACACAGGACGCGACACAGCACGCGACACAGAACGCGACACAGGACGCGACACAGGAAGCGACACAGGAAGCAACACAGGACGCGACACAGGAAGTGACACAGGACGCTTCGCAATCAGAAGACGGTGCACAAGCGTCCACATCAGAAACAACTCAAGAACCTGTACAGGATAATATAACGAAAAACTGTGATACTAATTTAAGAGACAACAAAGAAAACGACGACGTCTGTCAAAATGACGCGACAGGCGGAGGTGATGAAGTGGACAATGCTCAAGCAGATAATAATAATGCTAGTCAAGAAATTATAGAGATACAAGTGGCTGGGGACGTGGATGTAGACGGGGAAGGGGGGATCAACGATACGGAATCAAATGGCGTTGTAGACGATGACGCGAGAACAGAGATCGAGGAAATCACTTTTGGGAGAGAGAGAACGCTCACAGACGAGACTGGGGGCTCCACGGAATCTTTGACTTTTGATGAGAACCATTTCAGCACGCCCACGGGAGGCATCACGCCGGAGAGACGGATGTCCCCGTCACGACGGCGGACGACGAACTCGCTGACGGAGTCGGAGGACGAAACCGACGGATCCTCGGAGAGCACTCGAAGCACCAGCTCCAGCAGCAGCCAGAGCCAGAACCTACCAAACAGCGACGGTCTGCCGTCCGGCTGGAGTATGCAGCGAGCTCCGAATGGAAGAATATTCTTCATAGATCACAACCAGAAAACTACAACATGGATCGATCCCAGAACAGGTTGCGCGTCCAGCCTGCCCTCAGCCGCGGCGAGCGCGGAGGTGGACACGGACGAGTTGGGCGCCCTGCCCGAGGGTTGGGAGGAGAGAGTCCACACTGATGGAAGGATCTTCTTCATAGACCACAACACTCGCACGACCCAGTGGGAGGACCCTCGGCTGTCCAACCCTCAGATCGCGGGTCCGGCCGTGCCTTACTCCAGGGACTACAAACGGAAATACGAGTACCTCAAGAGTCAGCTGCGGAAACCTAGCAACGTGCCCAACAAGTTCGAGATCAAGGTCCGGCGGAACTCGATCCTGGAGGACTCGTACAGGATCATCAGCTCCGTCAGCCGCATCGACCTGCTCAAGACCAAGCTGTGGGTGGAGTTCGAGTCCGAGGTCGGCCTAGACTACGGCGGTCTCGCGCGCGAGTGGTTCTTCCTGCTGTCCAAGGAGATGTTCAACCCCTACTACGGCCTGTTCGAGTACTCCGCCATGGACAACTACACGCTCCAGATAAACCCGAACAGCGGCGTCTGCAACGAGGAGCATCTCAGCTACTTCAAGTTCATAGGCCGAGTCGCCGGCATGGCCGTCTACCACGGGAAGCTGTTGGACGCTTTCTTCATCCGTCCCTTCTACAAGATGATGGTGGGGAAGACGATCGAGCTGCAGGACATGGAGTCCGTGGACCTGGAGTACTACAACTCGCTCGTGTGGATCAAGAGCCTAGCGAGCTATCAGCCGTCCACCAATCAATCGGCAATCAGAGAAACTCATTCATTCGGTCAATGCGCCGTTCAGTCCATCAATCAAGGGTTTGTTTATACAATGTGTAATTCAATTCACTTGAAGGATATGTTCCAGAAGCATTCCCGTCACCACAGAGAGGAGAACGATCCGTCCGAACTGTATCTGACGTTCGCCGTGGACGAGGAGCAGTTCGGGAACACCATCCAGAGGGAGCTGAAGCCGGGCGGCGCCAACATAGCGGTGGACGAGGACAACAAGGACGAGTACATCAAGCTGGTGATCCAGTGGCGGTTCGTGAGTCGCGTGCAGGAGCAGATGTTCGCGTTCCTGGAGGGGCTGGGGGCGCTGGTGCCGTTGCCGCTGCTGAAGATCTTCGACGAGCACGAGCTGGAGCTGCTGCTGTGCGGCATCCAGCACATCGACGTCCGCGACTGGCGCGCCAACACGCTCTACAAGGGCGACTATCACGCCAACCACCTCGTGGTGCAGTGGTTCTGGAGGGTGGTGTTGTCTTTCTCCAACGAGATGAGATCCCGTCTGCTGCAGTTCGTGACGGGCACCTCGCGCGTGCCCATGAACGGGTTCAAGGAACTGTACGGCTCCAACGGCCCGCAGCTGTTCACCATCGAAAAGTGGGGCGGACCCGACAACTACCCTCGGGCGCACACCTGCTTCAACCGCATCGACCTGCCCCCGTACGAGAGCTACATGCAGTTGAGGGAGAAGCTGGTGAAGGCTATTGAGGGCTCCCAGGGCTTCGCTGGGGTCGACTGA

Protein sequence:

>DPOGS206017-PA
MRDIRSLSIMHNVRPVEFPTRTMQEENQAHRNRSSSWSSWRRTNLLRNNEPRYSLQYETDENSFMLRLKIVGAYSLAKKDIFGASDPYVRVELQKVDSDFTFETFLTKTKKRTLNPVWNQEFVFRVKPQEQKLLIQVFDENRLTRDDFLGMVELALAGVPSESATSPRPASVKYPLRPRRSVARSRVRGSLEVYCALTGRVDERASENEPAPPAINTVTVPSPTGDDWELVDAPNNVSGEPLPAGWEERQDANGRTYYVNHVARSTQWERPTLMLVTVPSPTGDDWELVDAPNNVSGEPLPAGWEERQDANGRTYYVNHVARSTQWERPTLMRNMSTESQAERMETAATEFQRRFHISADEDRPPARQAQEESNDRQPDNPTEHTAHASPILSSEISQESTQDATQHATQNATQDATQEATQEATQDATQEVTQDASQSEDGAQASTSETTQEPVQDNITKNCDTNLRDNKENDDVCQNDATGGGDEVDNAQADNNNASQEIIEIQVAGDVDVDGEGGINDTESNGVVDDDARTEIEEITFGRERTLTDETGGSTESLTFDENHFSTPTGGITPERRMSPSRRRTTNSLTESEDETDGSSESTRSTSSSSSQSQNLPNSDGLPSGWSMQRAPNGRIFFIDHNQKTTTWIDPRTGCASSLPSAAASAEVDTDELGALPEGWEERVHTDGRIFFIDHNTRTTQWEDPRLSNPQIAGPAVPYSRDYKRKYEYLKSQLRKPSNVPNKFEIKVRRNSILEDSYRIISSVSRIDLLKTKLWVEFESEVGLDYGGLAREWFFLLSKEMFNPYYGLFEYSAMDNYTLQINPNSGVCNEEHLSYFKFIGRVAGMAVYHGKLLDAFFIRPFYKMMVGKTIELQDMESVDLEYYNSLVWIKSLASYQPSTNQSAIRETHSFGQCAVQSINQGFVYTMCNSIHLKDMFQKHSRHHREENDPSELYLTFAVDEEQFGNTIQRELKPGGANIAVDEDNKDEYIKLVIQWRFVSRVQEQMFAFLEGLGALVPLPLLKIFDEHELELLLCGIQHIDVRDWRANTLYKGDYHANHLVVQWFWRVVLSFSNEMRSRLLQFVTGTSRVPMNGFKELYGSNGPQLFTIEKWGGPDNYPRAHTCFNRIDLPPYESYMQLREKLVKAIEGSQGFAGVD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: