MonarchBase - Protein-coding gene

DPOGS203986
Transcript	DPOGS203986-TA	3426 bp
Protein	DPOGS203986-PA	1141 aa
Genomic position	DPSCF300005 + 1219794-1235355
RNAseq coverage	1x (Rank: top 93%)

Annotation
*Heliconius*	HMEL011034	4e-91	34.52%
*Bombyx*	BGIBMGA012258-TA	3e-64	31.63%
*Drosophila*	mfr-PF	9e-66	31.68%
EBI UniRef50	UniRef50_E2BLP3	5e-89	35.33%	Otoferlin n=9 Tax=Neoptera RepID=E2BLP3_HARSA
NCBI RefSeq	XP_968595.1	5e-94	34.33%	PREDICTED: similar to otoferlin [Tribolium castaneum]
NCBI nr blastp	gi\|91079903	1e-92	34.33%	PREDICTED: similar to otoferlin [Tribolium castaneum]
NCBI nr blastx	gi\|91079903	1e-90	34.33%	PREDICTED: similar to otoferlin [Tribolium castaneum]

Group
Gene Ontology	GO:0005515	1.3e-22	protein binding
	GO:0016021	5e-13	integral to membrane
KEGG pathway
InterPro domain	[739-965] IPR008973	1.3e-22	C2 calcium/lipid-binding domain, CaLB
	[331-407] IPR012561	5e-13	Ferlin B-domain
	[87-150] IPR012968	5.9e-08	FerIin domain
	[747-826] IPR000008	1.3e-07	C2 calcium-dependent membrane targeting
Orthology group

Nucleotide sequence:

>DPOGS203986-TA
ATATCAGTGAATGTACTGGAAGGAAGACGGTTAGCATGGACGAATCCGCATGCGGCAAATTCCTTTGTTCTCATTGTTCTTGGCAAGAAGAAACATAGAACGAGCGTAAGAAGAAATATGGAGGAACCATGTTATAGAGAAAGCTTTGTTTATGATTTATATACAACTGTAAATGACCTGAAGCAGACAGCATTGTGGCTAGCGATAATGGAACCGAGATTCTGTGCACCGCCACGATTGTTAGGAGAAGCCAGTATCGACTTAGGAGAAATTTGTATCGATGATCTAGATCATCAATCCTTTCATAAATGGGCGCAATTACTTCATCCCCGTGATTGGGCTGCTCAGCCGGTCGGTTTTCTTCAAGTTGACGTGTCAATTATTTCCAAAGCAGAGGAGCAAAACCTAATGCCAATAATTGGAAAAGATAAATTAGAAGACAAACTGCTTCTCCACTCTGACGCTCAACAGCAGTGCGCCAATTATGTTATCACAGTGCATGCAGCTTTAGGTCTACCTAATAGCACCCACGATGAAATAGGCAAGCGTATTGGGAACCCTCCCAATACTTTCGTAAAAGTTTCCTTTTGTGGCCTTGTGGCCAAAACTGGAATAATTCGTCGTAATAATAATCCGAAATATAGCGAACAAATATCTATAGTAGAAATGTTTCCTAACATGTGCCAAGCCATACGTTTCGAAGTTTACTCTGTCGAAAGGTGCTTTCATCGAGTTATATCCTGCACCCAATTGAAACTCGGCCAAGTATCACATGACGGAGAGAATGGGTTTGTACCAACGTTTGGACCATCCATGATCCAAATGTATGGTACAACGTGTGGTGACTCGTCGACTGTGATGTGTCAGGAGAGTCCATATCATCGTGGAGCTTTGGTTGTTACTCTTAAAATTATAGTGCCGTATAGTCAGCGAGGAATCAGAACTATAGCAGTCGAACCAGTGCCACGTATCAATTTAAGTTCAGAAGGCTGGCCAGATATCGTGGTTTGGCTTCTTAATAATGGCTCACGAGTGGCCTTCGCAAAAATATCCGCTGCTGATATTGTCCACTCCGTCATATCAGAACAAAAGGGAGAGTATTGTGGCCGAATACAAACCCTTTGCTTAAAGCCGTTGAAATGTCCAAAGCATATGAATTCCCCGTTATTGAGTTGTTACTGCGTTGCGGGAAAAGTAGAACTTCTAATGTGGATGGGGCTTCATCGCCAATCGTCTGATTTTGAATTCTCTATACCTCGTGGATATAAACTAAGAATGAAGAAATACAATATGTTCATTAAATCTAATATTATGTCGCCTCCTATGAATATTTTGCATGTCATCGTAAACTTTTCTATCGGTAGTGATGATTCAGCCCTTAAGGCTAACTCGTCGGACTTCCCGATTGAAGTCAGCACTGTCGCCGGTTTGGAACCAGGTATAATTGAGTTTTCCCTGGGTAAAACGGAATTGTTAGGAAGGATAAAAATTTATCCCCAAGTAACTGATGAACCGAGCTATGATAATGCACCCAGCCTCCAGTGGTATGATTTCTATCGAGGTACCGAATTCGGCGGACAAGTTCTGATGTCAGTACAATTGTTACAGTTAAATCTACCGCCATCTACAGATAGAAAGATACCTGAGAGATTACTTAGGTCTACGGAATACACTTCAGAGGAAGAAATTTTCGAAGCGAACACTGCCGACGACACCGAGATTTTTGAAGGAATTGAAACTCTTCCAATAAATCTTCTTCCAAAATCTTCTTCTTATAAAGTCGACGTTTATTGGTGGGGACTTCGGGATATCGATTCGATGCGAAAACCCTGTATTGTAATGGAAATTGAAGATCTCAGTATAAAATCTGAAATAATTACAGAGAAAGCTCACAACTGTAATTTTTCTAAAGGTCGAACCACGCAGGATTACATTGACGAAGATTCTACTACATTGAACACATTTCATAAACTGATCATATACGAGACAGAAGTTGAGACTCAGCCAGAATTTTCCAAGTTTAAAGATTGGTGCGCTACACTGAAACTTTATAATGGAAAGAAAACAGGTATTCCAGATAAGGACGAGAAGCTTTACTGCGGTTTCTTAAAGGCGGGATTTGCGATATATAAGTGGCCCCCGCCAACTAACACGATCGCTGTTACTCCCAGCGGAATTGACTTAAATAAAGGATTTTTTAACGATCATCCCCACAATAATCCTGCTGAATTTCTCGTCCGTGTTTACATTGTGAAAGGACTTAATCTCAAATCTAAAGAGTTCACTGGGCAATCTAATCCTTACGTTGTGTTAAATTGTGGAAACAAACATATAGCTGATCGAAACAACTACGTCCCGAACTCAGTTAATCCAATATTTGGAAAAATGCACGAAGTTCATTGTTGTCTGCCTGATGACTATCTTTTGGCAGTTTCGTTATATGACTACGGAATAAACTCGCCTGATAAATTAATTGGTATAACAACAATTGACCTAGAAGATCGCATATATTCTAAACACAGAGCTCGAGTTGGTTTACCTTTAGATTACAGCCTAAACGAACCTTTCAAATGGCGTGATTGTTTAAAACCTTCAGACATTCTCGAAGAAATTTGTTCAAAGAACCATCTTCCGCCTCCAAGATTCATAAACAGTAATACCTTGTTAGTCAATGGTGTAGAATATAGAAACAATGAGAAAGACGCTACTTTTTCATCAGCCGCTCTACAAAGAGAAAAGCTTTGTTTGAGTATTCTTCATAAATGGCATACGTTACCAATTTGTGGGTATCACCTTGTTCCCGAACACGTTGAAACGAGGACATTATATGACCCAAATAAACCGGGAATCGAACAGGGTAAAGTTATATTATGGGTAGACATTTTTCCTTTGGAAACGGGTGTTTATATCCCACCCCCCATTAAAATTACGCCTAGAGAGGCTGAAGATTACGAACTCAGACTAACTGTTTACAATGTTCGAATCAAAATGAGCGACTTAGATAACTTAGGAAGACAAGTCTCTGACATTTACCTTGTTAACAAAGAGAGAGGTATCTTTACAGAAAGTGGCGACAACGTACCGCCTGTACTTGTTGTTCAGGTCTTAGACAACGATGATTTAAATCAAACCGAGGATTTAGGGAAACTTATGCTAAATCTGAACTCTTTGACTTGTGGAGAGAAACAAGCTCAGGACTGTTCCTTAGAGTCCTTGAATAACAATAAAAAAATTGATTTGTTCTATAGCGAATCTATAAAATCCTGGTGGCCTTTAGCTACAGTTGATGAGAGTTCTGGAGCATTAATTTTTAGGGGTTGCATATACTTAGAACTGACATTGATGCCATTGGAGAAAGCTGTTGTAATGCCGGTAGGCGTCGGAAGAGAACCTCCATTTCCTTTGTTGGCACCTGCGTTAGTATAG

Protein sequence:

>DPOGS203986-PA
ISVNVLEGRRLAWTNPHAANSFVLIVLGKKKHRTSVRRNMEEPCYRESFVYDLYTTVNDLKQTALWLAIMEPRFCAPPRLLGEASIDLGEICIDDLDHQSFHKWAQLLHPRDWAAQPVGFLQVDVSIISKAEEQNLMPIIGKDKLEDKLLLHSDAQQQCANYVITVHAALGLPNSTHDEIGKRIGNPPNTFVKVSFCGLVAKTGIIRRNNNPKYSEQISIVEMFPNMCQAIRFEVYSVERCFHRVISCTQLKLGQVSHDGENGFVPTFGPSMIQMYGTTCGDSSTVMCQESPYHRGALVVTLKIIVPYSQRGIRTIAVEPVPRINLSSEGWPDIVVWLLNNGSRVAFAKISAADIVHSVISEQKGEYCGRIQTLCLKPLKCPKHMNSPLLSCYCVAGKVELLMWMGLHRQSSDFEFSIPRGYKLRMKKYNMFIKSNIMSPPMNILHVIVNFSIGSDDSALKANSSDFPIEVSTVAGLEPGIIEFSLGKTELLGRIKIYPQVTDEPSYDNAPSLQWYDFYRGTEFGGQVLMSVQLLQLNLPPSTDRKIPERLLRSTEYTSEEEIFEANTADDTEIFEGIETLPINLLPKSSSYKVDVYWWGLRDIDSMRKPCIVMEIEDLSIKSEIITEKAHNCNFSKGRTTQDYIDEDSTTLNTFHKLIIYETEVETQPEFSKFKDWCATLKLYNGKKTGIPDKDEKLYCGFLKAGFAIYKWPPPTNTIAVTPSGIDLNKGFFNDHPHNNPAEFLVRVYIVKGLNLKSKEFTGQSNPYVVLNCGNKHIADRNNYVPNSVNPIFGKMHEVHCCLPDDYLLAVSLYDYGINSPDKLIGITTIDLEDRIYSKHRARVGLPLDYSLNEPFKWRDCLKPSDILEEICSKNHLPPPRFINSNTLLVNGVEYRNNEKDATFSSAALQREKLCLSILHKWHTLPICGYHLVPEHVETRTLYDPNKPGIEQGKVILWVDIFPLETGVYIPPPIKITPREAEDYELRLTVYNVRIKMSDLDNLGRQVSDIYLVNKERGIFTESGDNVPPVLVVQVLDNDDLNQTEDLGKLMLNLNSLTCGEKQAQDCSLESLNNNKKIDLFYSESIKSWWPLATVDESSGALIFRGCIYLELTLMPLEKAVVMPVGVGREPPFPLLAPALV-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: