MonarchBase - Protein-coding gene

DPOGS208892
Transcript	DPOGS208892-TA	2637 bp
Protein	DPOGS208892-PA	878 aa
Genomic position	DPSCF300009 - 914386-917022
RNAseq coverage	211x (Rank: top 46%)

Annotation
*Heliconius*	HMEL015785	0.0	70.06%
*Bombyx*	BGIBMGA006572-TA	1e-38	24.86%
*Drosophila*	Ptr-PA	4e-49	24.38%
EBI UniRef50	UniRef50_Q7PXL5	0.0	45.62%	AGAP001468-PA n=2 Tax=Anopheles RepID=Q7PXL5_ANOGA
NCBI RefSeq	XP_001862575.1	0.0	45.67%	conserved hypothetical protein [Culex quinquefasciatus]
NCBI nr blastp	gi\|347965977	0.0	45.62%	AGAP001468-PA [Anopheles gambiae str. PEST]
NCBI nr blastx	gi\|347965977	0.0	45.62%	AGAP001468-PA [Anopheles gambiae str. PEST]

Group
Gene Ontology	GO:0016020	8.7e-78	membrane
	GO:0008158	8.7e-78	hedgehog receptor activity
KEGG pathway	tps:THAPSDRAFT_268270	2e-58
	K12385 (NPC1)	maps->	Lysosome
InterPro domain	[223-843] IPR003392	8.7e-78	Patched
Orthology group	MCL17514		Insect specific

Nucleotide sequence:

>DPOGS208892-TA
ATGAAATTATGGGTGCCTCCAGAATCAGACTTTTATTATGACACAAATTGGTACATAGATAATTTTGGAACTAGTTTAAGAATGCAGAAATTGTTAATTACTGCAGACAATGTACTAGATCCACATGTTATACATTTGTTAAGCAATATCACAAATGAAGTCTCATCCATTCAAATTCATTATAATAATAGAACATATTCTAAAAATGACTTGTGTTTTAAAGTACCTGTAGTTGCCTTTGTTAGTCCAAATTGGAAAGCTAGATCTGAGGTGCTTGTTAAATCTAATAATAGTCAATCTAAACTTAAACATGACGGATATGATATAGATTACTATGATCCATCTCTCTTAGTTGACAATGATTTTTATTGTAGTTTTATTGAGAGTTTCTCACATTCTTGTTATCAGGATAGTATTGTAGATATTTGGAAAAATGATGAAATGTTAATAAAAAATCTAACAAAGTCTGATATTATTAAAAATGTTAATGAGGTGAAAATAAATCCTGTTACTGGCCATTCTGTTGATTATACAAAGCAGTTAGGGGGAGTTGAGCGTGATGAAAATGGTCTAATAGTGTCAGCCAAGTCAGTACTGATTACTTGGTATATGTATGTTAATATGTCAGAGGTTGATCTCAATGAAGTAGGAAACTTAGTTGGTACAGAAGACTGGGTGACAGTCCCATTAGCCATGTGGGAGAAAAAATATTTAAAATATGTGAGTAATTTATCATCACCAAAAAATATAAAGTTTTTTTATGAAACAGGAGGAAGTTTTGCAGATATAAGTGGTGAAACAATGTTTAATGACATGGATAAACTATCTATAGGTATTATGTTAATGTTTTTTTATGTTGTGATGGCAGTTTCTCGCTTCAATTGGCTAGAGATTAGGTTGACATTAGGTGGTGTAGGTTTACTGAGTGTTGGTATGGCATATATTACTACTGTGGGCTGGTGTTCCTTGATTGGTATCCCATTTGGCCCTGTTCACTCATCATTACCATTTCTTCTTATGGGCCTGGGAGTAGATGATATGTTTGTGATGAATGCATGTTGGAAAATAGTTTTGCAATCAGAGTCACACCGAAGTATTCCTGTTAAAGTAGGTCATATGCTGAAGCATGCAGGTGTGTCAATAGTAATAACATCCTTCACAGATATTGTTGCTCTATTGATAGGTGCCATAACAATTCTTCCTTCTTTGAAATCCTTCTGTATCTATGCTGCAGTTGGTGTATTTTTCATATTTTGTTATTCTGTCACTTTTTTTGTTGCAGTTTTCACAATAGACATAAAAAGGATTCGTGATAAGAGAAATGGAATTATATTCTGTTATAAACATAATAATGATGTCAATGTATCATCAAAAACTACATTTTTCCAAAAGATTTTAGAAAGTTTCTATAAAAATATTGTTTTTACTATTCCTGGTAAAGCCACAGTCATCTTATTTGTTTTAATAGTAACAGGTGTTAATATAGCAGCTGTATTAAAATTGGAACAAAAGTTTGACCAAAAGTGGTTTATTCCTGATGATACTTATTATAAACAATTTTTGAACACCCATGAGCACTACTATCCTGATGAAGGTTATCCAGCTATGGTTTTCTTAGGAGATATGGATTACTATAAAGAATTTAATAATTTGTACAATATGATACAGGTTTTACGGAATGAATCATATGTTACTGATGTTGTCACATGGGTAGAAACTTTTCATGGATATGTCTTAAAGAATTTTAACCACAACTTACTGAATTCAAGTTCTATTACAGAAGGCCAATTTCTAAATTATTTGTCCAGATTTATATACAGTGGAGTTGGAGGTAGATTTCAAGTAAATTTTAAATTTTCGGGGCCACATGCTTGTGGTAAAACTATTGATAATATAAGGGCCACAACATTATCTTTTAGATTCACAAGTTTCAAGGGTCCTCAGGAGTATATACCCGCAATGAATCATGTTAAAGACATTGTAAAATCTGCATCCATAGCTACTGGTGATGGTTACCGGAGCGTCTGGTCCAAGGCCTTCGCAAATTGGGTCACTGACGAGATTATAGCTGTTGAAGTGGAGAGAAACATAGAACTAGCATTGCTTTGTGTCATGCTCTGCACTGTGATATTAATTACAAATCTTCAAATGTGTTTATGGATATTCATTTGCGTTTTACTCACAATTGTAAATGTATTAGGAGGAATGCAACAGTGGGGTATGACAGTTGATATCGTGTGTTGCATTGGTCTAGAACTTGCAATTGGTCTTTGTGTTGATTATGCTGCACACGTTGGGCATACATTTTTAACTATGACCCAAGGCGATCGTGGCGAGAGAGCATACAACACAGTCACATCTATCGGCAGCGCAGTTCTGCTAGGCGGTGGTTCGACTTTCCTTTCTTTATCTCTTCTAAGTATGTCGAAAGCGTATACATTTCAATCTTTCTTTAAGATATTTTTGCTGGTAATACTATTTGGTTTATTTAATGGCTTGTTATTTCTACCTGTCGTTTTATCATTAATAGGTCCAGCACCTTACAAAAGTCGCGATGAAAACGTTTTGGAAGCTATAGAACTAAATGGTAAAACTCCTGACAATAAAAAAATGTTAGCTAAGCGAGTAGAGTCTTGA

Protein sequence:

>DPOGS208892-PA
MKLWVPPESDFYYDTNWYIDNFGTSLRMQKLLITADNVLDPHVIHLLSNITNEVSSIQIHYNNRTYSKNDLCFKVPVVAFVSPNWKARSEVLVKSNNSQSKLKHDGYDIDYYDPSLLVDNDFYCSFIESFSHSCYQDSIVDIWKNDEMLIKNLTKSDIIKNVNEVKINPVTGHSVDYTKQLGGVERDENGLIVSAKSVLITWYMYVNMSEVDLNEVGNLVGTEDWVTVPLAMWEKKYLKYVSNLSSPKNIKFFYETGGSFADISGETMFNDMDKLSIGIMLMFFYVVMAVSRFNWLEIRLTLGGVGLLSVGMAYITTVGWCSLIGIPFGPVHSSLPFLLMGLGVDDMFVMNACWKIVLQSESHRSIPVKVGHMLKHAGVSIVITSFTDIVALLIGAITILPSLKSFCIYAAVGVFFIFCYSVTFFVAVFTIDIKRIRDKRNGIIFCYKHNNDVNVSSKTTFFQKILESFYKNIVFTIPGKATVILFVLIVTGVNIAAVLKLEQKFDQKWFIPDDTYYKQFLNTHEHYYPDEGYPAMVFLGDMDYYKEFNNLYNMIQVLRNESYVTDVVTWVETFHGYVLKNFNHNLLNSSSITEGQFLNYLSRFIYSGVGGRFQVNFKFSGPHACGKTIDNIRATTLSFRFTSFKGPQEYIPAMNHVKDIVKSASIATGDGYRSVWSKAFANWVTDEIIAVEVERNIELALLCVMLCTVILITNLQMCLWIFICVLLTIVNVLGGMQQWGMTVDIVCCIGLELAIGLCVDYAAHVGHTFLTMTQGDRGERAYNTVTSIGSAVLLGGGSTFLSLSLLSMSKAYTFQSFFKIFLLVILFGLFNGLLFLPVVLSLIGPAPYKSRDENVLEAIELNGKTPDNKKMLAKRVES-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: