MonarchBase - Protein-coding gene

DPOGS207873
Transcript	DPOGS207873-TA	3444 bp
Protein	DPOGS207873-PA	1147 aa
Genomic position	DPSCF300101 - 187403-190846
RNAseq coverage	28x (Rank: top 76%)

Annotation
*Heliconius*	HMEL010238	68.70%
*Bombyx*	BGIBMGA008348-TA	58.93%
*Drosophila*	Npc1a-PC	36.82%
EBI UniRef50	UniRef50_Q7PS03	35.93%	AGAP000579-PA n=1 Tax=Anopheles gambiae RepID=Q7PS03_ANOGA
NCBI RefSeq	XP_002009690.1	36.81%	GI15499 [Drosophila mojavensis]
NCBI nr blastp	gi\|195130501	36.81%	GI15499 [Drosophila mojavensis]
NCBI nr blastx	gi\|195130501	36.72%	GI15499 [Drosophila mojavensis]

Group
Gene Ontology	GO:0016020	9.2e-75	membrane
	GO:0008158	9.2e-75	hedgehog receptor activity
KEGG pathway	dmo:Dmoj_GI15499	0.0
	K12385 (NPC1)	maps->	Lysosome
InterPro domain	[424-1141] IPR003392	9.2e-75	Patched
Orthology group	MCL10165		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS207873-TA
ATGACAAACTCTATGCTTCTGGCTGCTGGTGTCCTCGGAAGATGTCCGACGTGTCTCGGAAACTTCGTGAGACAGATATGTGAAATGAATTGTGCGCCTGATCAAGCACGTTTCGTGAACGTCACGACGATGGTAACTCCGGATAATGTTTTATATGTAAATGAGATCAATTACAGGCTGTACAATGATTTTATGATTGATGCGCATAAATCATGTTCCGGCGTGATCGTGCCGCAATCCGGTATCCCTGCTATTAATCTGATGTGTGGTAACGCTCCCGTGTGCGACGCTGACGCTTGGTTTGGCTTCTCCGGAAACATTTCCGTTAATCCAATCGCTCCCGTTCAAGTAAATTTCCTTCGATGGCCAACACCTGAAGATTCTATGAACGCAAGAGCGCCGTTGTGCAATGAAACGCTAGCTGGAAATATCCCGTGCAGTTGTATAGATTGTCTCGCAAACTGCGGAACTTTAGAAGTTGAAATTCCAGACATTTGTGAAGTGCTAAGCGTCAACTGCATCGGATTTTCGGTAGGGATAACCTTTTTTGTGCTCACTGCTATTATTTTCATTATTTTAACTCTGCGAGAGTATAGAAAATACAGAAGACAAATATCTGACAGCGAAGACTTGAAATATGTGTATAAAGTAAATGTGGTAATCAAAATTTTTCAAAAATGTTTCCAAAATATCGGTATATTCACATCAGATCATCCTGTTTTGATGATACTTTTTACATCATGGATAGCGTTTGGCGTGTCGATCGGAATATCGCAGATTATTGTTACTGCAAATCCTATAGAGCTTTGGTCCGCACCTGATTCCCGTAGTCGTCAAGAACTTAATTATTTTAACTCCCGTTTTGGTCCATTTTATCGCGCCTCTCAGGTTTTCATGACATTTAATGGTCTAGATCCATTTACAGTTGGTAACATTACATACGGCCCAGCTTTCCGAGTTGAAGCAATACAGGAATTAATTAAACTTGAAAATGCTATTATAGACATCGGGAAGGATGACAATACAGTCACATTAACGGAAGTATGTTATGCACCTACTCGTTATCCTGGAGTGGAAAAAAGATTTGATCAATGTTTGTCTATGTCTATAGCAACTTATCTTCCCGATAGAAATAATATTAACAATGAAACATATTTAAACTCTATACAAGGCTGTATTAATAATTACCTTGCACTAAACTGTTTGGCTGACTGGGGAGGTGGGGCCGATCCCGACATGTCGTTTGGCGGATTTAGTGATAAAAATTATTTAGAAGCTAAAACTTTAATTATAAATTATCCTATAGCAAGTCATTTAAGACAGGAGGATATGGTTCCCGTTTTTGAATGGGAAAAGAAATTTATAGATCTTATGCAGGATTATGAAAAAAATTGGAAATCAGATTTTGTTGATATAGCGTTTGGGGCTGATAGATCAATTGAAGACGAAATAGATAGGGTATCTAGAGCAGAAATTGTTCCCATTGCTATTAGTTATTTAATAATGTTCTGTTACGTTATTCTTGCACTGGGAAACGTGACGAGACTAAAATCGTTCTTTGTTGAATGCAAAATCTCGGTCGCTGTCTGTTGTATCATTATTGTTATAATTGCTATTGCTTGTGCAGCGGGTATCTTAGGATACACTGGTATTACAATATCTTTGTTAGCTTTAAATGTCATTCCATTTTTCATTTTGTCCGTTGGTATAGATAATGTTTTTCTCATGGTAAATGAATTGCATTATATAGAAAGTAATCTCAAATCTTTTGAAGATTACAAGGAAGACTTGAGTTTTAATATGAAAAGACGCTACGTTTTTGGTAAAATGATGAAAAATGTGGGACCGTCAATGTTTGTTTCTTCATTGACTCAAATTTCTTGTTTTAGTATCGGTACTATTTCTAATTTACCAGCTGTGAGAACGTTTGCCATATTTGCAGCAATCGCATTAGGTTTTTTGTTTTTGTTTCAAATAACAATTGTGGTTGGTATTTTGTCAATTGATTACAGGCGAACTGTTCAAAATAGATATGATATCTTCTGTTGTATTCGGAAAAAAGTACTTGATGATGAAAATCCTTTACAAGATGGTGTCCGTAACCAAGGTATAATTCAAAGGTTTATGGAGCCTTATGCTAATTTTATTTTAAATTGGCGTGTTAAAATAACTGTAGCTCTTCTATTTATGGCTATGATAGGAGTGAGTGTAATACTTATACCTCAAATTGAAGTAGGTTTGGATCAAGAAATGGCTTTGCCACAAGATTCGTTTGTATATAAATATTTACAAGCAGTCAATAACATTCTGCCAGCAGGTCCACCAGTATTTTTTGTTGTTAAAAGTGGTCTTAATTTTACGAATCATGATCATCAGAACGTACTCTGCGGGGGACTTACATGTAACGAGGATTCACTTTCAACACAAATATTTGTAGCATCACGGAATACGGAAACTACGTACATTCAAAAGAGTTCAAATTCTTGGCTGGATGATTTCCTCGAGTGGACAACTTTGCCCGGCTCTTGTTGCAAGTATAATTCAACAGACGGTGGGTTTTGTTCAAGTAAAGACGAATCGCCAGAGTGCGAGTACTGTTCTATTGAAAGATCTGATTATGCAGGTGGCTTAAGACCAGCAGCAGAAGCTTTCGGAAAGCATATTCCAGCATTCCTCAAAGATCCACCTGGCGAGATTTGTTCCAAGGGTGGATTGGCAAGTTACGGTGGTAATGTCAATTACGTGTTAGACTCACAAGGTCTAGCAACAGTTTACGATACAAAATTTATGGCATTTCATAAATCACTGGTAACTTCAAAGGATTACTTTTTGGCTGTTAAAAACGCATACGAAATCTCTGCAAACATAACTAAAACTATACAAACTCGTACAGGATTAGATGTAGAAGTATTTCCATATTCGGTATTCTATGTCTATTACGAACAGTATTTGACTATTTGGGAAGATGCATTTGCTTCTATTGGATTCAGTCTTCTCGGAGCTCTATTTATAAATTTCCTAGTAACCGGTTTTAATTTCTTAACCACTGGTGCTTTGTTATTGAATGTTATAATGATTGTAGTTGAATTGATGGGCGTAATGTTCATATGGAATATACCTCTGAATGCCGTTTCTACTATAAACTTAATTGTGGCTATTGGTATCGCTGTTGAGTTCTGTAGTCATATGGCGTACGCGTATGCAACTAGTAAATGTCCCCCGAAAGAAAAGGTCCACGATGCCATCAAAAAGGTTGGATCTACGATAATCACCGGCATAACTCTGACTAACGTCCCGATCATAGTTCTAGCATTTTCGTATACTGAGATTATTGAAGTGTTCTTCTTTAGGATGCTGTTTAGTTTGGTGATTTTAGGATTTTTGCATGGTATGGTGTTTTTCCCTGTGTTGCTAAGTTTCTTGAACGATATTAAACATAGATAG

Protein sequence:

>DPOGS207873-PA
MTNSMLLAAGVLGRCPTCLGNFVRQICEMNCAPDQARFVNVTTMVTPDNVLYVNEINYRLYNDFMIDAHKSCSGVIVPQSGIPAINLMCGNAPVCDADAWFGFSGNISVNPIAPVQVNFLRWPTPEDSMNARAPLCNETLAGNIPCSCIDCLANCGTLEVEIPDICEVLSVNCIGFSVGITFFVLTAIIFIILTLREYRKYRRQISDSEDLKYVYKVNVVIKIFQKCFQNIGIFTSDHPVLMILFTSWIAFGVSIGISQIIVTANPIELWSAPDSRSRQELNYFNSRFGPFYRASQVFMTFNGLDPFTVGNITYGPAFRVEAIQELIKLENAIIDIGKDDNTVTLTEVCYAPTRYPGVEKRFDQCLSMSIATYLPDRNNINNETYLNSIQGCINNYLALNCLADWGGGADPDMSFGGFSDKNYLEAKTLIINYPIASHLRQEDMVPVFEWEKKFIDLMQDYEKNWKSDFVDIAFGADRSIEDEIDRVSRAEIVPIAISYLIMFCYVILALGNVTRLKSFFVECKISVAVCCIIIVIIAIACAAGILGYTGITISLLALNVIPFFILSVGIDNVFLMVNELHYIESNLKSFEDYKEDLSFNMKRRYVFGKMMKNVGPSMFVSSLTQISCFSIGTISNLPAVRTFAIFAAIALGFLFLFQITIVVGILSIDYRRTVQNRYDIFCCIRKKVLDDENPLQDGVRNQGIIQRFMEPYANFILNWRVKITVALLFMAMIGVSVILIPQIEVGLDQEMALPQDSFVYKYLQAVNNILPAGPPVFFVVKSGLNFTNHDHQNVLCGGLTCNEDSLSTQIFVASRNTETTYIQKSSNSWLDDFLEWTTLPGSCCKYNSTDGGFCSSKDESPECEYCSIERSDYAGGLRPAAEAFGKHIPAFLKDPPGEICSKGGLASYGGNVNYVLDSQGLATVYDTKFMAFHKSLVTSKDYFLAVKNAYEISANITKTIQTRTGLDVEVFPYSVFYVYYEQYLTIWEDAFASIGFSLLGALFINFLVTGFNFLTTGALLLNVIMIVVELMGVMFIWNIPLNAVSTINLIVAIGIAVEFCSHMAYAYATSKCPPKEKVHDAIKKVGSTIITGITLTNVPIIVLAFSYTEIIEVFFFRMLFSLVILGFLHGMVFFPVLLSFLNDIKHR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: