MonarchBase - Protein-coding gene

DPOGS208131
Transcript	DPOGS208131-TA	3174 bp
Protein	DPOGS208131-PA	1057 aa
Genomic position	DPSCF300154 + 330633-336745
RNAseq coverage	386x (Rank: top 31%)

Annotation
*Heliconius*	HMEL006218	89.21%
*Bombyx*	BGIBMGA006572-TA	78.33%
*Drosophila*	Ptr-PA	63.43%
EBI UniRef50	UniRef50_Q86P36	63.43%	Ptc-related n=28 Tax=Arthropoda RepID=Q86P36_DROME
NCBI RefSeq	XP_001653012.1	70.86%	hypothetical protein AaeL_AAEL001299 [Aedes aegypti]
NCBI nr blastp	gi\|157117285	70.86%	hypothetical protein AaeL_AAEL001299 [Aedes aegypti]
NCBI nr blastx	gi\|157117285	70.86%	hypothetical protein AaeL_AAEL001299 [Aedes aegypti]

Group
Gene Ontology	GO:0016020	9.9e-196	membrane
	GO:0008158	9.9e-196	hedgehog receptor activity
KEGG pathway	spu:579887	2e-50
	K12385 (NPC1)	maps->	Lysosome
InterPro domain	[53-856] IPR003392	9.9e-196	Patched
Orthology group	MCL10591		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS208131-TA
ATGGGTTGCAAGCTAACATTTGTCGATGACATCTTAAACCGGTCGTTCTATAAGCTTGGTCTGGTCGTCGGCAAGCAGCCGGGGTACTTCATCATCATACCAGTTCTCTTAACCTTGCTCATGGTCACTGGCTACCAGCGGGTGCACTACGAAATGGATCCAGAATACCTTTTCTCCCCAGTCAGCGGTCAAGGGAAATTGGAAAGGAGTATCGTTGAAGAACATTTCAAAGTAAATTACTCCCATAGATTCAATGTTGGCAGAGTAACAAGAGCAGGTAGGTTCGGGCGAGTGATCATCATTGCGAAGGACAATCAAACCAACCTGCTGCGGACAGAAGTTTGGAAAGAGTTAAGACAACTGGATGAATATGTTCAGAATATAACTGTGACTTTGGAAGACGGTGAAACATTCACGTATAAAGAGGAATGCGCGCGATGGGAAGGACAATGCTTCGTCAACGATATTCTAAATTTGGATAAGATTATTGGAGAGGTTGAACGGGGCGAATTGAACTTGACGTTTCCGATAATGTTCAATCCTGTCACGTGGGAGGCTCATGCTTTTCCTGTTTATTTCGGCGGTTCAACTGTGGTAGATGACACTATAGTATCGGTGCCCGCCGTTCAGCTTGTATGGTTCATCAGGACTGACACTAAACTGCAGCAGCAACGAGGTGCAGCTTGGGAAGATGCGTTTCTGGATGCTGTCGGTGTAGTAGAAGATACAGGACGATTTAAACATATCTCGATAGCGCGATTCGCGTCTCGAACATTAGATCATGAACTTGAGAAGAACACGAGAACTGTCATACCATTCTTTAGCTCCACATTTATCCTTATGGGGATATTTTCAATAGTGACGTGTATGATGGGAGACTGGGTCAGATCCAAACCCTGGCTGGGTTTACTTGGAAATATATCAGCCGTGATGGCAACGATCGCTGCTTTCGGTTGTGCCATTTATTTAGGCATTTCTTTCATCGGTATAAACCTTGCCGCACCGTTCTTAATGATTGGAATCGGTATTGATGACACGTTCGTGATGTTGGCTGCCTGGCGGCGCACGTCCCCCCGTTTACCCGTCCCGGAGCGGATGGCTATCATGCTGTCAGAAGCTGCCGTCTCTATCACTATCACTTCGGTCACTGATATGCTGTCCTTCTTCATAGGCATCTTTTCACCATTCCCCTCCGTTCAAATATTTTGCATGTATTCAGGCCTTGCGGTTTGTTTTACGTTTGTATGGCACCTAACATTTTTCGCCGGATGCGTGGCCGTGTCCGGATACAGGGAGAAAAACAATCGTCACACTATTACGTGGTTGAAAGTATTGCCGGAATCTAGAGCTAGGAAAGAAGAGAAATCATGGTTATATAGAATTTTCTGCAGTGGTGGCATCGATCAGGCTGATCCAGACAACCCGATAGACAACAAAGAACATTGCATTATGGCCTTCTTCCGCACTACTATGGCGAATTTGCTCAATAATAGCTTCGTGAAAGCTTTAGTCATACTTATATTCCTAGGATACTTAGCTGGCGCCGGATATGGAGTGACGAATCTAAAAGAAGGTTTAGAAAGAAGGAAGCTGTCAAAAGTTGATTCTTATTCTGTGGAATTTTTTGACCGAGAGGATTTATATTACAGGGAATTTCCCTATCGAATTCAGGTTGTTATAAGCGGTAAATACAATTACTCCGATCCTAAAATCCAGGATGAAGTTGAGATTTTGACACAGAGATTAGAAAATACTTCATACATATCGAATTCTTTGTATACCGAATCCTGGTTGCGGACTTTCGTGAATTATGTTGAGAGAAACAACGATTATCTCAACATATCAATCGATTCTGAGGAAGACTTTATTAAGAATCTTAAAGAGTTGTGGCTGTTTTCGGCAAATCCATTTTCGCTCGACGTGAAATTCAATAAGGAGGGAGACCAAATTCTTGCATCTAGATTTCTTATTCAAGCTATCAATATTAGTGGAACTAACCACGAAAAGGAAATGGTTAAAGCTCTTAGAGAAGTCGTTGCCCAATCTCCACTCAACGCTACCGTATTTCACCCTTATTTCGTGTTTTTCGATCAGTTCGAGCTCGTGAGACCTACATCTTTGCAAAACCTGTGCTATGGAGCTTTGATGATGATGATAACTTCCTTTATATTCATACCCAATATACTGTGCTCATTGTGGGTGGCTTTCAGTATAATATCCATAGAAATTGGAGTAGTCGGTTATATGGCCCTATGGGATATTAATCTGGACTCAATATCAATGATAAACCTCATAATGTGCATTGGCTTCTCGGTTGACTTCACTGCACACATTTGTTATGCTTATATGGCGTCCAAAGCTAAGTATCCCAGAGAAAGGGTGAGCGAATGTCTCTACTCGTTAGGATTGCCTATTGTTCAAGGATCATTCAGCACGATATTAGGAGTTGTTGCATTACTACTCGCAGATAGTTATATCTTCTCGGTATTCTTTAAAATGGTATTCATGGTCATTTTCTTCGGTGCCATGCATGGTTTATTCCTCCTACCAGTTCTTTTGTCCCTCTTTGGTCCAGGGTCGTGTACAAGGGAAACGAAAGAGATAAAAATAGCAAAAGTAGACAAGATTTTCCCTAATCCGTATTGCTTACCGCATCCTCAATTGGTTCTGAATGATCAAATTTATAATGGGAAGAATATAAATCCAAACGGTATTTACAAAATATATGGAGACGACAAGGATCTTGGAATTGGCACGTCCGGTGAAGATACTAGTGAGAGCAGTTCGAATCAATCACAAAGACGTCAAATTAGCAGCGACGAAAACAGCAGAAAGAATTACGAAGACGGATGGAAGAAATTCGGCTATCATCAGAGCACAAGTCAATTTCAACCGTCAGGGGAGCTGGATTTGTATGAGCACGATCATGATAAGGCTTGGCAAAGACAACGCAACTATCGCAGTCAAGATAGTTACAAAAGACCAAGCCATAGAGATGGAGATTTTATAAGAACCAGAAAAACTAGCGATGCCGTTCCAGCCAATGAAGGGACATACAAGGTGATGAGAACCCACTCCCATCACAACCTTCACAGGCCTCGAGCTCCCAGACGAACAAACTCAACCCAGAATCTCGAGCACATTAACTACGTCGGAGAAATGCGCTTTCCTTGA

Protein sequence:

>DPOGS208131-PA
MGCKLTFVDDILNRSFYKLGLVVGKQPGYFIIIPVLLTLLMVTGYQRVHYEMDPEYLFSPVSGQGKLERSIVEEHFKVNYSHRFNVGRVTRAGRFGRVIIIAKDNQTNLLRTEVWKELRQLDEYVQNITVTLEDGETFTYKEECARWEGQCFVNDILNLDKIIGEVERGELNLTFPIMFNPVTWEAHAFPVYFGGSTVVDDTIVSVPAVQLVWFIRTDTKLQQQRGAAWEDAFLDAVGVVEDTGRFKHISIARFASRTLDHELEKNTRTVIPFFSSTFILMGIFSIVTCMMGDWVRSKPWLGLLGNISAVMATIAAFGCAIYLGISFIGINLAAPFLMIGIGIDDTFVMLAAWRRTSPRLPVPERMAIMLSEAAVSITITSVTDMLSFFIGIFSPFPSVQIFCMYSGLAVCFTFVWHLTFFAGCVAVSGYREKNNRHTITWLKVLPESRARKEEKSWLYRIFCSGGIDQADPDNPIDNKEHCIMAFFRTTMANLLNNSFVKALVILIFLGYLAGAGYGVTNLKEGLERRKLSKVDSYSVEFFDREDLYYREFPYRIQVVISGKYNYSDPKIQDEVEILTQRLENTSYISNSLYTESWLRTFVNYVERNNDYLNISIDSEEDFIKNLKELWLFSANPFSLDVKFNKEGDQILASRFLIQAINISGTNHEKEMVKALREVVAQSPLNATVFHPYFVFFDQFELVRPTSLQNLCYGALMMMITSFIFIPNILCSLWVAFSIISIEIGVVGYMALWDINLDSISMINLIMCIGFSVDFTAHICYAYMASKAKYPRERVSECLYSLGLPIVQGSFSTILGVVALLLADSYIFSVFFKMVFMVIFFGAMHGLFLLPVLLSLFGPGSCTRETKEIKIAKVDKIFPNPYCLPHPQLVLNDQIYNGKNINPNGIYKIYGDDKDLGIGTSGEDTSESSSNQSQRRQISSDENSRKNYEDGWKKFGYHQSTSQFQPSGELDLYEHDHDKAWQRQRNYRSQDSYKRPSHRDGDFIRTRKTSDAVPANEGTYKVMRTHSHHNLHRPRAPRRTNSTQNLEHINYVGEMRFP-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: