MonarchBase - Protein-coding gene

DPOGS202409
Transcript	DPOGS202409-TA	1869 bp
Protein	DPOGS202409-PA	622 aa
Genomic position	DPSCF300233 - 36836-42354
RNAseq coverage	788x (Rank: top 16%)

Annotation
*Heliconius*	HMEL016240	1e-171	79.40%
*Bombyx*	BGIBMGA003304-TA	0.0	65.63%
*Drosophila*	dlp-PB	6e-48	47.50%
EBI UniRef50	UniRef50_B0WIX1	7e-96	39.62%	Glypican n=2 Tax=Culicinae RepID=B0WIX1_CULQU
NCBI RefSeq	XP_001656399.1	3e-98	35.64%	glypican [Aedes aegypti]
NCBI nr blastp	gi\|157134701	5e-97	35.64%	glypican [Aedes aegypti]
NCBI nr blastx	gi\|170041836	7e-100	37.42%	glypican [Culex quinquefasciatus]

Group
Gene Ontology	GO:0043395	2e-124	heparan sulfate proteoglycan binding
	GO:0016020	2e-124	membrane
	GO:0005578	2e-124	proteinaceous extracellular matrix
KEGG pathway
InterPro domain	[1-578] IPR001863	2e-124	Glypican
Orthology group	MCL10665		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS202409-TA
ATGTTCAAACGAACGTACGGCATGATCTACGAACAGCACTCGTATGTCTTCGAACAACTCTTTGAACAGTTGGAGAGGTACTACACACGAGGAGACAGCGACTTCGACGAGATGATGGACAGCTTCTTTGGGATCCTGTATCAGAAAATGTTCGCCGTTCTGAACTCACAGTATACCTTTGATGACAAGTATCTGAAATGTGTGAACGAGCACATGCGGGACATCCAGCCATTCGAGGACGTGCCATCAAAACTATCAGCGCAGCTGAGACGAGCGTTCGTCGCCACACGCACCTTCCACAAGGCGCTGCGTGCTGGAGCTGATGTTGTCAGGAATATGATGCAGGTGGGTGTAACCCAGGAGTGTGTTGCCGCATGGGCTCGTCTTCGTTACTGTGGCTCCTGCGCGGGTCACCAGGTCCCGGCCTGTAGTCGCTACTGTCACAACGTCATCCGCGGCTGTCTGCCTACACACGCAGACCTCGGAGACCAGTGGGATGCCTATGTTGATGCCGTCGAGAAGGTAGCAGATCGCCTACTCGGACCGTTCAACATAGCAATGGTCGTGGAACCGATTGACATTAAAATATCCGAAGCCATCATGAGCTTCCAGGAACGTAACCAGGAGATCTCGCAGAAAATCTTCTCTGGTTGCGGGAAACCGGTTTTGGGGGGTGGCGGCAGCACGGGGCCGTTCTTCCCCCCGGGCAGGAACAAACGTTTCGCCCGATCGATACCCGACTTCGATTGGAATCATAAACCTAATGATGTGGACGATTTTGAAATCGAGGCATCCTTTGAGAGTGTTTTCAACGACGACCCGTCGCTCATGAGCCTCCGGACGCCCGAGGGCATTCGCAAAGCGACGGAGGAAATGGCAGAGAATGCTAAGTCGAGGGAGCGTTTCCTCCAATACATGAGAGGACAGATTCAACTCGAAGAGTACGAGGAACACGAGCGGAGCAAACGTGATGCGGACCCTGAACCGGCGGCGCAAGGCGGTTCAGAAATAGACTACAAGTCGTACGAGTTTGAAGGCAAGCGAGGCTCCAAGAAGAAGAAGCTGACGGCGGCCAAGGCTGAAACCGGGCACGGTGCGGACACTGGTCCCGAGTTAGAGAAGTTGGTCCGCGAGACTCGTTCCCGTGTCCGAGCTTCCCGTCGCTACTGGCTCCACCTGCCGGCGCTTCTGTGTGCCACCGCCAGTGTTACCACCGCGCCCTGCTACAACGGCAGTCACGTGGCCAGCTACACGTCGATAGCAGCTGGTGACGGCTCCGCGGCGCTGGCCTCCAACCCGGAGGTGCGGTCCCCACCACCACCACCCCCGCCCGCGAGCGACGCGTCACCGCTGGAGGCTCTCCGCTCACTCACCGGAAGGCTCAAGGATGCTTACAACGGAGTCGAAGTGCACTGGATGGATACAGCCGAAGACCTGCAATCTGCGGCCGCGTCTCAGAGCGAGTTCATAGACAATGGCGGATCAGGGTCCGGCTCCGGAGACGACACGGACGACACAGAGGATCTGCCCGACGACGACGAGGACAGAGACCCCAGCAAGGACTATGAAGGCTCCGGCATCAGCGAGTCGCCGCTGGACCCAACCGACACGGAGACAGAGAAACAACAGCCGACCGAGACCGAGGAGCCGGTGGTGCCGAGCGTAGTGAACGTGCCGGGCACCAAGAACGTCAACCTGCCCTCCGCCATAGACGCCGGCGACGACGCCGTGGACGTCCGCGGCCGCGTGGACGAGCCGCAGCCCGCGGCGGCCGGCGCCGAGCGACCCTCGCTGCAGAACGCGCTGTTCACGTACGCGCTGCCCGTCGTCTGCGCCTGGTTCGGCTCCATCGTCACCGACCTGTTTTGA

Protein sequence:

>DPOGS202409-PA
MFKRTYGMIYEQHSYVFEQLFEQLERYYTRGDSDFDEMMDSFFGILYQKMFAVLNSQYTFDDKYLKCVNEHMRDIQPFEDVPSKLSAQLRRAFVATRTFHKALRAGADVVRNMMQVGVTQECVAAWARLRYCGSCAGHQVPACSRYCHNVIRGCLPTHADLGDQWDAYVDAVEKVADRLLGPFNIAMVVEPIDIKISEAIMSFQERNQEISQKIFSGCGKPVLGGGGSTGPFFPPGRNKRFARSIPDFDWNHKPNDVDDFEIEASFESVFNDDPSLMSLRTPEGIRKATEEMAENAKSRERFLQYMRGQIQLEEYEEHERSKRDADPEPAAQGGSEIDYKSYEFEGKRGSKKKKLTAAKAETGHGADTGPELEKLVRETRSRVRASRRYWLHLPALLCATASVTTAPCYNGSHVASYTSIAAGDGSAALASNPEVRSPPPPPPPASDASPLEALRSLTGRLKDAYNGVEVHWMDTAEDLQSAAASQSEFIDNGGSGSGSGDDTDDTEDLPDDDEDRDPSKDYEGSGISESPLDPTDTETEKQQPTETEEPVVPSVVNVPGTKNVNLPSAIDAGDDAVDVRGRVDEPQPAAAGAERPSLQNALFTYALPVVCAWFGSIVTDLF-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: