MonarchBase - Protein-coding gene

DPOGS200554
Transcript	DPOGS200554-TA	1956 bp
Protein	DPOGS200554-PA	651 aa
Genomic position	DPSCF300119 + 122366-125920
RNAseq coverage	31x (Rank: top 75%)

Annotation
*Heliconius*	HMEL016864	4e-162	48.65%
*Bombyx*	BGIBMGA010770-TA	1e-114	37.84%
*Drosophila*	CG14309-PA	6e-25	25.21%
EBI UniRef50	UniRef50_D6X2K3	5e-26	25.00%	Putative uncharacterized protein n=2 Tax=Tribolium castaneum RepID=D6X2K3_TRICA
NCBI RefSeq	XP_001809953.1	1e-26	25.00%	PREDICTED: hypothetical protein [Tribolium castaneum]
NCBI nr blastp	gi\|270013008	2e-25	25.00%	hypothetical protein TcasGA2_TC010672 [Tribolium castaneum]
NCBI nr blastx	gi\|270013008	1e-26	21.79%	hypothetical protein TcasGA2_TC010672 [Tribolium castaneum]

Group
KEGG pathway	dre:562573	8e-09
	K07965 (HPSE2)	maps->	Glycosaminoglycan degradation
Orthology group	MCL19589		Insect specific

Nucleotide sequence:

>DPOGS200554-TA
ATGAGACAATCGGATTGGAGGAGTTTTATAAAGTGGGCAAAAAACTCGGGCTTCGACCTGGTGCTCGCATTAAACAATCATCACAGGACTGGAGTCATGTGGGATGCCAACATCGCCCTCGACATGCTCACGGCAGCACAAAAACAACAAGTTGGGGAAATGTTCTGGCAACTGGGTTACGAATGTAGAAATCAAACTATTGAAGAATATCTTAACGATTTGGAAACTCTCCGAGTTATTGTGGAGACTTTCCCTTCTGGGATGTCTAGGAAGTGGAAAGTAGTGGGAGCTGACGTCAGCAAATGCCTAAATGGAAACTCCAAGAACGACTTTAAGGATTACGTCATCACGTCCAACGATATGATGGACGCCATATTTTTGGATGGGAATTCAACATCGCGGGAGCTGTCAGCTATGTCCCCTCGCGAATACTCCAAGCTACTTCAGCGCTTGAGCCGCAGCGACACTCCGCTGTGGGGGTCATCTAAGGCCTCGTCTCCGAGAGACCGGCTGTCATCTCTAGGGACAGCAGCAGCTAGCGGGTTCACTGTACATTTCCAGGAGTTGATGGAGGACGAGCTCTGCGAACCCTCATTGAACCTCTATACGTTCCTGTTATTTAAGCACCTGGTCGGTACCCGTGTCCTCTCAGTCTCTGCCCCAGTTCCCTCCCCCCTCGTATCTCCTCCTGGTCTCTCCCTATTTTGTCACTGTTCCTCACTCCGCGGTCGGCCGGTTCCAGGCGCCATCACCGTCTACGGGGTCAACGACCAACAACAACACGCAGCCTTCACTCTCAATATCACACAACATGATGGAGACATCCTGCAGTTCATACTGGAACATGATATGACAGGGAGTATTATTGTGAACGGTCGCCCAGCAACTCGCGATGGTCACATAAGACCAGTCATCAAACTGGGTCGCTCATATAAACCTCTTGTATTCACTCTGCCTCCTAAATCCTTGGGTTTTTGGGTGCTCGCTAACGCACAAATAACTGCATGTTACAATAAAACAACTAGACTTGATTATAATGAAATTAATAGACGCTTCGATGACGAAGATAATTTTATTAAAACTAAAAGATCTATAAAAGAAAATGAGGATTTCATTTCTCAAGAATCCGCCGAAAAATCAGATGGATTTAGTTCAGTGCAGAATAATATTGCTTTGAGAAAACGAATTGAGGACATTAACAGTGAACTCCGGAAAATATTTCAAAGCTTTGATAAAAAAAAATACAATGCTAACCGAGTGAGACGAGAAATGTGTGACGATGAAAATAATACACGTAAATCTAGAGCATTGAGTAGATTAAAATCACGGAGAAGTCACGAGAAGGCACGAGGATATAATGGTCTTGCAAAAATTTCAAAGTTTTCCAAAGATAAAGTGGGACGTATAAAGAATAAATTATCCAGACTACGGGACACAAAAAGAAATTCAGCTTCGAGGTCAACAAGAAAAACGGAAAATAAGTATATCACGCATAGAAAGAGCGACGGCGAACCGAAAACTAAAGAAAGTTCTTTAAAGAATGAAATTTTAGATAACACGAAAAGTTCTGATGAAAAGAAAACGAGGAATCGTAGAAGTTTATCCAAAAATAAATCAAACAGACACCTCGACGAAGAAGAAGACTCGTCGGAGAATGAAATAGAGAGTAGCAAAGAGAAAATTAAAATTGGTAAATTATTTAACAATCTTAAGAAGTTAAGTGAACTGCCGATAGAAATACAGAGTAAAGACAAGTTGGAAGATTATAAAGACGACGGTTCTGAAGAAGGCATCGTTTTAAAAACGAAGCTATCAGATGATAGTGCGACCATTGACATCACGGACAAAACCAAGTCAGGTCTCTTGAAATCCGCGTTACAAGATATACTCTCCCTCTTCGCCGATTTCAATAAAAACATTAACAGGCTATGGACCGCCATCACAATACTTGAGTAA

Protein sequence:

>DPOGS200554-PA
MRQSDWRSFIKWAKNSGFDLVLALNNHHRTGVMWDANIALDMLTAAQKQQVGEMFWQLGYECRNQTIEEYLNDLETLRVIVETFPSGMSRKWKVVGADVSKCLNGNSKNDFKDYVITSNDMMDAIFLDGNSTSRELSAMSPREYSKLLQRLSRSDTPLWGSSKASSPRDRLSSLGTAAASGFTVHFQELMEDELCEPSLNLYTFLLFKHLVGTRVLSVSAPVPSPLVSPPGLSLFCHCSSLRGRPVPGAITVYGVNDQQQHAAFTLNITQHDGDILQFILEHDMTGSIIVNGRPATRDGHIRPVIKLGRSYKPLVFTLPPKSLGFWVLANAQITACYNKTTRLDYNEINRRFDDEDNFIKTKRSIKENEDFISQESAEKSDGFSSVQNNIALRKRIEDINSELRKIFQSFDKKKYNANRVRREMCDDENNTRKSRALSRLKSRRSHEKARGYNGLAKISKFSKDKVGRIKNKLSRLRDTKRNSASRSTRKTENKYITHRKSDGEPKTKESSLKNEILDNTKSSDEKKTRNRRSLSKNKSNRHLDEEEDSSENEIESSKEKIKIGKLFNNLKKLSELPIEIQSKDKLEDYKDDGSEEGIVLKTKLSDDSATIDITDKTKSGLLKSALQDILSLFADFNKNINRLWTAITILE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: