MonarchBase - Protein-coding gene

DPOGS208888
Transcript	DPOGS208888-TA	2718 bp
Protein	DPOGS208888-PA	905 aa
Genomic position	DPSCF300009 - 959585-965296
RNAseq coverage	47x (Rank: top 71%)

Annotation
*Heliconius*	HMEL003886	2e-44	41.54%
*Bombyx*	BGIBMGA002440-TA	3e-22	39.69%
*Drosophila*	CG8483-PA	3e-23	34.55%
EBI UniRef50	UniRef50_Q299S2	1e-21	34.55%	GA21107 n=2 Tax=pseudoobscura subgroup RepID=Q299S2_DROPS
NCBI RefSeq	XP_001953066.1	1e-22	35.08%	GF17401 [Drosophila ananassae]
NCBI nr blastp	gi\|194741178	2e-21	35.08%	GF17401 [Drosophila ananassae]
NCBI nr blastx	gi\|313104041	2e-21	37.06%	allergen Pol d 5 precursor [Polistes dominulus]

Group
KEGG pathway
InterPro domain	[6-169] IPR014044	4.1e-35	CAP domain
	[7-224] IPR001283	2.5e-32	Allergen V5/Tpx-1-related
	[39-57] IPR002413	3.8e-08	Ves allergen
Orthology group	MCL34777		Lepidoptera specific

Nucleotide sequence:

>DPOGS208888-TA
ATGATTCTTGGAAAAGCCGAAGCCAATATTATTATTAACCAAATTAATATGCGTAGAAATTTTATTGCCACAGGACGCTCCAAGTATCTACCAGCAGCAGCAAACATGAATAAAATTAAGTGGTCCGAAGAATTAGCAACTTTTGCTCAGCGTTGGGTAGACCAATGTGATCAAAGTCCGAATAAGGAAGATAGCTGTCGGGATCTTGAAAAGACAAAAGTTGGCCAAAATATAGCAACAATAGTCGGATCAACACCTGGACTGAACATTAAAAGTTTTATTGAAATGTGGTTTATGAAATCTATTTACTATAATAGCAGTGTTACTTTTTACAATCAATCTGTTGACCACAAAGCAAATTACTTCACACAATTAATTTGGGCTGAAACAGAAGAAGTGGGGTGTGGAAGAGCTAGATTTGTGATACATAATAAAAGGCCTATCCTTATTGAAAGACTTGTTTGCAATTTCGCACCAACAGGCAACGTACAAGGAAAACCGATATATATTATAGGATACCCCGCCACTCAGTGTAAAAATAGTATGAATCCTGATAAAGCGTTTATTGGCTTGTGTGAAACAAACAATACACCAAAACCCCTAACATTAAAATATAGAGATAAAATGACTACAAGAAATCCATCTACCAGCTTCCTAAGAATACTTAATTTATACAATGAATCAGCAACCCCTGAAATGGATCCTATTAAAATTTACCACAATTCTAAACCAAACGTAAAAGTTTATCATGAAAATCATAATTACTACAACAACCATAAATCAAAACTTAGAGATTTACTAAGACATCCATACGATGCTGTGAAACGCAGCTACCCTTTAGACGGTGAACACTTTTGGCGTATTCCTAATAACAATACACGAGATCACGCAGAAAATTATCAAAAAGAAAGAGGACATTCGCGAGTGTACCACGGTCACAATCATAGAAATGAATTTGATTTTTTACATCCAGAAACGTCCTCAATAGATTCTAGGAGGTTTGATATGACCACTTACACCGTAAATATGTTTTCTAATCAACAATTTAGAAAACACAATAGTGGCAACCGTTGTACAAGAAAAGGGGAAACTCAAACACAAACTGTTACAGAATGCACACCATGTGCTCAAACTGCTAAATGTACAAGACGTCAGATAAATAATTATAAAATATCGAATAATAATTGTAAACAATACCAATTTCTGACCGCATCTGACTCTATCCCACATGAGTCATGTCCGTGTAACACCTTTCAAAATTCATTTAAAACGAGATTTATGTCTTGTGAGCACAATCGCAAAACTAATTGTGGTTGTGCAGATGAAAATTGGTCAACTGAACCCTGTCGAAACATGTTACGAACTTTGAAGGACATTTCTGAAGACAGCAATAGCAATAAAGATTCATTTTATGATGACTTTCATCCTAATTTTCACTCTAATAATCCAAAAATTGTATCAAAATCACATCATTATGAGAATAGGAAGAGAAGTGTACCAGAAGAAGAAATTAATTTTAAACCATTTTGGGAAGTCGATGAATATTCTAGTAATAAACAACCACAGTTGAAATCTTTAAGATTTACAACATTATCCAACAAGAAAATTAAATCCAAAATACTTAAAAAAAATACCAGAAACTCAGCTAAAACTGAGTCTATCACGATTCCATTCGAAACACAACCGGCGTTATCAAATAAACGGGTTACAGAAAAGTATTTGTCATTTGACGAGTTATTACATCTCCGGAAATATAATGCAGAACTTAACGCACGAAGAGCTAATGAAGAAAGGGCTAGCTTTTCCAATGACGGTATTCAAATACTCAGAGAAGGTACAACTAAAGCAACTACTAAAACTGCTGCAACTACTACGACTACTGCTACTACAGCAGGAAGTCCTTCTGAATACACTGCTAATACCCCATATATTCGAATGAAACATTGCACACGTAAATTGACTTGCACGTGGACTGCCGCTTCTATGACTGACAGTAATGGGAGTATCATAACTGGAGGCGCCGATAACATTGGATCTAGAACACCGCCTGGCTACGTTGAAGGGTGTACCAGAACTTCTACTTGTACCAGAGACTACATGAATCGTAACAAAATGGCAACATTGCCCGTTGATATTACTAGCGTAGAAACTGATAATGGTGACGATGAAGATTATTGTGAACGTCGGTCTTTAAACAAACGAAATATAAATAAAAATAAAATAATTCAGAGACTTACAAAACGGACATCCATCTCGTACAATATTACTAAATCGCCAAGGAGTATTAACAGTAGAATAAACAGAACACCAAAAAACTTATTAAGTAACCGCAAAATAAAAACAAAAAATAGAAGTAAAAGATTTACAACCAGCCGGAACAATACACGAAATTCAAATATTCATAAAGTCAAAAGAGAAAATAAGATTCAGGCTGAGAATAACTTATTATCATATGGTGATATTTACTATCTTGTAACTAAAAAAATACTTAAAATGTGGAAAAAGAAAAGTATCCAACATAACCAATTTTGCTTTTGTAATCATGTCTCAAAATTAAAAAGTGATTATTATAACATCGCTTTGTCCTTCGTCATCTTGACCCAATCACCGTTAATTTTCATGAAATTAATGTCTCTCTTACTTTTCCTTGATTTATCGGTGTTTTTAAATACTTCACTCTCTTCATTTTCTGTATTATTATTGAGTAATAATTTCTGA

Protein sequence:

>DPOGS208888-PA
MILGKAEANIIINQINMRRNFIATGRSKYLPAAANMNKIKWSEELATFAQRWVDQCDQSPNKEDSCRDLEKTKVGQNIATIVGSTPGLNIKSFIEMWFMKSIYYNSSVTFYNQSVDHKANYFTQLIWAETEEVGCGRARFVIHNKRPILIERLVCNFAPTGNVQGKPIYIIGYPATQCKNSMNPDKAFIGLCETNNTPKPLTLKYRDKMTTRNPSTSFLRILNLYNESATPEMDPIKIYHNSKPNVKVYHENHNYYNNHKSKLRDLLRHPYDAVKRSYPLDGEHFWRIPNNNTRDHAENYQKERGHSRVYHGHNHRNEFDFLHPETSSIDSRRFDMTTYTVNMFSNQQFRKHNSGNRCTRKGETQTQTVTECTPCAQTAKCTRRQINNYKISNNNCKQYQFLTASDSIPHESCPCNTFQNSFKTRFMSCEHNRKTNCGCADENWSTEPCRNMLRTLKDISEDSNSNKDSFYDDFHPNFHSNNPKIVSKSHHYENRKRSVPEEEINFKPFWEVDEYSSNKQPQLKSLRFTTLSNKKIKSKILKKNTRNSAKTESITIPFETQPALSNKRVTEKYLSFDELLHLRKYNAELNARRANEERASFSNDGIQILREGTTKATTKTAATTTTTATTAGSPSEYTANTPYIRMKHCTRKLTCTWTAASMTDSNGSIITGGADNIGSRTPPGYVEGCTRTSTCTRDYMNRNKMATLPVDITSVETDNGDDEDYCERRSLNKRNINKNKIIQRLTKRTSISYNITKSPRSINSRINRTPKNLLSNRKIKTKNRSKRFTTSRNNTRNSNIHKVKRENKIQAENNLLSYGDIYYLVTKKILKMWKKKSIQHNQFCFCNHVSKLKSDYYNIALSFVILTQSPLIFMKLMSLLLFLDLSVFLNTSLSSFSVLLLSNNF-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: