MonarchBase - Protein-coding gene

DPOGS209832
Transcript	DPOGS209832-TA	1680 bp
Protein	DPOGS209832-PA	559 aa
Genomic position	DPSCF300117 + 667905-672015
RNAseq coverage	32x (Rank: top 75%)

Annotation
*Heliconius*	HMEL004346	2e-29	53.28%
*Bombyx*	BGIBMGA008054-TA	2e-22	31.17%
*Drosophila*	CG8483-PA	2e-10	27.37%
EBI UniRef50	UniRef50_UPI0002247D72	9e-18	29.35%	UPI0002247D72 related cluster n=4 Tax=unknown RepID=UPI0002247D72
NCBI RefSeq	XP_001603551.1	4e-16	29.44%	PREDICTED: similar to sol i 3 antigen [Nasonia vitripennis]
NCBI nr blastp	gi\|345498015	2e-17	29.35%	PREDICTED: venom allergen 3-like isoform 2 [Nasonia vitripennis]
NCBI nr blastx	gi\|198443145	1e-16	31.09%	Chain B, Crystal Structure Of The Major Allergen From Fire Ant Venom, Sol I 3

Group
KEGG pathway
InterPro domain	[19-197] IPR014044	9e-26	CAP domain
	[29-193] IPR001283	1.3e-18	Allergen V5/Tpx-1-related
Orthology group	MCL25417		Lepidoptera specific

Nucleotide sequence:

>DPOGS209832-TA
ATGAGATGGATCCTATTTATATTGATGGCTCTATTAATATCACAGACTGCTGGGCCGGGTCCAAATTGTAGAGGTTATATGGAAGCTCGTCTGTCATCGGAGGATAAAACGCGTATTATAGAGCGCTTGAACCGACGACGCAGCGAAACAGCGGTGGGACTGAGCAAGCTACCACCAGCCGGGGATATGTTGAAACTGCGTTGGGTGGAAGAGTTGGCTCGCGAAGCTGAAAGATGGGCGAACCAATGTCGGCCTCCAAACTCACCAGAAGAACAAGACTTGTGTCGAGATTTGTATTCCATAACGGTTGGTCAATGCGTCGCTTCCGTTGTGGGCGAAGCGCCAGGCCTTCGCCCTGAAACGATGGTCGATATGTGGTTCATGCAGAACAAATACTACAGAGGAAATGTCACTTCATATTTGCCATCGGAGGACGGCGCTAATTCCTATGACGATTTTGCCCAAATGATTTGGTCTCGGACTTATATGGTGGGCTGTGGACGAAGCAGATTTATGACGGATTGGCGGGGACGTCTCCGGACTGTAGAGCGCTTGGTATGCAACTTTGCGCCTCGGGGCCCTGCAATCTATAGACCGCTGTGGAGCCCTTCAGACCCGGCCACCGCGTGCCCTCCTCGCGCTAGACCTGACCCAGCTTTACCAGCACTGTGTATTTATCAAAAAAATATGAATGAATTTAATGATGAGAATAGTGTACTCTCACTCGAAGATAACTTATTATTGGACTCATTGAATGATATCGAGAGAAATAAATCGCTAGATTATATCGGAAGCTTGGATGAAATTTATTTGACGAAACTCGCTATAATGACCATGACAAATAATGATTCTCCAGTATTGTCTCTTCATTCAGTAGAAAAAAGACATCATAATATGTTAGAATATAACAATAGTTCCGTTCCAAGTAAGGGATTGGATAACAATACATCAAGTATACGGATAGTAAAGAAAAAGGTGTATTTCGTTGGCCGTCCGAAGACTTACAAGGTGGAAGACTTAAATGATTTGAATGATGTAATAAATGAGAATAGAATAGAAGTAACTACCAGAGATATATATGACTACTATGAGTATAAGGAATTAGATGATTTGATAGAAACAACTCAGAGTACGATGAAAACATATGGAAATACAGTTGAAGAAACGAAAATATATGAGAGAGACGTTCTTAATGCAACTGATATTAGTGTATCTGCTAGTCCAATAACAAGCACATTGGAATCAATAAGCAATAGTGAAAATATAAATGTTCAAATTCATCGAAACAAAACTGGACTCGAGTCTGCGGAGCAAGTTGTCGAAGATAATTTTATAGACGATTATCTCACAGATGCTGAAACGGCTCGTCAGCTGCAAGAAGCCTTGGAGCGTATGGAAAGCAAATTAGCTACACCTTCATCTACACCTGGAAAGGTTCGCAGAGAGTTACGTAATTCAAATGAAAGAGACGAGGATTATAGAGTGGAAACGGAATCTCCTGTACACGTCGAGAAGAATAAGACAATAGATAGAGGTCCGATGCTCAGCATGGTGTTGAAATATATGCCGTACTTGAAAACGTATGAAAAGACCATTCTAGGGGATCCCAGCGCCAGCCGCGCCTCTCTACTAACGCCCTATTTAACATTACATTTTATTACGCATCTATTATTTTATTAG

Protein sequence:

>DPOGS209832-PA
MRWILFILMALLISQTAGPGPNCRGYMEARLSSEDKTRIIERLNRRRSETAVGLSKLPPAGDMLKLRWVEELAREAERWANQCRPPNSPEEQDLCRDLYSITVGQCVASVVGEAPGLRPETMVDMWFMQNKYYRGNVTSYLPSEDGANSYDDFAQMIWSRTYMVGCGRSRFMTDWRGRLRTVERLVCNFAPRGPAIYRPLWSPSDPATACPPRARPDPALPALCIYQKNMNEFNDENSVLSLEDNLLLDSLNDIERNKSLDYIGSLDEIYLTKLAIMTMTNNDSPVLSLHSVEKRHHNMLEYNNSSVPSKGLDNNTSSIRIVKKKVYFVGRPKTYKVEDLNDLNDVINENRIEVTTRDIYDYYEYKELDDLIETTQSTMKTYGNTVEETKIYERDVLNATDISVSASPITSTLESISNSENINVQIHRNKTGLESAEQVVEDNFIDDYLTDAETARQLQEALERMESKLATPSSTPGKVRRELRNSNERDEDYRVETESPVHVEKNKTIDRGPMLSMVLKYMPYLKTYEKTILGDPSASRASLLTPYLTLHFITHLLFY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: