MonarchBase - Protein-coding gene

DPOGS204485
Transcript	DPOGS204485-TA	1797 bp
Protein	DPOGS204485-PA	598 aa
Genomic position	DPSCF300002 + 1121280-1131408
RNAseq coverage	812x (Rank: top 16%)

Annotation
*Heliconius*	HMEL015693	1e-108	75.30%
*Bombyx*	BGIBMGA007829-TA	0.0	91.83%
*Drosophila*	tyn-PB	0.0	75.00%
EBI UniRef50	UniRef50_Q8MS37	0.0	75.00%	RE15579p n=39 Tax=Pancrustacea RepID=Q8MS37_DROME
NCBI RefSeq	XP_394451.2	0.0	78.43%	PREDICTED: similar to SP71 CG17131-PA, isoform A [Apis mellifera]
NCBI nr blastp	gi\|383848428	0.0	78.22%	PREDICTED: uncharacterized protein LOC100876152 [Megachile rotundata]
NCBI nr blastx	gi\|383848428	0.0	78.49%	PREDICTED: uncharacterized protein LOC100876152 [Megachile rotundata]

Group
KEGG pathway
InterPro domain	[255-480] IPR001507	3.9e-36	Zona pellucida sperm-binding protein
	[12-95] IPR003014	1.2e-15	PAN-1 domain
	[13-94] IPR003609	1.4e-08	Apple-like
Orthology group	MCL15873		Insect specific

Nucleotide sequence:

>DPOGS204485-TA
ATGGTTAAAATTCAAGTGAGGTCAGAGAATGTGTGTATGAGGCCCTGGGCGTTTGAACGTGTACCCGGCAAGGCTCTAAGAGGCCTCGACAACAGTATTATCTACACCACCACCAAGGAGGCTTGTCTTGCTGCTTGCCTTAATGAGAAAAAGTTTCCGTGCCGTTCAGCGGAGTACGAGTATGGCAGTATGAGATGTTCTTTGAGTGATTCAGATCGTCGCACCGGACAGCATTTTGTACAACTAGTCGACACACCCGGCACTGATTATTTCGAGAATCTATGCCTGAAGGCGTCCCAGGCGTGCAAAGGAGCGAGGGTATTCACGGCACCACGCGTGGGCGTTGCTGAAGACAAAGTGGCACAATATGCTGGCTTGCATTATTATACTGATAAGGAGCTACAGGTAACGTCGGAGTCAGGATGTCGACGTGCTTGTGAGATAGAATCAGAGTTCCTGTGCCGTTCCTTTTTGTACCTCGGAGCGCCGCATTCGTCCATCTACAACTGCAGGCTGTACCACCTCGATCACCACACGCTACCTGATGGGCCCTCAGCTTACCTGAACGCTGAACGTCCGCTCATCGACGACGGCGAACCGATCGGCAAATACTTCGAGAACTTCTGTGAAAAACCACCAGCCAATCCCAGTGGAGAGCTGCCTGTTACTATAGACCATCAACAGGATGTCAACATGTCCAGCAACTTAACAAGAAACGATGCGAACTGTGACAAGACCGGAACTTGCTATGACGTATCCGTCCACTGCAAAGATACCAGGATCGCGGTACAAGTCCGTACGAACAAGCCTTTCAATGGAAGAATCTATGCACTAGGCCGCTCGGAGACATGTAACATAGACGTAGTTAATAGCGACCTATTCAGACTTGATCTCACAATGGCCGGTCAGGATTGTAATACCCAGAGCGTCACTGGCGTTTATTCAAACACTGTAGTATTGCAACATCACAGCGTTGTTATGACGAAAGCGGACAAAATCTACAAAGTGAAGTGCACATACGACATGAGTTCGAAGAACATTACATTTGGAATGGTGCCCATCAGGGATCCGGAGATGATCTCCATCACTGCAGCACCTGAGGCACCTCCACCGCGCATTCGCATCCTTGATAGCCGACAACGCGAGGTTGAAACTGTCCGTATTGGAGACAGACTCACCTTCCGTATCGAAATTCCCGAAGATACTCCATACGGCATTTTTGCACGCAGTTGTGTCGCTATGGCTAAGGATTCTAAGAGCACGTTCCAGATCATCGACGACGATGGATGTCCAGTCGATCCATCAATATTCCCAGCATTCAATCCCGACGGTAACGCATTGCAGTCCGTGTATGAAGCCTTCAGATTCACCGAATCTTACGGTGTTATATTCCAGTGCAATGTGAAATACTGTCTGGGACCATGTGAACCTGCGGTTTGTGAATGGGGCAGAGAATCAATAGAGTCATGGGGCAGAAAGAGACGTTCTTTACCTAACAACGAAACCAGTGAAACTCATTCTCAAGAGGAAGACATGAATATTTCTCAAGAAATATTGGTTCTTGACTTTGGTGATGAAAGACAGAGTACTGACTTCCTCCGATCCGATAAACCTGGTGGCTCAGCATCAGAGACCAACTTTGGAGAAAAAACAGTAACCATTGTGGAGCCATGTCCTAGCAAGTCATCCGTGCTGCTGCTAGGAGTTGCCTGTGCCTTACTGGTACTTTTGTACATCGCGACCATCTTCTGTTACTACATGCGTAAATGGCTGGCGCCACCTAAGCATTTGTCGTAA

Protein sequence:

>DPOGS204485-PA
MVKIQVRSENVCMRPWAFERVPGKALRGLDNSIIYTTTKEACLAACLNEKKFPCRSAEYEYGSMRCSLSDSDRRTGQHFVQLVDTPGTDYFENLCLKASQACKGARVFTAPRVGVAEDKVAQYAGLHYYTDKELQVTSESGCRRACEIESEFLCRSFLYLGAPHSSIYNCRLYHLDHHTLPDGPSAYLNAERPLIDDGEPIGKYFENFCEKPPANPSGELPVTIDHQQDVNMSSNLTRNDANCDKTGTCYDVSVHCKDTRIAVQVRTNKPFNGRIYALGRSETCNIDVVNSDLFRLDLTMAGQDCNTQSVTGVYSNTVVLQHHSVVMTKADKIYKVKCTYDMSSKNITFGMVPIRDPEMISITAAPEAPPPRIRILDSRQREVETVRIGDRLTFRIEIPEDTPYGIFARSCVAMAKDSKSTFQIIDDDGCPVDPSIFPAFNPDGNALQSVYEAFRFTESYGVIFQCNVKYCLGPCEPAVCEWGRESIESWGRKRRSLPNNETSETHSQEEDMNISQEILVLDFGDERQSTDFLRSDKPGGSASETNFGEKTVTIVEPCPSKSSVLLLGVACALLVLLYIATIFCYYMRKWLAPPKHLS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: