MonarchBase - Protein-coding gene

DPOGS214038
Transcript	DPOGS214038-TA	1449 bp
Protein	DPOGS214038-PA	482 aa
Genomic position	DPSCF300238 + 225087-228660
RNAseq coverage	113x (Rank: top 59%)

Annotation
*Heliconius*	HMEL005072	1e-96	89.30%
*Bombyx*	BGIBMGA008320-TA	1e-180	67.74%
*Drosophila*	cyr-PB	3e-54	33.57%
EBI UniRef50	UniRef50_D6WTK5	3e-74	39.03%	Putative uncharacterized protein n=2 Tax=Tribolium castaneum RepID=D6WTK5_TRICA
NCBI RefSeq	XP_975004.1	2e-73	39.30%	PREDICTED: similar to RE22259p [Tribolium castaneum]
NCBI nr blastp	gi\|270010742	9e-74	39.03%	hypothetical protein TcasGA2_TC010196 [Tribolium castaneum]
NCBI nr blastx	gi\|270010742	1e-75	39.66%	hypothetical protein TcasGA2_TC010196 [Tribolium castaneum]

Group
KEGG pathway
InterPro domain	[27-316] IPR001507	3.3e-25	Zona pellucida sperm-binding protein
Orthology group	MCL18869		Insect specific

Nucleotide sequence:

>DPOGS214038-TA
ATGTGGCGTGTGATCCTGCTGACGGTACTCCTGTGTGGAGTACAGAGTCATCCTAATAAGGTCCGCAATGTGACGACATCGTGTGACAAAGGCTCAATCACTATCAATATAGACATGGAGAAGCCATTCAAGGGTCTAGTTTTCAGTAAGGACTTCTCAAGAGAATGTCGGATTTTAGGTCAAATGCAGACGAATGTTTCATTGCATTTGCCTTCAAACACGTGCGGAGTAAGGACATCAATACAGAACAACACGACAAAGAGATACGATGAACTAAATCTGTACTACACGGTGGAGGTAGTAGTTCAAATGGATAAGATGCTTCAACAGTCATCAGACCAGGAGATAATTGTTAGGTGTAAATTGCAACCTCGTGCGGTGCGGATAAACAGCTCAGCGCTTGAAGGCGTCATTAAATCTAGACTGCGAGAAATTACCGGCCATGAAGGGAAACGGATGAGAACTGGACGGAATAGAAAGGGTTGGGATAGGATGGTTGAGGTGGAACAGCAAGAGCTGTTAGAAGCAGCTCGAGCCTGGATGCAGCTGGCGCCAGACACGGTGGAGGTCGGACAACCCACGGAGCTCATGATACAGACATGTGATGTGGGCGTCGGTCTCCGTGTAACAAACTGCATAGCGCACGATGGTTTAGGAGAGGCCTCGCAGAAGTTACTCGACGAAGCTGGCTGTCCCATTGACGAAACTATATTCAACTCCCCAACCGTGCATCAACACAGACGAGATGAGATAGACTTTACCGACAACGAACAGAGCCTAGAGAACTCGAGGGTAGCGAGTACTGACTCTGTCATCAAAAATATGATGACCTTCCAACACGCTGTGACCACGTTCGCAGCGTTCAAGTTTCCCGACAGGGCGAAATTACATCTCTCCTGCGGCATAGAACTCTGTAAGGGCGTCTGCCCCAAGGTCGATTGTAAGGCCCTTCAAAAACCCCAACAGACGAAGGACGGGCTGGTGAGGAAGGCCCGTCTGGATAAGGACGCTAAGGGTGTGGTGATAGAAAGACTAGAAGTCTACAATAGTATAGAAGTCCTGGCACCGAACATAGAACTAGAAGACGAGGCTTCTATAAGAGGTTCCAGAAGGGTAGAAGAAGAAGATGGGCTGAAAGGTTTTTCCCCCGGCGACAAAACAATATGCCTATCTCCTGGGAAAATGGCCTTAGCCTTTTGTATACTTGGCATCATTTTCCTATGTGCTATTGCTGTAGCTTTCGCGTCCTTAGTGCGAGCGAGACGGAGAACACCTCGAGAGCCGGTGAATACGTCTCTCTCTTTCTACACCGGTAGCAAGAGTCTCTTCTCTTCTAGTGGCAGCAGTAGTTCCGGTTTAAGTGGCAGCAAGCTTCTTCTAACCGATAGTCCATATTTAGACCACCATTCGTCTTCCAGTAACAATTGGCCATATGCTCGGGCATTTTAA

Protein sequence:

>DPOGS214038-PA
MWRVILLTVLLCGVQSHPNKVRNVTTSCDKGSITINIDMEKPFKGLVFSKDFSRECRILGQMQTNVSLHLPSNTCGVRTSIQNNTTKRYDELNLYYTVEVVVQMDKMLQQSSDQEIIVRCKLQPRAVRINSSALEGVIKSRLREITGHEGKRMRTGRNRKGWDRMVEVEQQELLEAARAWMQLAPDTVEVGQPTELMIQTCDVGVGLRVTNCIAHDGLGEASQKLLDEAGCPIDETIFNSPTVHQHRRDEIDFTDNEQSLENSRVASTDSVIKNMMTFQHAVTTFAAFKFPDRAKLHLSCGIELCKGVCPKVDCKALQKPQQTKDGLVRKARLDKDAKGVVIERLEVYNSIEVLAPNIELEDEASIRGSRRVEEEDGLKGFSPGDKTICLSPGKMALAFCILGIIFLCAIAVAFASLVRARRRTPREPVNTSLSFYTGSKSLFSSSGSSSSGLSGSKLLLTDSPYLDHHSSSSNNWPYARAF-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: