MonarchBase - Protein-coding gene

DPOGS210753
Transcript	DPOGS210753-TA	1710 bp
Protein	DPOGS210753-PA	569 aa
Genomic position	DPSCF300013 + 1032060-1108354
RNAseq coverage	21x (Rank: top 79%)

Annotation
*Heliconius*	HMEL017477	0.0	91.16%
*Bombyx*	BGIBMGA006288-TA	0.0	89.53%
*Drosophila*	dy-PA	2e-165	63.25%
EBI UniRef50	UniRef50_E0VTZ3	2e-167	64.38%	Cutilin-1, putative n=2 Tax=Neoptera RepID=E0VTZ3_PEDHC
NCBI RefSeq	XP_002429587.1	3e-168	64.38%	cutilin-1 precursor, putative [Pediculus humanus corporis]
NCBI nr blastp	gi\|242018241	6e-167	64.38%	cutilin-1 precursor, putative [Pediculus humanus corporis]
NCBI nr blastx	gi\|242018241	9e-176	56.20%	cutilin-1 precursor, putative [Pediculus humanus corporis]

Group
KEGG pathway
InterPro domain	[169-420] IPR001507	5.1e-38	Zona pellucida sperm-binding protein
Orthology group	MCL15820		Insect specific

Nucleotide sequence:

>DPOGS210753-TA
ATGATGCAAGTGCACATGTCGGTTCTAAACTTACCACATCCTCAGAGCGGATCTTATAGTGATCAAACGACAAATGAAGGGGGCGGCGGTGGAGGTTCACCTAATTCCGACACCAACAGCGTTGCAGAACCCTCTAGCGACCAACTGGCGATGGAATCATCAGAACGAGAAACCCCAAGTCACGCTTACAACGGTCCACCGCCCCCAGTGCCACCTCCTCACGTTACAAATCGAAGACAAAATGGGCCCCACCACCAGTCACACCATCCAATAGGTATGCCTCGTATTTCTAATCATCAGCAAATTCATTCAAAGCCATTCGCCCTTGGACCTCCTGTGAATCATCATAAAAATGACATTGGACCTGGATTCCGAGGGCCGCCACCACCCCAAGCTCCACCAAGTGACGCTCAAGCCTCGGCCAGTGACAAGGTCTACAGCACTACTGGTGACGTTTGGCCTGCTCCAGCTCCTGATATGCCGAAAATTTTATCCCTCGACGTCAAATGTGAAAAGAATGCCATGAGAGTATTTCTCAGTTTCGACAAACCATTCTTTGGTATCGTTTTCTCCAAAGGTCACTATTCTAACCATCAATGTGTTCATCTTCCACCAAATTTAGGCAGATCTTCGGCCTCCTTTGAAATTGGTGCGCACGCATGTGGCACAGCTGGAAGCGGAGATCCAAGATACAGGAGCGATGTTGCAGCAGCTGGCACGTACTTTGAAAATGTTATTGTCATACAGTATGACCCGCAAGTTCAAGAAGTTTGGGATCAAGCACGCAAACTGCGGTGCACGTGGCACGACCAGTATGAAAAAGCTGTTACCTTCCGCCCCTTCCCCGTAGATATGTTGGATGTGGTTCGTGCTGACTTTGCTGGAGATAATGTGGGATGCTGGATGCAAATACAAGTTGGTAAGGGTCCTTGGGCTTCTGAAGTATCCGGATTAGTTAAAATAGGTCAGACTATGACTATGGTATTAGCGATTAAAGATGATGATGCAAAGTTTGATATGTTAGTTCGTGATTGTGTAGCTCACGATGGTCAACGCGCCCCTATACAATTAGTCGATAGGCGTGGCTGTGTAACTAGACCAAAACTAATGTCGAGGTTCACAAAGATAAAGAATTTCGGAGCTAGCGCATCAGTGCTCTCATACGCGCATTTTCAAGCTTTCAAATTCCCAGACTCCATGGAAGTACATTTCCAATGTACTATTCAGATTTGTAGATACCGATGCCCCGAACAATGTACTGATGCACCTCATAATGTTATTGGCCCTCACGCTGAATACGGACCACCACAAATTGATCAGTCATATCCCGTAAGTGTTGAAATAAGGAGGGATGAAAGAAGAGTAAGGAGGCAACGTAGAGCCACATCACCTGAAAAGGAAGTCGGCGTTAACAGAGTCATCCGAGTTGTGTCCGCTGGAGACCTGAATTTAGATAATAATGAAGAATCGATCACTCCCAAAATTGTTCCGACGCCAGGACTTGTTTGCATGACAACGCCAGGATTTGCTGCAACACTTGGAACACTTCTTGCCACTCTTATATGTTCGTGCGCAGTGTCTGCAGTATTATTCTTTAAATTACGTCCCATTACAAAACTTAAAAAGAAAACTGCTGCTATTAGCACGATACCACGACCACACCCAACAACAGGACCACATGTCATTTCGAAAAGCCGATTTTATTCGTAA

Protein sequence:

>DPOGS210753-PA
MMQVHMSVLNLPHPQSGSYSDQTTNEGGGGGGSPNSDTNSVAEPSSDQLAMESSERETPSHAYNGPPPPVPPPHVTNRRQNGPHHQSHHPIGMPRISNHQQIHSKPFALGPPVNHHKNDIGPGFRGPPPPQAPPSDAQASASDKVYSTTGDVWPAPAPDMPKILSLDVKCEKNAMRVFLSFDKPFFGIVFSKGHYSNHQCVHLPPNLGRSSASFEIGAHACGTAGSGDPRYRSDVAAAGTYFENVIVIQYDPQVQEVWDQARKLRCTWHDQYEKAVTFRPFPVDMLDVVRADFAGDNVGCWMQIQVGKGPWASEVSGLVKIGQTMTMVLAIKDDDAKFDMLVRDCVAHDGQRAPIQLVDRRGCVTRPKLMSRFTKIKNFGASASVLSYAHFQAFKFPDSMEVHFQCTIQICRYRCPEQCTDAPHNVIGPHAEYGPPQIDQSYPVSVEIRRDERRVRRQRRATSPEKEVGVNRVIRVVSAGDLNLDNNEESITPKIVPTPGLVCMTTPGFAATLGTLLATLICSCAVSAVLFFKLRPITKLKKKTAAISTIPRPHPTTGPHVISKSRFYS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: