MonarchBase - Protein-coding gene

DPOGS210943
Transcript	DPOGS210943-TA	2229 bp
Protein	DPOGS210943-PA	742 aa
Genomic position	DPSCF300004 - 1550036-1555715
RNAseq coverage	504x (Rank: top 25%)

Annotation
*Heliconius*	HMEL007144	89.96%
*Bombyx*	BGIBMGA006371-TA	83.27%
*Drosophila*	neo-PB	59.65%
EBI UniRef50	UniRef50_Q9VAG2	59.65%	CG7802, isoform A n=24 Tax=Neoptera RepID=Q9VAG2_DROME
NCBI RefSeq	XP_968199.1	72.15%	PREDICTED: similar to AGAP002316-PA [Tribolium castaneum]
NCBI nr blastp	gi\|91079482	72.15%	PREDICTED: similar to AGAP002316-PA [Tribolium castaneum]
NCBI nr blastx	gi\|91079482	71.99%	PREDICTED: similar to AGAP002316-PA [Tribolium castaneum]

Group
KEGG pathway
InterPro domain	[383-618] IPR001507	2.5e-30	Zona pellucida sperm-binding protein
	[209-287] IPR003014	5.8e-17	PAN-1 domain
	[205-286] IPR003609	7.9e-12	Apple-like
Orthology group	MCL11823		Insect specific

Nucleotide sequence:

>DPOGS210943-TA
ATGCGGTTATTACTTAGTTTAGTAGTGGTGATTTGTGCTGTCGATGCAGCCAAAAGGTTCGAAGGAACTTTGAGATCATCAGCCGATGCTCCTCCTCAAGACAACCTGGCTGTTGAGTCAGGAGCACCTGAACCTGCTATCGTTGCTGCACCTCAAGAATACACTAATCCTGGCGCACCACCTCCTGAAACCCTGAAAAATGCTGAAGAAATAGAAGAAGAAAAAGAACAAGATATAGAGCCACCAGCATCCGCTCCGGAAACCGCGTCCGGTGGAGTTCCTCCGTCAGCGCCTAGTGGTATTTCTGCTCCCTCGGCACCCGCCAATTCTCTCGAAGAATGTGATCCGGAGAAAATTGGATTCGAACTGGTCACTGGATATGTATTCTCTGCGCCATCACATATTCTCGACGACATCCCCGGCACACTTATGTTGACTGATTGTTTAGAGCAGTGTCAAGCTAACGACACTTGTCGCGCCGTCAACTACGAAACTGGTCTATGCGTGCTCTTCAGCTCTGACGCCGATCAATTGCCCGGAGCTTTGACAAAATCCCAGTTTCCGGTATTCACGATCTACGCTCAGAAATCGTGTCTGGGAGTGAAGCCGTGTGAACGAGCTTGGTGTTTCGATCGCGTTCGCGGATACAATCTCAAGGGATTCGGCAAGAGAACGCATACCGTTGAATCCAGACAAATGTGCCTCGATCTTTGTCTAGGAGAAAATGAATTCGTTTGCAGATCGGCGAACTATAACAACAAAACAGGTGAATGCGTTCTGTCGAACATGGATCGTATCACTTTAGCTGGAACCAGCGCTTTCCAACCAAACGAGGATGTTGACTACTTGGAGAATAATTGTGTGGAGGAGCCTACAAAGCTTTGCGAGTTTAAAAAGATGAACGGACGCATTCTCAAGACGGTGGACTCGGTGTATCAGGATGTCCAAACGATCGAGGAATGTCGTGAATTGTGTCTCAATTCGCCTTTCCGTTGCCATTCTTATGATCACGGGGACACGGGAGATCATGTGTGCCGTCTTTCCCACCATTCAAAAGCCACGCTCGCTGATATCCAGGATCCCTACTTGGAAGTACCCGAAGCTGCCACTTATGAACTTTCTTCGTGCTACAATGTATCCATTGACTGTCGGGCAGGTGACATGGTAGCTCGAATTCAGACATCTAAATTGTTCGATGGAAAAATTTATGCAAAGGGAAGTCCCAATTCATGCGTTGTCGATGTTAAACAAAGTCTGGAATTCGAACTTCATATGGAATATAATAATATCGATTGCAATGTTAAGCAAAATGGACTTGGAAGATATCTGAATGACGTCGTTATTCAACATCACGACACTATCGTTACTTCTTCTGATCTTGGTTTAGCGGTAACTTGTCAATATGACTTGACCAACAAGACTGTAGCTAATGAAGTCGACCTCGGAATTCAGGGTGAGATCCAGACAGGATTAACAGAGGAAGTTATTGTGGACTCACCCAACGTAGCCATGAGAATTACTGATAGAAGTGGAGACGACACTATTGTTTCTGCTGAAGTTGGAGATCCATTGGCACTTCGTTTCGAAATCATGGATCAAAACTCACCATTCGAAATTTTTGTTCGAGAACTTGTCGCAATGGATGGCGTCGACTCCAGTGAAATTACTCTCATCGATAGCTATGGTTGCCCAACTGATCATTTTATCATGGGACCCCTCTATAAATCTACTGCAAGCGGAAAGACCCTGCTTTCACACTTTGATGCGTTTAAGTTCCCATCATCAGAAGTAGTACAATTCCGCGCCTTAGTGACACCCTGTATGCCGACTTGCGAACCCGTTCAATGTGACGGAGGTCCAAATGAATTGCGCACAGTTTCATCATATGGACGTAGGAAGAGACGTTCGACAACTCCCACTGACGATATGCTTCTCGTCCAGACTATTCAAATCACCGACAAGTTCGGTTTCGACAAACAGAAAGCAAAGAACGTCACCGAAGACAGCGTTTACATCAGAGAGAGCGATGCTACGTGTGTTAATGCTGCTGGTGCTTTATTGGCTGGAGCGGCATTCATTGCCGTACAGTTAGTGGTATTGGCTGCATGGACCTGCAGTTGGCAGCGCCGACGAGCAGCTGCTAAAGCTGAGCTCCTGCCTGGACCAAACCCTAATTCACTCTGCAAAGTCTATGATGCCGGTTTCTCCCGCGCCCAGAGGCACTTCTGA

Protein sequence:

>DPOGS210943-PA
MRLLLSLVVVICAVDAAKRFEGTLRSSADAPPQDNLAVESGAPEPAIVAAPQEYTNPGAPPPETLKNAEEIEEEKEQDIEPPASAPETASGGVPPSAPSGISAPSAPANSLEECDPEKIGFELVTGYVFSAPSHILDDIPGTLMLTDCLEQCQANDTCRAVNYETGLCVLFSSDADQLPGALTKSQFPVFTIYAQKSCLGVKPCERAWCFDRVRGYNLKGFGKRTHTVESRQMCLDLCLGENEFVCRSANYNNKTGECVLSNMDRITLAGTSAFQPNEDVDYLENNCVEEPTKLCEFKKMNGRILKTVDSVYQDVQTIEECRELCLNSPFRCHSYDHGDTGDHVCRLSHHSKATLADIQDPYLEVPEAATYELSSCYNVSIDCRAGDMVARIQTSKLFDGKIYAKGSPNSCVVDVKQSLEFELHMEYNNIDCNVKQNGLGRYLNDVVIQHHDTIVTSSDLGLAVTCQYDLTNKTVANEVDLGIQGEIQTGLTEEVIVDSPNVAMRITDRSGDDTIVSAEVGDPLALRFEIMDQNSPFEIFVRELVAMDGVDSSEITLIDSYGCPTDHFIMGPLYKSTASGKTLLSHFDAFKFPSSEVVQFRALVTPCMPTCEPVQCDGGPNELRTVSSYGRRKRRSTTPTDDMLLVQTIQITDKFGFDKQKAKNVTEDSVYIRESDATCVNAAGALLAGAAFIAVQLVVLAAWTCSWQRRRAAAKAELLPGPNPNSLCKVYDAGFSRAQRHF-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: