MonarchBase - Protein-coding gene

DPOGS211178
Transcript	DPOGS211178-TA	1875 bp
Protein	DPOGS211178-PA	624 aa
Genomic position	DPSCF300007 + 421698-428361
RNAseq coverage	47x (Rank: top 71%)

Annotation
*Heliconius*	HMEL012418	4e-163	86.22%
*Bombyx*	BGIBMGA003167-TA	1e-151	72.85%
*Drosophila*	CG16798-PA	2e-48	39.51%
EBI UniRef50	UniRef50_D6WL58	9e-75	59.18%	Putative uncharacterized protein n=1 Tax=Tribolium castaneum RepID=D6WL58_TRICA
NCBI RefSeq	XP_972996.1	2e-75	59.18%	PREDICTED: similar to CG16798 CG16798-PA [Tribolium castaneum]
NCBI nr blastp	gi\|91082933	3e-74	59.18%	PREDICTED: similar to CG16798 CG16798-PA [Tribolium castaneum]
NCBI nr blastx	gi\|91082933	2e-71	59.18%	PREDICTED: similar to CG16798 CG16798-PA [Tribolium castaneum]

Group
KEGG pathway
InterPro domain	[146-259] IPR001507	2.4e-06	Zona pellucida sperm-binding protein
Orthology group	MCL18425		Insect specific

Nucleotide sequence:

>DPOGS211178-TA
ATGACAGAGGTCATATTACCGATTAGGGAACAGGCCAAGGTTCTGCACCTTATAGGCGAGCCAGACTTTCGCGATGTCCGATTGCGTTGGGAGTACGGCGGGAATGAAGATGAAGATTTGCAGAAATTACTAGCCTTTCAAATACATTACTGTGAACTGCAAGCCTGGGGGCAATACCGATGTAGAACTAAGGTGGTAGATAATTTTGAAGAAGAGAGATCTTCTAGGATGACGATTGAGACGACCACCAACAAGGTCCCAGCCGGTAAACGCGGTCGGACCTACACCACATATATCTCTGGCCTCCGTATGGCCACCACGTATTCTTTCGAAGTACGTCCTGTCAAACGTGAAGCTCGTGATTTGGCTGACCCGCAATCTATTGGATCTAAAATCATCATTGTACCTACTAAAGGATTTTCAGCGCGAGCTACCCAGTGCTTGCCTCATGCTAGTGAAGTCGAGGTTTCCACGGGGCCCTTCTTTGGGGGTCGGATAGCTGTGGAGGCGGCTGACGGTGGACCGGAGAGATGCTCCCTTCAAGGGAACCCGAACAGCGCCCAAGACGCGTACATACTAAGGATTCATCATGAGGAATGCGGTTCGGAAGTCAACGAAACTACCGTCGCGACTTATGTCATAGTACAAGAGAACCTGCCGATTCTAACTCACAGTACCCGCCGTTTTCTGGTGTTATGCACCTACAAACCGGAGACATTGACGGTGAGGGCCGGCATCAACCTGCCAAAGACGAATCCAGGGGATGTTCTGTTGGAGACGAAACCACAAGGAATCGTTTTGCACCTTATAGGCGAGCCAGACTTTCGCGATGTCCGATTGCGTTGGGAGTACGGCGGCAATGAAGATGAAGATTTGCAGAAATTACTAGCCTTTCAAATACATTACTGTGAACTGCAAGCCTGGGGGCAATACCGATGTAGAACTAAGGTGGTAGATAATTTTGAAGAAGAGAGATCTTCTAGGATGACGATTGAGACGACGACCAACAAGGTCCCAGCCGGTAAACGCGGTCGGACCTACACCACATATATCTCTGGCCTCCGTATGGCCACCACGTATTCTTTCGAAGTACGTCCTGTCAAACGTGAAGCTCGTGATTTGGCTGACCCGCAATCTATTGGATCTAAAATCATCATTGTACCTACTAAAGGATCGCGAGCTACCCAGTGCTTGCCTCATGCTAGTGAAGTCGAGGTTTCCACGGGGCCCTTCTTTGGGGGTCGGATAGCTGTGGAGGCGGCTGACGGTGGACCGGAGAGATGCTCCCTTCAAGGGAACCCGAACAGCGCCCAAGACGCGTACATACTAAGGATTCATCATGAGGAATGCGGTTCGGAAGTCAACGAAACTACCGTCGCGACTTATGTCATAGTACAAGAGAACCTGCCGATTCTAACTCACAGTACCCGCCGTTTTCTGGTGTTATGCACCTACAAACCGGAGACATTGACGGTGAGGGCCGGCATCAACCTGCCAAAGACGAATCCAGGGGATGTTCTGTTGGAGACGAAACCACAAGGAATCGTGGAGCCTTACGATGACAATAACCTGCAGCCCGCAAGACTTGAAGCCAGGAGGGAAGAAACACAGCAGAGTATGTTCGGGGAAATTATGTTAGTGATGTTCTTGGTGGCGGCAGCGTTTGGAGGTGTCGCTTTTCTGATATGGAAGGTTGTGCCGCAGGCTGGCAAGGAAGACAGCATCTCCATATCAACATCCTCAACCTTGTCCCGCAGCGGTATATTCAGCAGGCGGAACATAGATCGATTCTCCGATAAGAGTTCCGTATACTCCATCACGTTGTCTGAAAAAGACGTTAAGAAAAGCGACGGAGACGATACCTCGGAGGCCTAG

Protein sequence:

>DPOGS211178-PA
MTEVILPIREQAKVLHLIGEPDFRDVRLRWEYGGNEDEDLQKLLAFQIHYCELQAWGQYRCRTKVVDNFEEERSSRMTIETTTNKVPAGKRGRTYTTYISGLRMATTYSFEVRPVKREARDLADPQSIGSKIIIVPTKGFSARATQCLPHASEVEVSTGPFFGGRIAVEAADGGPERCSLQGNPNSAQDAYILRIHHEECGSEVNETTVATYVIVQENLPILTHSTRRFLVLCTYKPETLTVRAGINLPKTNPGDVLLETKPQGIVLHLIGEPDFRDVRLRWEYGGNEDEDLQKLLAFQIHYCELQAWGQYRCRTKVVDNFEEERSSRMTIETTTNKVPAGKRGRTYTTYISGLRMATTYSFEVRPVKREARDLADPQSIGSKIIIVPTKGSRATQCLPHASEVEVSTGPFFGGRIAVEAADGGPERCSLQGNPNSAQDAYILRIHHEECGSEVNETTVATYVIVQENLPILTHSTRRFLVLCTYKPETLTVRAGINLPKTNPGDVLLETKPQGIVEPYDDNNLQPARLEARREETQQSMFGEIMLVMFLVAAAFGGVAFLIWKVVPQAGKEDSISISTSSTLSRSGIFSRRNIDRFSDKSSVYSITLSEKDVKKSDGDDTSEA-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: