MonarchBase - Protein-coding gene

DPOGS201720
Transcript	DPOGS201720-TA	3417 bp
Protein	DPOGS201720-PA	1019 aa
Genomic position	DPSCF300269 - 172488-191129
RNAseq coverage	188x (Rank: top 48%)

Annotation
*Heliconius*	HMEL015859	0.0	64.36%
*Bombyx*	BGIBMGA014470-TA	0.0	54.93%
*Drosophila*	pwn-PA	3e-121	44.28%
EBI UniRef50	UniRef50_F4X721	3e-136	36.12%	63 kDa sperm flagellar membrane protein n=6 Tax=Formicidae RepID=F4X721_ACREC
NCBI RefSeq	XP_969198.1	1e-137	51.74%	PREDICTED: similar to pawn CG11101-PA [Tribolium castaneum]
NCBI nr blastp	gi\|91086865	2e-136	51.74%	PREDICTED: similar to pawn CG11101-PA [Tribolium castaneum]
NCBI nr blastx	gi\|91086865	0.0	41.64%	PREDICTED: similar to pawn CG11101-PA [Tribolium castaneum]

Group
Gene Ontology	GO:0005509	1.6e-05	calcium ion binding
KEGG pathway
InterPro domain	[865-896] IPR013091	9.7e-08	EGF calcium-binding
Orthology group	MCL14916		Insect specific

Nucleotide sequence:

>DPOGS201720-TA
ATGGCCGAGAGAAGATGGCGGATGGGTCTCGGCGCGCTGTTCGCCATTTTAATACAAGTCATTAATGGTTACGAAGAGACCTTCACTATATCACAACTAACACCGAAGTCAATTCTAGCTGAGGGTCCTCACGACGTACTGCTGCAAACGAGTCATGTAGAAAACGTAGGATTTAAATTAGAATCAAGTGCCAAATATGACGACATCGATGTTGAACCTGATGATATATTAACTGATTTGGAGACCGAGAACCATATCATAGTTGAGAGATCAGTCGAACCGAGCAGAGGTTCCAGATCCATTAACGATCAGGATGTACCATCGTCGAATAACAACGAAATTGACAACGAATTAGAAATACACAACAAGAGGAGGTACTATGACATCATACCAACGAAAACTCTCGATTACGTTAGGGATGATGAGGGTATGCTAATGTCCTCCGGGTTCGGGGACAAGTTAGAATTTAAATTTCCGGGGGAAGGGAAGAGGGCTCCGAAGGGGCGTGCACTAGCTCCTACGGGGCCCAAAATCAGGCCTACTGCGGTGCAACCACAACTGTTCTCAACAGATACCCTTAAAGACCAGGGGAGACAGAACAGTGAAATACAGAATATAATTACCGGTATCGTAAAGTTGTTAAATGGGAACGTCAATGTGCAGGCCAACACGCAGTTACTGAACGGCCGTCCAAGACCTATGGCGTCCAGGATAAATAACCGTGGACCACCAGATTTCGACGAACCTCTGACACCACCGCCGCTCGCTTATCATCCAACAAAAATACCCCCACCTTACCCCTTTGATAGGCCTATCGGTGTTAATTTAGCTGATCGACTCCCACCGATCAGTAATCGTCCAGGGTTTCATAGACCCATGCCTCCGTGGCAGCGTAGACCTAGACCTCCGAATTCCAATCGGAGACCTAACCCAAACCTTCCCGTTTATAAGCCAACACTGATCCCTCCACCGGATATGACGTATATAAACGAAAAAGAAGACGAGAGTTACAACGAAAATGAATCTCATTTTGACATTCCAAACCACGAGGATAACATTCCGTTCATAACGCTACCGGATACAACTACTGAGATAAGAAATATGACAGAGGAAATTCCAACTACCACCGACACTACGACATCTACAACAGCGTCAACTACTTCTAGGACGACAACTACCACAAGTACTACGACAACTACAACAACTACAACAACTACGACAACACCGAAAACAACGACCGAGTTGACCACCGAGAAGACTACTACAGAAAAGGTCAAGATCGAAAAGCCTGTCAAAGCAGACAAAGAAAAAAAGAGAGACCAATTAGGTCCCGATAAGTTAAAAGACAAAATCAAAGTCACAGAAGATAAACCGACAGAGAGGCCCATCAAGAATGATGCCATCACACCGGTGGCTATAGAACCCTCAGTCAGCGAGAGTCCGACGCCAGTTACACAGTCCACTTCCTCTCCGACCCCTACCGAGGGGTTGATGACGCACGCGCCAACAGTCAGCGAAACCACGAAGATACAAAATATAGAAACCTCCTCCATCAACTCTCAGCCGTTGCCAACATCCCAAGGTATCCCGTACAAGCCGTATCCCCGGCCAGGGATAGTTCTAGACGACACAGATTTCAAGCCCCACAAGTCCAGACACAGGCCTGACGCGTCCGTCATCACAGCCGACAGACTGCCGGGGTACGGGGAGATATTTGACGTGACAGTCTCCGCTATACAGGGCCCAGGGGAAAAAGCTGGACCAGTGAACATACAGACGCATGTACACCACGGGTCACAGTACGCGGACGATATAATAGTGTCAGGGTCCGGGCAGCACAGCTTTGTCTCCATAGACGGCAAGAGGACCTACCTGAACCTCTTCGACACCGGCAGCATCACGCCCACCAGCGTGCAGCCGGCCCCACAGACCAGCCTCCCGAAGACCCACGTCCCGTCGTTGGGGACGGGGGTGGCGATACCAGCCGATGATGTACCGGCTCCGCCGGCACCTCCCCCGAGGAGGCGACCCCAGACACCCTATAGGAGACCCCAGCCGACTGTACGCATAGACACCTGCATCGTGGGCGACGACTCCACCTGCGACCAGAGCCAGAACGAGAGGTGCAGGACGGAGGCTGGTGTGTCCAGCTGCCAGTGCCGCGCGGGCACGGCTCGCCGCGTGCGCCACTCGCCCTGCCGCCGCGCCGTGTCGCTGTCGGTGTCGCTGAGGGTGGACCGCCTCTACGACCGCCAGATCTCGTGGGACGAGAAGCTGTCTGACAAGGAGTCGGAGCCGTACCAGCAGTTGAGCTACGAAGCCGTCAAAGCGATCGACTCCGCGTTCTCTATGACTCCGTTCTCCGATGACTTCGTGAGCGGCTCTGTGGACTCCATCGTGCGAGGTGGCCCGCAGCACCCGGGGGTGTACGTTAACTTCACCGTATTGCTGTCCGAGACCCCCGAGACCGTCCGTCCGGCCGTTGCGGGTGACATCCATCAGCACCTGGTGGGTGTCATCCGCCGCCGGTCCAACAACGTGGGTGCTTCCGCCCTGTGGGTGACGCCCGAGGGCAGCGTGATAAATGTCCGAGATGTAGACGAGTGCTCGTCCCCTGACCTCAACGACTGTCACACACTGGCGACCTGCACCAACACCTGGGGGGCTTTCAAATGCACGTGTCCCAACACGACCCTGGACCCCGCGCCGGTGGCCAGCCGGGCGGGCCGCGAGTGCCGCTCGTGCGCCGCCTCGCACTGCAGCGACCGGGGGCTCTGCCACTACAACAACGGACAGCCTTACTGCACGTGTTCATCTGGTTACTACGGCTCCACTTGTGAGATGGACGGCGAGGTCATAGGGGTCTCCGTGGGGGCTTCGCTGGCGGCCGCGCTCGTCATAGCCATCACACTGGCAGCCCTGCTCAGCTGGAGTACTCTTTGCTGGTGGACTTTCATAACCCGTCCCCAGCTGACCTCTACTCGTAAGGAATGTTCCTCACTAATGTCAAATCTATTCGTCACGGTCCCAGGTTATCGTGATGAGTCGCTATACCGGTAGCCGTGTCTCATATATATACCAGCTAGTTATGCAGAATGCTTTTGTTCCAGGATGGGCATGCATGGAGTTCACACGGGAACTCTCAACACCATGACGTCACGGGCTAACACAGCCTCACACATATACGGTTACACAAATCACCTGGCATCCGAGTCCAGCTCGGAGGCGTCCAGTCACGTGCAGGAGAGAGCCGACCTTCTGGTGCCCAGGCCCAAGTCACGAGCCAGGAGTATGCATAATCAGACGGGCATCTACTATGATGTGGAATATGAGAACGCTGAACCCATATATGGAACCAAAGGCATCCCGCTGTCCACCTACACCGTCAGCAGGGGACCGACCTTCTACAGACAATAA

Protein sequence:

>DPOGS201720-PA
MAERRWRMGLGALFAILIQVINGYEETFTISQLTPKSILAEGPHDVLLQTSHVENVGFKLESSAKYDDIDVEPDDILTDLETENHIIVERSVEPSRGSRSINDQDVPSSNNNEIDNELEIHNKRRYYDIIPTKTLDYVRDDEGMLMSSGFGDKLEFKFPGEGKRAPKGRALAPTGPKIRPTAVQPQLFSTDTLKDQGRQNSEIQNIITGIVKLLNGNVNVQANTQLLNGRPRPMASRINNRGPPDFDEPLTPPPLAYHPTKIPPPYPFDRPIGVNLADRLPPISNRPGFHRPMPPWQRRPRPPNSNRRPNPNLPVYKPTLIPPPDMTYINEKEDESYNENESHFDIPNHEDNIPFITLPDTTTEIRNMTEEIPTTTDTTTSTTASTTSRTTTTTSTTTTTTTTTTTTTPKTTTELTTEKTTTEKVKIEKPVKADKEKKRDQLGPDKLKDKIKVTEDKPTERPIKNDAITPVAIEPSVSESPTPVTQSTSSPTPTEGLMTHAPTVSETTKIQNIETSSINSQPLPTSQGIPYKPYPRPGIVLDDTDFKPHKSRHRPDASVITADRLPGYGEIFDVTVSAIQGPGEKAGPVNIQTHVHHGSQYADDIIVSGSGQHSFVSIDGKRTYLNLFDTGSITPTSVQPAPQTSLPKTHVPSLGTGVAIPADDVPAPPAPPPRRRPQTPYRRPQPTVRIDTCIVGDDSTCDQSQNERCRTEAGVSSCQCRAGTARRVRHSPCRRAVSLSVSLRVDRLYDRQISWDEKLSDKESEPYQQLSYEAVKAIDSAFSMTPFSDDFVSGSVDSIVRGGPQHPGVYVNFTVLLSETPETVRPAVAGDIHQHLVGVIRRRSNNVGASALWVTPEGSVINVRDVDECSSPDLNDCHTLATCTNTWGAFKCTCPNTTLDPAPVASRAGRECRSCAASHCSDRGLCHYNNGQPYCTCSSGYYGSTCEMDGEVIGVSVGASLAAALVIAITLAALLSWSTLCWWTFITRPQLTSTRKECSSLMSNLFVTVPGYRDESLYR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: