MonarchBase - Protein-coding gene

DPOGS208550
Transcript	DPOGS208550-TA	2211 bp
Protein	DPOGS208550-PA	736 aa
Genomic position	DPSCF300064 + 1039726-1050713
RNAseq coverage	602x (Rank: top 21%)

Annotation
*Heliconius*	HMEL016603	6e-162	50.08%
*Bombyx*	BGIBMGA010324-TA	1e-106	62.01%
*Drosophila*	CG17111-PB	2e-64	26.70%
EBI UniRef50	UniRef50_D6X332	4e-77	30.18%	Putative uncharacterized protein n=2 Tax=Tribolium castaneum RepID=D6X332_TRICA
NCBI RefSeq	XP_969426.1	8e-78	30.18%	PREDICTED: similar to CG17111 CG17111-PA [Tribolium castaneum]
NCBI nr blastp	gi\|270013869	2e-76	30.18%	hypothetical protein TcasGA2_TC012533 [Tribolium castaneum]
NCBI nr blastx	gi\|270013869	6e-79	30.03%	hypothetical protein TcasGA2_TC012533 [Tribolium castaneum]

Group
KEGG pathway
InterPro domain	[309-564] IPR001507	1.4e-19	Zona pellucida sperm-binding protein
	[223-290] IPR003014	2.9e-06	PAN-1 domain
Orthology group	MCL17004		Insect specific

Nucleotide sequence:

>DPOGS208550-TA
ATGATGCAACGGAGAATTTTCGTGATCTTGTCTATATTTACATTTATTACAAGTAGCGAATCACAATGTCGTCTGCCGGAATCAGAGACCTTCGTGAGATGGTCAGGTATGACTCCGGACCAGGCAACACCTGTATTTATGTACTCCGCTAGTGGGGAAGAAGAATCTCTAACAGGAGCCTGCTTGAGCCGATGCCGCGAGCTCGCAGATTGTGCTGCTGTCATCATTGTTTATACTAAAGGAAGCTGTCAGGGCATTTCTAGTTCACGGACAAATCAGCTGCGACCGGATAACGAAGTCGCTTATTTTAACAAAGTATGCCTAAAATTGCCAGACAATTGTAAGAAACTTTGGTGGGCGCTAGAGAGTACTCCAGGATATTATTTGAATTCTGATGGACCTGATGTCAAGGTCGTTGTAAACTCAACAGTTCAGGATTGCTACAATGCGATGTTTTCTACAAACGAAAAACGATACCGATCGGCGCAATGGATCGAACCTGGAAGTCCGTTAGACAGTTATTTTGTAGCACAAAAAGAGATAGGGAATTGTATATTAAATGGAGAAAATAAGTTCACTGAACCCGAGTCCTACCGAGTGTCAAACTCGTATACCTTCTACATAGAGAATCAGTGCTCCCATGATTATCCAAAAAAAATTGACAGATGTTCGTATGAAGAATATTACAATCAAACAGTCAAGCATGTTGATTTGACAGCGAACAATTTCAGCAAAGACGAGTGTAAAACAGCGTGTGAGCAGGAAAATCGTTTCGTCTGCAGGGGATTCACTTGGATAGCGTCTTCCTCTCGCGGTATATGTGATCTCCACAGTGAAGACCTGGTAACAGCTGGCTCCTGGCTCCTGAGACGAGTGTCCGGGGCATCGTATTATCGTCGCGTTATATGTCTTAACATCAGCGTGGAATGTTCACCGTCTCACTTAGTAGTGACATACAGACCTCATGGTATGTTCCGTGGGAGGGTGTACGTCCCCGGGCGGGGCGAGCGTTGCAGTGCGAGGTCATTGACACCGGCCTCACACGTCCGCCTCGCGTTGCCTCTATACGGCGATTGTGACGTCAACTTCGCATTCGCCATCTCTAAAACACCAGCAGGCATCGTTAATAGAACTATGGCGTATGTGATGCTCATGATTCAGAACAACCCGATCATACAGACAGCGGGAGATCGCTGGGTGAGAGTGGGGTGCTCGCCTGGAGACCGACAAGGGTATACTAAAGTGGACGCCACAGTCGCTGTTCAGGAGTCGGGGCGTCCGTCTGTTGCGAGCGAATCGGGCGAGGTGTCTGATAAACTGGGTGCCAGCGCTGTCCTCGGGACAACGCCACCTCTCACTATGTACGTGGTGAGAGCAACCGAAGACCAAGGGACGGGAGCCGTGGCCCTGGGAGATCTGCTTGAACTAAGGATAGAAACTACTGGAGATTCTGAAATTGAGGCGTATCATTTAGTAGCGTCTTCGAGACTTGGAGACAGTTCTGTGTTATTGTTGGACAACAGCGGATGCCCCACGGGACAGGTCGACTTCCCTTCATTCAGTCGCTCTCGTTCAGGAGTGAGTCAGCGCCTCTTCTCCCGGTTCAAGGCGTTCCGTTTTCCTACGTCTCACGTAGTTCGCTTCGCTGTCGTTGTACGATTCTGTCAAGATAAATGTGCTCCGATCAACTGTGAAATGTTGGATAGACTCAGAGACGCGAGAGGCGCGAACGAGACTTACACGACTGATTCAGAAGTAGCGGCGAGTGTTAAGGAGGAGACATCATGGCCGACGGGAGTGGTGGCGCAGGGAGGGCCGGTGATGTGTATAGGGGAGGGACAGGGTGAGGTGTTGGGGATGGAGAAGAGAGTACCCTTGGAACTGGAATTAGTGGTGGGGGCGAGAGATGTACTATCAGCGGACACACTCGTGCGCGCCGACCACAGAAGTTCTCTACCGGAGGTTGACGTCAGCAGTCCCTTGGTGTGTGTGCACGAGTTAGTGTTGGTGTCGCTGATGCTGGCGTGGCTTGCGGTGCAAATACTGCTGCTGCTGGGCTGCTGCGTCCTTGTTAAACGATACAGAAATCTAGCAGAAATGAATATGCAAAAAGACTACCATTCGTTTGACAACATTGGTTTTGACAACGTGTCAACACACAGGCGGGTTCATTGGCCGGATCAAAACATAGATATAATACATACAAATTAA

Protein sequence:

>DPOGS208550-PA
MMQRRIFVILSIFTFITSSESQCRLPESETFVRWSGMTPDQATPVFMYSASGEEESLTGACLSRCRELADCAAVIIVYTKGSCQGISSSRTNQLRPDNEVAYFNKVCLKLPDNCKKLWWALESTPGYYLNSDGPDVKVVVNSTVQDCYNAMFSTNEKRYRSAQWIEPGSPLDSYFVAQKEIGNCILNGENKFTEPESYRVSNSYTFYIENQCSHDYPKKIDRCSYEEYYNQTVKHVDLTANNFSKDECKTACEQENRFVCRGFTWIASSSRGICDLHSEDLVTAGSWLLRRVSGASYYRRVICLNISVECSPSHLVVTYRPHGMFRGRVYVPGRGERCSARSLTPASHVRLALPLYGDCDVNFAFAISKTPAGIVNRTMAYVMLMIQNNPIIQTAGDRWVRVGCSPGDRQGYTKVDATVAVQESGRPSVASESGEVSDKLGASAVLGTTPPLTMYVVRATEDQGTGAVALGDLLELRIETTGDSEIEAYHLVASSRLGDSSVLLLDNSGCPTGQVDFPSFSRSRSGVSQRLFSRFKAFRFPTSHVVRFAVVVRFCQDKCAPINCEMLDRLRDARGANETYTTDSEVAASVKEETSWPTGVVAQGGPVMCIGEGQGEVLGMEKRVPLELELVVGARDVLSADTLVRADHRSSLPEVDVSSPLVCVHELVLVSLMLAWLAVQILLLLGCCVLVKRYRNLAEMNMQKDYHSFDNIGFDNVSTHRRVHWPDQNIDIIHTN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: