MonarchBase - Protein-coding gene

DPOGS213604
Transcript	DPOGS213604-TA	1197 bp
Protein	DPOGS213604-PA	398 aa
Genomic position	DPSCF300033 + 722409-733301
RNAseq coverage	95x (Rank: top 62%)

Annotation
*Heliconius*	HMEL013673	5e-98	78.45%
*Bombyx*	BGIBMGA011666-TA	0.0	81.43%
*Drosophila*	CG13196-PA	5e-11	26.67%
EBI UniRef50	UniRef50_E2C9Q5	2e-135	57.18%	Putative uncharacterized protein n=9 Tax=Neoptera RepID=E2C9Q5_HARSA
NCBI RefSeq	XP_001809747.1	8e-151	62.62%	PREDICTED: similar to AGAP009011-PA [Tribolium castaneum]
NCBI nr blastp	gi\|189235212	1e-149	62.62%	PREDICTED: similar to AGAP009011-PA [Tribolium castaneum]
NCBI nr blastx	gi\|189235212	3e-144	62.62%	PREDICTED: similar to AGAP009011-PA [Tribolium castaneum]

Group
KEGG pathway
InterPro domain	[126-272] IPR001507	1.5e-09	Zona pellucida sperm-binding protein
Orthology group	MCL17020		Insect specific

Nucleotide sequence:

>DPOGS213604-TA
ATGACGGGCGCCACCAGCTGTCTTATAGTGCTGCTGCTTTTGGTTCCGGCCATCTCAGCACAAGATTACGACGTGACTGATATCCAATGCACATTCGCGACCACGGGCTCCGGTATAAGGGACTCTGTATCAGCATTGTTAAGGAAGCCCGAGGGGTTCCGCGGGGCTCCGTTGTTCGCTGACGACCGCGCTACAGACCCTATCTCAGATTCCGGTTTCGTGCACGTTCGCATCTGGTTCCCCCAGTTCCCGGGGGTGGTGATGCAATCAGACCAGGAACTGATCATCATGTGCAAGCCCCCCGAGCCCACCATCATCGAGAACAAGGCAGCAGGATTTGCGGGTAGCTTTCCGCACGGCGCTCGCGTTTCCGGCGTCGTCGAAGAAACTCCGGGCCGTCTTGAGTATGAAGTAGCGCTGTATAAGGAGGCGCCCCCTGTGTCCCGACACTCAAACCACTCATTGGATATGCCTGTTGACCAGGCTGTTCCAATCGGAACTAAATTACAATTAAGAGCACGCATCAACCCGGATTCAGCCTGGCGACATATCAAACTCCTAGAGGTCGCTGTGTCCCCCGACCCTGATAGACCTCACGCTAATGGAGCCGTGTTACTCGTGAAAGACGGCTGCCGGAACAGAGATTTCGCATCTATCATACCACACCAGCCGGCCAGGTACAGGGAGCGTCATAACGAAGTTTTTTTGGACTTCGAAGCGTTCCTCTTGGCTTCCATGAAGGAGCGTTCCACTTTATGGATCCACTCACAGATCAAGGCGTGTATGGACGCAGCTGACTGTCAACCGGACTACTGCCTCGACTTATATGAACCGTCAGGTCACGGTCGTCGTAGAAGATCGCTGCCAGAAAACGAGACAAAGACTATCTCAGACAGCCAATATACGCGGTTCAAAGAGAATCTGGAGTACTCGGTGGTGATGCCGGGGGAGTTGTTCCACAAAAAGTCTTTGGAGGCGACGTGTGCCACCTCCATGATGGTCGCGGTCGCCCTCGGAGCTCTGCTCTTCATGTCCGCCTTATTGATGTGCTATCTCGCTACTAAGTTGAATTCAACGATGCTCAAAAACAGCAGTCTTCAAACGCCAACTGGGAAAGGATTTGAACAAATATTAAGAGAACTGGCGCATCACTCACTCCCTGATACGGGCTACACGGGTCGCCCCACCGTACAATAA

Protein sequence:

>DPOGS213604-PA
MTGATSCLIVLLLLVPAISAQDYDVTDIQCTFATTGSGIRDSVSALLRKPEGFRGAPLFADDRATDPISDSGFVHVRIWFPQFPGVVMQSDQELIIMCKPPEPTIIENKAAGFAGSFPHGARVSGVVEETPGRLEYEVALYKEAPPVSRHSNHSLDMPVDQAVPIGTKLQLRARINPDSAWRHIKLLEVAVSPDPDRPHANGAVLLVKDGCRNRDFASIIPHQPARYRERHNEVFLDFEAFLLASMKERSTLWIHSQIKACMDAADCQPDYCLDLYEPSGHGRRRRSLPENETKTISDSQYTRFKENLEYSVVMPGELFHKKSLEATCATSMMVAVALGALLFMSALLMCYLATKLNSTMLKNSSLQTPTGKGFEQILRELAHHSLPDTGYTGRPTVQ-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: