MonarchBase - Protein-coding gene

DPOGS215465
Transcript	DPOGS215465-TA	4917 bp
Protein	DPOGS215465-PA	1638 aa
Genomic position	DPSCF300098 - 407498-423802
RNAseq coverage	381x (Rank: top 31%)

Annotation
*Heliconius*	HMEL003427	8e-131	49.16%
*Bombyx*	BGIBMGA007325-TA	0.0	57.49%
*Drosophila*	gp210-PA	1e-56	30.22%
EBI UniRef50	UniRef50_E2BC59	3e-74	24.53%	Nuclear pore membrane glycoprotein 210 n=8 Tax=Formicidae RepID=E2BC59_HARSA
NCBI RefSeq	XP_001601346.1	1e-80	26.32%	PREDICTED: similar to ENSANGP00000004199 [Nasonia vitripennis]
NCBI nr blastp	gi\|345488526	8e-80	26.27%	PREDICTED: nuclear pore membrane glycoprotein 210-like [Nasonia vitripennis]
NCBI nr blastx	gi\|345488526	5e-82	25.07%	PREDICTED: nuclear pore membrane glycoprotein 210-like [Nasonia vitripennis]

Group
KEGG pathway	cfa:484632	8e-26
	K12495 (IQSEC)	maps->	Endocytosis
Orthology group	MCL11310		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS215465-TA
ATGAAGAGCCTACGGACTAGTATTGTCTCCGTGTTGACATTACTTTCATTTATTACTAATTGTGAATCTGCCAAAATAAATACACCGAGAGTTTTGCTTCCATGGTTTGAAAATTTATATGTAAACTTTACTTTTGAAATCATAGAAGGTGGCTGCTATTCCTGGAGTTTGTCTCGGGATGACATCATTGATCTTGTGCCATTGTACGAAGATACATGGGGTCACTGTTCACGAGCTGCACGTGTTTCAGTTTCCAAAACATGTATACCGCCGGGTTCAGTAATTATTCTAGCAGAAGAAGTTAATACAGGAGAGATCCTAAGAGGTGATGTGGATGTTGATATAATAAGATCATTAAAAATTATGAGTACAACTCGTAATTTATATTTGGAAGAAGCCCCCGAAGCTTTTGAAGTGGTGGCATACGATGACAAAGGAAACAAGTTTTCCTCTCTGGAAGGAATAAGTTTCACTTGGAATACTGAAAATGTGGATAATAGTGGAAATCACCCATTGATTACTCTCGTCCAATGGAAAGACACTGATTATGAAGCCCCTCAAGGTATAGCTGAATTAGAAGCTCAAGGCCTACAGTCATATTCTGTGCTTCTTTACGGTCAGGCTATGGGGGAATCCCATGTTACAGTGTGTCTTGATAAAATTTGTACCGACTTTTATCTTCATGTGGTTGCCAGTGTTGTTCTGACTCCGGCAGTGGCTTATGTTGCCCCCGGTGATACTTTAAGATATAAGGTTGTAAGAGCGCGTGCTGGTCGTCTGACTGTACAAGATGTGGCCGCCACAATATACAGAATGGAATTGCCACAATCTGATGTTGCCACACTAGAAGACGGCGTAAGCCTTGTCAGAGCTGCAGAAGTAGGGACATCTCATGTTTACCTTAAATCAGAGGCAACAGAAGTGGCAATGGCAACACTCACGGTTGTAGAACCATACTCTATACGCGTCACTTTAAGACCATCTAATATGATAATACGCGGTGAACAATTTACTGTACACTGTGTTGTATTCGATGAGGATGGGCACCCATTAACAGCTGGGCCGGAAATATCAATAAGGCTTACAGTGAACGGTGAAGCAGATGTCCTTTTGATGAAATCAACAGAAAACGGAACAATAACTGATGCTGTGGCCTACAACACTGGAGAGTTTACAGTTACAGCTAAATTAGTTTCGGTAGCTGGTAAAAGTATGTTTAAAAATGTTGAAGGTCAAATAACTGCAAAGGCTGTAGACCCGTTAGCGATGGTGCCACCAGAAATGTTTATAGCATGGACTGAATCAAACTTGGAGTTTCCATTAAAACATAGCGGCGGTGGTGATGAACATGTGACTTGGTCAGAGAGACAAGATAGCAATCTCGTGCTGACGCCAGCTGGTTTGCTAACTGTACGTGGCGTTGGACACATGGATGTCAGATTACATCTCACAAAGTATCCACATATCCAGGCGTCGGGGAGGGTGTGGTCAGCTGTTCCCGAACTCCTGCAAGTGTCGACCTCAGGAACAGCGCGCGTGGCTCGTCCTCATCATCTACACATCAAGCTCACTGGAACTCATCCGGCTACCGGGGAATTATACAACTTTAATACCTGCAACTGCGCGTCATTTGCTGTGTCCTTAGTCGAGGGTCCGGAGCCGCAGAATGTGACGGCTGCTCCTTGGGTAAAACCAAAAGATGGCGCGTGTTGTGTAGTGGAGTGCACGTTTTTGTTCCGCGGCGTGTCGACGTTGCTTGTGTCCCGTGGTAGGGCTGCCGACACGGCCCGTGTGGCGGTCAGGGCTGCCCCAAGCCTATTGTGGCCGCACGCCGCCGCTCTGTTGCCTGGCGCTACGATACCTGTGATCGGCGAGGGTGAATCACTAATTCCTCAGTCGAGTCAGCCGAGGGTCGCTGAACTCATCGGTCGTGATGGCGCTCCGCCCCACAATTATCCTGATGCCCAACTGTTCACCCTTAAATGCCAAAGGAAAGGTGAAGCGTTGGTGGAATTATCATCGTTGCAAGAGGAACGCGAGTCAGTGTCTCTTGAGACGTGGTGCTCGTCGCACGTGACGCGAGTTCGACTCGATCCTCCGGACACGCAAGGAAATTGTTCAGGACCGAGGCTGTGGTTGCGTCCCGGGCAAGAAGTGCCCATAAAGGTGACTCTGTTTGACACAATAGGAAGACAGCTATTGGACGAAGATGGACCGATTATGCAATGGGATGTACAACCTTATCATATAGGGATAGGTGTCAAAACCACAGACCGATTGTTTGTAGAGACAAACAGTAAATATGCTCCGGTACCAGTACCTGATAAATATTATCAACTAGTAGTGGCAACGGAACAGGCTATAGGATGGAGCGGTTCTATAAAAGCCGCAATTCCTGATACTTCAGCGACGATACAAGCCAAAGTTGTTTCTCCCTTGAAATGCGACCCTATGAAGGTTCACATCGCATGGGAAGGGGAAACCGTGCCTAATATATCAGCCGTCACCGGCGGCAGCGGAAAATATATAGTCGAAACCCCGAAAGGAGTTACAGCATCCGTTGATGAAGGCAGATTATCAGCAGTGTTGCCAACGCCGGGTACTTATGATCTGATTGTGGCAGATTCATGTGTTAGCGGCGAGAAGAACATTGTCGAGGTCATTATAGAAGAGGTTCTGAGTGTGGAGGTATCAACCGCGAGGGCTGTGTGTGTCGACAATTGTATTCCCATCAGAGCGCTGGTGAAAGGCGTCTCCCATAGATATCTAGCCACTAGCCGGGAACCAGATTGGAAGACCGAGGGCGACATTGTAGTTAGGAAGGGACAACTGTGTGGCCTCAGGGAAGGGGTCGGAAGAGTTAGAGCTTCTTTGGGGGGTGTATGGAGTCAATCTGTTGAGGTGTGGGTGTTTCCGTCGCTGGCGATTGTTCCTGAGAGGTCAAGGGTCGCGGTGGGAGGACGCGTTCACCTCAACCACGCGGGAGGTCCCCCGCGACATCTCGCCTCGTTATTGTATACCGGCGGTGGAGAGCACGCGCAGGTTTCTTCGTCTGGTGTGATACAAGGCTTATACCCGGGAAGTACTCGAGTCAAGCTCGTGGCGGTTGATGCTGCTAACGTTGAACTGGCGAGTGCCGAGGCCGAAATTGAGGTTGTGCCTATAACCACGCTCCGAGTGCGGGCGGCGACACAAACTTTGTTAGTGGGGTCGCCCGGACCCGTGTGGATTGAAGCTGCGGGGTTGACAGCGACCGCTCTATCCTCGCTCCAACCGTTGCCTCGAGTCACTTGGGCATTACGGGACCCCACCATGGCCAGGATATACACGTCGCATATTGACGATCGCTTGGAGAGGTCGGTTATTGAAGGACTATCAATACGAGTGGTGCCCTTAAAGCCCGGTGTTATCACACTCGATGTCAGAGTAAGGAACATGGGACAAGTCGCTGAAACTCGTTCCTGGGACAGTACAATCGAGATTCTTGGTGTATCAGATATCCGCACCTCCATAGAGGGCTTGAGAGATATAAACTCTGGTGAGATGTTATCCCTGGCCGTTGGTTCCACCGTTCGTTTGAAGTCACTACCTAAAGGACGGTGGTCTTCCTATCAGGATGGTAATACATGTCGAGGTCGCTATCCCCTACTACTGTACAGTGGAGCCGGCGGAGTCTTCGGAAACGTGGGAGTCCTTGAGGGTTGTGACGAGGAGCGTCCTTGTGCTCGCGGTAGCGAGATTACTCTCAGTGGTCTGGACTCGAATGGAGCTTTTATGAGCTTCGAAAGTTCCTTAGCTGGTGTTACCGTCTCAGACGAGGTCTTCATACCTGGATCCGACGCATACGCCAATAGGATAGTGGCGACGGGAGGATCCGCTTTGTGTATCGAAGGTTCGGGTTGGACGGTTCCAGCGGGGATCCAGGCGGTCTCCGGCGCGGGGCTGACACTGGCGGTGCTGATGTCGGATGCACCTGCCATGCACGTGTTGCGACTCGATCGACCGCCATCTACCGTCAACATTCTGCAACTTCCGCTCTCTAAGATGGAATTTCTTCCCGGAGAATGGCCGGCGTCCCTCGTACCTCTCTCCATCCAAGCGGAGGGACTCACGTCGGGCCCTCTCCTGTGTACCGAAGAACAAAAGTATGCTCTAGCCGGAGTAGACGTTGATGTGCCATTTAGCTGTCGAACGGCCGCCCCGTTTGCAGCGCAAGCTGTTCTGGATATTCCCAACGGACGACACGGATGTGCCATTCTCCCAGGAAATGAAATAAACGAGGCAGTCGAGGTGGAGCTGTGTGCCGAGTGGGGCGTTTTGAGCACTTGCACTAAAGTACAGTTGTTGCCGCCGATACAATTGTCACAAACACGAGTATCACTGCTGAATCCCCCTTCTATGTTTATTATTAATGGACACCCGAACGCTCTAAAGGCGGTCAAAATTACACCGTCGCCCGGTCTGAAAGTTGAAACGAATTCCAGGGAAGGTCAAATAAGTGTAACGGTTAAATCCGAAAGTACGACCTGTGGCGTTGGATGGGTCAACGTTATATCGAAATTAACGTCTCAAGAAATCAGGGTCGAGGTCGAGAGAGAATGCGAAATAGCTTGCGGGACGTTGCTGGGCGTTTTATTTTCTATAATGAAACCCTATCTATCAACTCTAGTGACGGTCGCCGTTATAGCCGTTGGATATTTGTATGTTCAAAATCATCTACAGCAAAAAGGTCAGATACAGTTGCCAAAGCCACCGCAGACTACCCTTCAGACTCCGCTGCCAGAGCCTCGGAGTCGGACGTGGTCGCGGAGTCCCTACGCCTCCAACCCATCAGCACCAGTGTATGGTGACACCAGCATGTTACCAGATGCGAGCTTCTCGCCGACATCCACTAGAATACATTCAAGACTACTTTAG

Protein sequence:

>DPOGS215465-PA
MKSLRTSIVSVLTLLSFITNCESAKINTPRVLLPWFENLYVNFTFEIIEGGCYSWSLSRDDIIDLVPLYEDTWGHCSRAARVSVSKTCIPPGSVIILAEEVNTGEILRGDVDVDIIRSLKIMSTTRNLYLEEAPEAFEVVAYDDKGNKFSSLEGISFTWNTENVDNSGNHPLITLVQWKDTDYEAPQGIAELEAQGLQSYSVLLYGQAMGESHVTVCLDKICTDFYLHVVASVVLTPAVAYVAPGDTLRYKVVRARAGRLTVQDVAATIYRMELPQSDVATLEDGVSLVRAAEVGTSHVYLKSEATEVAMATLTVVEPYSIRVTLRPSNMIIRGEQFTVHCVVFDEDGHPLTAGPEISIRLTVNGEADVLLMKSTENGTITDAVAYNTGEFTVTAKLVSVAGKSMFKNVEGQITAKAVDPLAMVPPEMFIAWTESNLEFPLKHSGGGDEHVTWSERQDSNLVLTPAGLLTVRGVGHMDVRLHLTKYPHIQASGRVWSAVPELLQVSTSGTARVARPHHLHIKLTGTHPATGELYNFNTCNCASFAVSLVEGPEPQNVTAAPWVKPKDGACCVVECTFLFRGVSTLLVSRGRAADTARVAVRAAPSLLWPHAAALLPGATIPVIGEGESLIPQSSQPRVAELIGRDGAPPHNYPDAQLFTLKCQRKGEALVELSSLQEERESVSLETWCSSHVTRVRLDPPDTQGNCSGPRLWLRPGQEVPIKVTLFDTIGRQLLDEDGPIMQWDVQPYHIGIGVKTTDRLFVETNSKYAPVPVPDKYYQLVVATEQAIGWSGSIKAAIPDTSATIQAKVVSPLKCDPMKVHIAWEGETVPNISAVTGGSGKYIVETPKGVTASVDEGRLSAVLPTPGTYDLIVADSCVSGEKNIVEVIIEEVLSVEVSTARAVCVDNCIPIRALVKGVSHRYLATSREPDWKTEGDIVVRKGQLCGLREGVGRVRASLGGVWSQSVEVWVFPSLAIVPERSRVAVGGRVHLNHAGGPPRHLASLLYTGGGEHAQVSSSGVIQGLYPGSTRVKLVAVDAANVELASAEAEIEVVPITTLRVRAATQTLLVGSPGPVWIEAAGLTATALSSLQPLPRVTWALRDPTMARIYTSHIDDRLERSVIEGLSIRVVPLKPGVITLDVRVRNMGQVAETRSWDSTIEILGVSDIRTSIEGLRDINSGEMLSLAVGSTVRLKSLPKGRWSSYQDGNTCRGRYPLLLYSGAGGVFGNVGVLEGCDEERPCARGSEITLSGLDSNGAFMSFESSLAGVTVSDEVFIPGSDAYANRIVATGGSALCIEGSGWTVPAGIQAVSGAGLTLAVLMSDAPAMHVLRLDRPPSTVNILQLPLSKMEFLPGEWPASLVPLSIQAEGLTSGPLLCTEEQKYALAGVDVDVPFSCRTAAPFAAQAVLDIPNGRHGCAILPGNEINEAVEVELCAEWGVLSTCTKVQLLPPIQLSQTRVSLLNPPSMFIINGHPNALKAVKITPSPGLKVETNSREGQISVTVKSESTTCGVGWVNVISKLTSQEIRVEVERECEIACGTLLGVLFSIMKPYLSTLVTVAVIAVGYLYVQNHLQQKGQIQLPKPPQTTLQTPLPEPRSRTWSRSPYASNPSAPVYGDTSMLPDASFSPTSTRIHSRLL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: