MonarchBase - Protein-coding gene

DPOGS215447
Transcript	DPOGS215447-TA	5112 bp
Protein	DPOGS215447-PA	1703 aa
Genomic position	DPSCF300298 + 231531-249430
RNAseq coverage	3018x (Rank: top 4%)

Annotation
*Heliconius*	HMEL016318	0.0	59.02%
*Bombyx*	BGIBMGA005738-TA	0.0	54.12%
*Drosophila*	Ank2-PU	1e-146	46.13%
EBI UniRef50	UniRef50_UPI00021A8889	2e-167	49.84%	UPI00021A8889 related cluster n=4 Tax=unknown RepID=UPI00021A8889
NCBI RefSeq	XP_392578.3	8e-165	52.86%	PREDICTED: similar to Ank2 CG7462-PB, isoform B [Apis mellifera]
NCBI nr blastp	gi\|345488337	1e-167	49.04%	PREDICTED: hypothetical protein LOC100122475 [Nasonia vitripennis]
NCBI nr blastx	gi\|345488337	9e-175	28.40%	PREDICTED: hypothetical protein LOC100122475 [Nasonia vitripennis]

Group
KEGG pathway
InterPro domain	[131-235] IPR000906	1.4e-28	ZU5
Orthology group	MCL25162		Lepidoptera specific

Nucleotide sequence:

>DPOGS215447-TA
ATGGGTGTCGTCAAAAATAAAAAGAGCAAAACGAAGAGCGATGATTCTAAAAAGGATGTTAAAAAACAGAAAATTGATGACGGGAAAATGAAAAAAAAGAAAAAAGTGTCGTGTTTACAATGCTTCAAGTCGCCAGATGATGGTGGTTTAGAGGGCAAATATCGAGTGGCTGCACCTGAGCTCATGCAGGACACGTTCATGAGCGACTCTGAAGACGAAGGCGGAGAAGTAGAGTGTCCAATCCAACAGCAACAACAGTACAGATACATGAACAGCGAGGCGGGTACGTTGAACCGGGCTAGACCGCTCGAGGATAGTGTCACGGACGGACATCTGTGGCCCAGCAACAATGACAAGAGAGTCGCTACCATGGAGAGACAACCGCTTGATATCGGGTTCCTGGTATCTTTCGTTGTGGATGCTCGTGGTGGTGCCATGAAGGCGAAGCGTCGTGGTGGTGTGCGAGTCATAGTACCACCAGCAGCCTGTGCCGCTCCCACGAGGGTAACATGCCGTGCTGCAACGCGTCGCGCACCCGTCGCTGCCCCACCACCCCTGATGGAGGGCGAGGCCCTAGCCTCACGCCTGCTAGAACTACAGCCGCAAGGAGCGAAGTTCCTCGCGCCCGTGATCATCGAAGTACCTATCTTCACCGCGTCCTGTCCTGAAAGGGAGATCGAGGCGCTAACTCGTGAAAAACAAGAACACGGTCCAGGCGGAGAGAGACTCGGAGAGAATGGAGAGAGAGTCACGCGTATCATAACATGCGACTTCCCTCACTATCTGGCGGTAGTGTCACGTGTGAGGCAGGAGGTGCACGTCATAGGTCCCGAGGGCGGGACCGTGTCATCGGCACACATACCACAAGTACAGGCCTTATTCCCGCCGTCGGCCCTCACGAAGAGGATCCGGGTGGGGTTGCAGGCTCACGGCGCGGATAAGGCGCTCTGCTCGCGACTCCTGCCTCGTCACGCGGCCGTGTCCCCCGTACTAACTGTGGAGCCCCGGAGAAGGAAGTTCCATCGCACTATAACGCTGACGGCGCCATTGCCGCAGCCGCACGACCATAAGCTGAACAGTCACGACAAGCAGTCAACAGCAAACCTTCGTCTTTTATGTTCAATTATGGGCGGTCAAGCGCGAGCGGTTTGGGAGGACGTGACCGGGTCCACTCCGCTCACCATCACCGACGACTGCGCCTCCTTCACCACCACTGTATCAGCCAGATTCTGGTTGATGAACTGTCAAAATGTCAGTGACGCGACCAAACTGGCCACGGAACTATACAGAGAGATGTTACTGGTGCCTTTCGAGATACGTATAGTTGTTCTTGGTAAACGTTTGGATTCGCTGGAAGGTCGCCTCTTGGTGCTGTACATCACGGACAGATACGCCTATGACACGCTGCTACATCAGGAGCACTATACTGAAGTGGCTCATTCCACGTCCGTCCGTCTATTGGACGGTCGTCCTGTATATCTGGAGTTCTCTGGTAACCTGGTTCCCGTCACCAAGTCCGGTACTCAACCAACTCTGGTCTTCGAGGCCTTCAAAGACAACCGCGTTGAGTTTCCTGTGAGAGTGAAGCATCACGAAGAAAGTCCCTCGGGAAGGATTTACTTCATGAATGAACCAAAGGTCGCTAAAGGCGAACCGTCCGCCAGTCCTACCTGTGTGCTTGATGTGTCGCTTCCTGAACGCGTTGCACCCCGACCAGCCAAGAGTCATTTGGACTGCCTCAACTTGGATCAAAGCGGTTTCGACGCACTGAAGGATGAGTTGAGTTTCAACTGGGAACACAACCACAGCGTCGGACCGCCCACAGTGCCCATAGACCACGCTACTACACAACTCAACGGCCACGATAAATCAGTAGCTAACGGTGACGTGAAGTACGAGACCAAAGAGGATGACAGAAAAGATATGCCGCGTATCAATGGTGACGCGACGCATGATTCAAATAAGGCTAAAGCAACATTTGATTCCGATGAAGACAAAACACCAATGAACACTTTGGAAAAGGGTAAAAAGAAAGCTGAAGGCGGTTCATTTTTGGGCGGTCTAGCTGATAAAGTCAAGAACGTATTCAGTCACAGCGAAGACAAAGAGGAAAGCAAAGAATCGTCTCCCAAACCGCAACCGAAACCGAGGGAATCTAAAGAGAAGTCTCCACCGAAACCAGCGCCAAGGATTATTAACGAAGATTTGTTGGAAAAGGTCGAAGATATGTTCAAAGACGTCCGCACAAAACCACATCTCAAGGACGAGGATGATGTTAACAGTCAAGTTTATTCAACAAAACTTATAGTTGATGAAGGAAATCCTGATGAAGTTCGTCTGAAAACTGAAGAAGTGTACCATCAGTATGAAAACATGCAGCCCGTAGACACCCCACTATATTCGAGAAAGAGCGATCCTTTCCAATTCTTTACCGGATGTTGTGAAGACAAATATAAGAAAGGTGAAAAACACCGTCACGACGAAACATCAACCTTAGCTGATAGAATCGAACAAGTCAAATTTTCTGCAAATGAACAGATCCAAGAAATCGAAGATAAGTATCAGAAGGATTTACAAAAAGATCTCAAAGAAGCGGAAAGAGAGAAAGATAATATCAAACAAGAACTCAGCGAAATCAAGGAAGATATTATTGTAAAGTCCGAGAACATTAAAAACAATTTAATTGATAAAGAGGATAAATTGAAAGCAGGTTTTGAAGATAAAGTTCAAGAGTTCAGTGACGTTGTTAACAAAAAGAAGAATGAACTGTCAGAGTCGGGAGAAAAGATTCAATCTGATATTGGAGCTAAAGTCGTTGACATGCAAACTAAAGTATCTTTGACTTTAGACAACGCGAACGATGATGTAAATAATTTATTTGACACTGTTGACAACACTAAACAAAATATAAATAATAAATTTGTTGCACTCGATCTCGCTGCTATGGAAAGAGCTGAAGAAATGAAGCTTAGGGGTCATAATAAATTATCTCAAATGGGAAAAACTTTTGAAAATGCAGCCGACGATGTCAGTCATAAAACAGAAGAAAGTATCAATGAAGCGTCAAATAAAATAAATAATTTAAAAACTGACATTGAAAACAACGCTGAAAACGTAAAAGATAAAGCGAATGAAAAGGTGAATAATGTAAAAGTAAATATTAACGACAAAGTAAGTGCCATTAAAGCTGAAGCCGAAGAAATTGTAGATGAAGTAGAAGAGAAAAGCAAAAAAGCTGTAGCTGAAGTCAAATCTAAGAGTAAAGATAAAAAGAATGCAGCAAAAAAGAAAGCAAAGGAGGGTAAAAATTTCTTTACGGGGCTTGTCCACAATATTTTCGGGGAAAAGGAAAAAATTGAGGATGAAGTTAAAGGTAAAATAGCTGAAGGCAAGGAATCTGCGAGCAAATTATCAGAACAAGCGTCGGCTGCTAAAGAAAAATTAGAAGAAAACATTGCTAAAGAGCAAGATAAGTTAAAACAAAATACAGAACAAATTATGCAACGCACAGAGAATACGGCTGAGGATGTTGTTAAAAATGTGAAGGATGCCAAGGATGATTTATTGGAAAGTGCACAAGAAAAAGCAGCGCAAGCTGTCAACGGCTTAAACAAGAAGAAAGAGGAAGTAATACAGAACGTAGAAGGTAGAGCTAACGAAATATCTACAAGTATACAAGATAAAAAAGATGAGTTATTGCTGAGTGCCCAAGAAAAGAAAGGTGAAATCTTACAAAATGTACAAGACAATACTGAACTGGTAGTTACAAATATCAAGGCAAAGAAAGATGAACTAGTACACAAAAAAGATGAATTAATACAAAGTGCGGAAAATAAAAAAGACCAACTATTGCACAGTGCTCAAGAAAAAGGTGAAGAAATATTCGCAACCATGGAATCAAAAAAGAATGAAGCGGTGCAAAAGAAAGATGAACTACTACAGAGTGCAGAAGACAAGAAAAATGATATATTGGAAATGACCAACAAAGAAACTGAAAGAATAGTAACAGCTGTTAAAGAAAAGAAAAATGAAGTGTTACAAACCATCGACGATAAAAGTTCGGAAGCTGTTCAAAATGCCCGAGCAAAAAAAGATGAAGTTATATCCGGAATAAGCGATAATATAGACAAAGCTAAACAAACAGTAGGTGAAACTAAAGACAATCTTATTTCTGGAATAGCGGCAAAAAAAGATGAAATGATAAATTTAAAGAACACGATGCAAGATGGCGCCGAAAACAGACTTAATCAAATAAAACAAGAAGCTGAAGAGACTACTGAAGAAATCAAAAGAACCGCCGAAGAAACTCTGAATGCTGCTGCTGAAAAGAAAATTGAGTTAAAGAGCAACATTGCTTTGAAATTCAATGACCTTAAAGATGCTGGAGAAGATAATTTAGAAAGACTACGGGATGCAGCGAAAGATAAAGCAGAGAAAGTGCAGAAATCAGCGAAAGTAACGTTCGAAGACGTCGAAGTATCAGCCTCCAGTGCCTTCGACAAAATCGAAAGTGCCGCGATGGACAAAGCTGGTGACGTTAAGGACATATATGATGACCTTCACAGTTCAACTCGAGATACATTCGCGGATCTCAAGGACGACGCTCAAGGATACGAAAGCTCAGCCCAGGATACGTTGCACAGCTTTCAGAGTTCTGCCGGAAATACTTTTGACAGTTTGGACGAATCAGCTAAGGAGTTCATCGGTGATGTCCAGAGCACCGCTGCAAGAAGCGAAGAAAGCGCTGACCAGCTGTTCGGTAATGTCAAGGACAGCTTTGAAGGATTTCAAATAGCGGCTGGCGATAAGCTTGAAGATATAAAGGTCTCTACAAAACAACACTTCGAAGAGGGTCAAGATAATTTGGGTAAAACTAAAGATGAAGTTGTTCAAGGTTTGAAGGAGTCGGAACAAGTTGTGACTGATACTCTAACTAGCGAAGCTGACAAATTCACTAGTAGCCTCAATGACCTAGGGAACTCCGTTTTTGGGATGTCGGGTAAAGGATTCATGAAGGATTCCAGTACTAAACTGCTTGAATCGGAGAAATCACAATCGTCGCCACACAAAAAGAGTTCAGGGGCCGTGTCCAGTGAAACAATTGTAACGTAG

Protein sequence:

>DPOGS215447-PA
MGVVKNKKSKTKSDDSKKDVKKQKIDDGKMKKKKKVSCLQCFKSPDDGGLEGKYRVAAPELMQDTFMSDSEDEGGEVECPIQQQQQYRYMNSEAGTLNRARPLEDSVTDGHLWPSNNDKRVATMERQPLDIGFLVSFVVDARGGAMKAKRRGGVRVIVPPAACAAPTRVTCRAATRRAPVAAPPPLMEGEALASRLLELQPQGAKFLAPVIIEVPIFTASCPEREIEALTREKQEHGPGGERLGENGERVTRIITCDFPHYLAVVSRVRQEVHVIGPEGGTVSSAHIPQVQALFPPSALTKRIRVGLQAHGADKALCSRLLPRHAAVSPVLTVEPRRRKFHRTITLTAPLPQPHDHKLNSHDKQSTANLRLLCSIMGGQARAVWEDVTGSTPLTITDDCASFTTTVSARFWLMNCQNVSDATKLATELYREMLLVPFEIRIVVLGKRLDSLEGRLLVLYITDRYAYDTLLHQEHYTEVAHSTSVRLLDGRPVYLEFSGNLVPVTKSGTQPTLVFEAFKDNRVEFPVRVKHHEESPSGRIYFMNEPKVAKGEPSASPTCVLDVSLPERVAPRPAKSHLDCLNLDQSGFDALKDELSFNWEHNHSVGPPTVPIDHATTQLNGHDKSVANGDVKYETKEDDRKDMPRINGDATHDSNKAKATFDSDEDKTPMNTLEKGKKKAEGGSFLGGLADKVKNVFSHSEDKEESKESSPKPQPKPRESKEKSPPKPAPRIINEDLLEKVEDMFKDVRTKPHLKDEDDVNSQVYSTKLIVDEGNPDEVRLKTEEVYHQYENMQPVDTPLYSRKSDPFQFFTGCCEDKYKKGEKHRHDETSTLADRIEQVKFSANEQIQEIEDKYQKDLQKDLKEAEREKDNIKQELSEIKEDIIVKSENIKNNLIDKEDKLKAGFEDKVQEFSDVVNKKKNELSESGEKIQSDIGAKVVDMQTKVSLTLDNANDDVNNLFDTVDNTKQNINNKFVALDLAAMERAEEMKLRGHNKLSQMGKTFENAADDVSHKTEESINEASNKINNLKTDIENNAENVKDKANEKVNNVKVNINDKVSAIKAEAEEIVDEVEEKSKKAVAEVKSKSKDKKNAAKKKAKEGKNFFTGLVHNIFGEKEKIEDEVKGKIAEGKESASKLSEQASAAKEKLEENIAKEQDKLKQNTEQIMQRTENTAEDVVKNVKDAKDDLLESAQEKAAQAVNGLNKKKEEVIQNVEGRANEISTSIQDKKDELLLSAQEKKGEILQNVQDNTELVVTNIKAKKDELVHKKDELIQSAENKKDQLLHSAQEKGEEIFATMESKKNEAVQKKDELLQSAEDKKNDILEMTNKETERIVTAVKEKKNEVLQTIDDKSSEAVQNARAKKDEVISGISDNIDKAKQTVGETKDNLISGIAAKKDEMINLKNTMQDGAENRLNQIKQEAEETTEEIKRTAEETLNAAAEKKIELKSNIALKFNDLKDAGEDNLERLRDAAKDKAEKVQKSAKVTFEDVEVSASSAFDKIESAAMDKAGDVKDIYDDLHSSTRDTFADLKDDAQGYESSAQDTLHSFQSSAGNTFDSLDESAKEFIGDVQSTAARSEESADQLFGNVKDSFEGFQIAAGDKLEDIKVSTKQHFEEGQDNLGKTKDEVVQGLKESEQVVTDTLTSEADKFTSSLNDLGNSVFGMSGKGFMKDSSTKLLESEKSQSSPHKKSSGAVSSETIVT-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: