MonarchBase - Protein-coding gene

DPOGS209014
Transcript	DPOGS209014-TA	3348 bp
Protein	DPOGS209014-PA	1115 aa
Genomic position	DPSCF300209 + 73738-78947
RNAseq coverage	58x (Rank: top 69%)

Annotation
*Heliconius*	HMEL002540	0.0	59.77%
*Bombyx*	BGIBMGA012553-TA	0.0	49.22%
*Drosophila*	CG10979-PA	2e-54	28.31%
EBI UniRef50	UniRef50_UPI00021A840E	1e-60	37.21%	UPI00021A840E related cluster n=3 Tax=unknown RepID=UPI00021A840E
NCBI RefSeq	XP_966362.1	3e-60	31.03%	PREDICTED: similar to CG10979 CG10979-PA, partial [Tribolium castaneum]
NCBI nr blastp	gi\|383858024	5e-68	29.40%	PREDICTED: zinc finger protein 800-like [Megachile rotundata]
NCBI nr blastx	gi\|383858024	5e-78	29.59%	PREDICTED: zinc finger protein 800-like [Megachile rotundata]

Group
KEGG pathway
Orthology group	MCL19882		Insect specific

Nucleotide sequence:

>DPOGS209014-TA
ATGGCTGGTAACAAAATAAACACTAAGAAAAAGGAAGAAAAGGGTAAATCAAACAGAATTGCTGGTCAATCTATTGAGGAAACAGAGGACCTTGACTTCTCCTTGCTGAGAAAACCAATACATACTAGTGTTACAGGCTTTGCTCAAGCAAGAAAAGTTTTCGACTTAGCCACTGAGGAGCTCAAAGGTTTACTCAGCAATGAATGTGACTTATTATATGAATGTAAAGTATGCAGAAATATATTCAGAAGTTTAGCCAATTTTATATCACATAAGCGAGTCTACTGTAAAGAAAAGTTTAATCCCTCTGAACATGGACATTTCATTAAAAATACCTCCTCTCTAAATGAAATTTTGAAAATACGAAAACTCGAAGAGAGCTATCAGGAAATATTAAGAAAAGAAAATGACTCCAATGAAATGGATACAGAGGAGACGGAAGAAAGGATCCCACTCACAAAGGATCTTACAGATATAATAGAAAGGATATCTAAAACTAAAGGAGTACAAAAGAAGCAATTAAAGGAACAAAATTTAGTGTTTCAAAAAATACCAAAAAGTAATGTTGCTGTTTTCCAAAATATTGAAAGTGATGTGAACAAAACTGATACAATGAAGGCTGAGGTTAGTGAATTGGACAAGATGTTGTCTCAAGAGAATGCAGTGTTACAAAGCGATGGCACATTCAAAGTACAAACGAACGACGTACAAATGAATACAGAAAATGTTATACAAATCAGTGACGATGAAGATAATGAAGGTGCACCATACTCGGTCAAACATGGTGTACTGAAATGTGAAATTTGTGATTTACAATTTTCAACTCAGAAAACCTTAAAGTTCCATATGAAATATAAACATTTAGAGAGCCGTTTGGTCTATCCCTGTCCCGATTGCTTGGATATCTTCTCAACATCCTGGAGTGTTTATAGACATCTGTTCAAAGTACACAGAAAAACAGCTGCTCAAATCCGTCGACTCCGAGAGTCTATACAAGCTAAGGCATTTAAAATGAACAACCCGCCAGCATTTTACGAGAAACGGAAGTCCGTTTTGAAAAATTTTCCAGCTCAAAAAATAACAGAGGAAGAGAGAATCTATCAAGAGAATCAGTCTTGGGAGTTGGAGGTGGAAGGCGAAGGTCGTCGTTGCGGTGGTTGTGGGCGGTCGTTCGAGCGTCGAGCCGCGCTCGCAGCACACGCACACACGTGCGCTAGGAGACACACACGAAGAATACAGATACAGATTAGGAAGGACTATCACAAGGAACAGAGCGCGCCGTACCTCGTGATGAACAGAAACAATGAAAATAAACCATCCGAGGAAAAGTCTGAAAAGCCGCCAGAAAAAGAAATCAAAGAGAAAGAACCGAAACCGCTCGAGGAAGCTGTGATGAGTACAGTTGATGTGAAACAACAAGAGACCGAGGATTACAGAGATGACGACACTCAAGACGTGCCAGCTGGGAACACTCTACAGTATTACACGAATACGCTTATAAATAAATTACCATTCGCCCAACAAGCGGAGAAGAGCAATCTGAACGCGTTCAAAAAGAGATTACAATCAGATGTCGAAATAGATCAACTTTTATGTAAAAAATGTAATAGTAAATTTGAACAAATAGGTGAATTATTAGAACACGTCGCTGGACATTATAAATGGTTGCGCTACGCCTGTAAACTTTGCAACTTCAAGCATTTCAACTTTGATAAACTCCCGGAACACGTTAAAGTTGTCCACAAACTCAAAGGCGATACTGATTTCTACTATAGTACCGTAAAAGCCATAGACGGTTCGGAAGCCAGCGAACTATCTTCCCCCGTGGAAGAATTAACCGAATCTAATGAAACTAGTCCAGATTCACGACGTCCAAGCAGATGTTCTAGTGACTCCAGCAGATTATCTGACGATAGCTCCTCCAGCAGTACACGAGTCGAAACCGGTTCGAGAAAACGCAAAGCACGACTGGTCAAAAACATCGGAAAGAAGAAAAAGGATACTGTTGTTATAGATGACAACGAAGAAAGTAAAGAGGTTATGCATAAAGGAGTTTTGTTAGGAGAAAATGATTCGTCCTCCAATTCAAAAATATTCGAAGAAAATTCATCAGATTTGGATGAAGTTGATGAGAAAATAGCAAAGCGCGAAAACATGACATCCGTAGCATGCCGTAGACCAGTTCGTAAGAAAACTAAACGCAAGAACGAAGATTTCGAATACGATCTGTCGAATTTGTTAAAAATGGAAGCGCAGGGCTATCGCGATTCACAAGTCACACCAAAAACTGCTCCTTCTAAGAAGAAAGTACAACAAGATGTTAACCCTCAGTACGAGCTCATCAACAAAGAGTGTTGTGGTGCACTAGTGACGATGTCGAGGTCCTCGGTAGAAAAAGCTCAAGCCCATATGAAGACTGCAACCTTTGCTGTGTTTAACACTTCAAAAGAACCTCGTGTATCAAATATTTTTGTGAGGCCTCTGGTGCCTAAAATTAATAGAGTAGATAAAATATCGCCTAAGAAGGCTGAAAATGAAGAAACAAAAGAAATCTCCCACCCTAGTCCCACTAAAATAATAGACGCCTCCACTCTATCAAATCTCTGTAAGGAATTGGTGATAACTAAAGTTGTAAATAAAAAATGTGAGGAAAAAGAAGCAAATGTATCCGCTAATGAAACTCCAAAAGAAACCGAGCCGATACCTCAAGTAGATAATAAAACGGTCAGCGACGACAGTAAAGAGAAAAAGGAAGAAAAGAATAAGGTATCTGAAATAGAAGCAAAATCTGACGAGAGTGCCTCATCCGAACAAACTAAAACTAATGTGAATGTACCAACAATACTTCCTATAAAATTCCGAAGACAAAGTTTGGAGGTTATACAAAATCCCTTAATAAAGAAAAATATCACAGACTTCACAAAAGCCGGTATGAAAACTAAAATTTTGGTAATCAAACCCATCAATAGGAGCACCGATGGAACAAAAACACTGAAATTTCAAACAATAAAATTGAAAGATCCGAACAAGACCACCACGAAAAATGATGAAATGAAAACCGAACAGGTCGTCGTTGTGAAAGTTCCCAAAGTGGATTGTTCTATAAGCAGATCAATACCAGCCAGCGACGCCCCTGTGGCACTCGACGAGAAATGTGATGAGAATGAAAACGAAAAAGTTAAAACGAATGCTGCAAATCCATCAAATCCTACCGGTGAAAACAGTGTGGAAGAACCTAAAAAAGACATTAAAATAGAAAATGACATAACTGACTTGGTGGAAGACAAACCCGAATCAAAATTAATAGAATGTATAGAATTGGAAGAGGCCGTGATGCAATCTGGTTGA

Protein sequence:

>DPOGS209014-PA
MAGNKINTKKKEEKGKSNRIAGQSIEETEDLDFSLLRKPIHTSVTGFAQARKVFDLATEELKGLLSNECDLLYECKVCRNIFRSLANFISHKRVYCKEKFNPSEHGHFIKNTSSLNEILKIRKLEESYQEILRKENDSNEMDTEETEERIPLTKDLTDIIERISKTKGVQKKQLKEQNLVFQKIPKSNVAVFQNIESDVNKTDTMKAEVSELDKMLSQENAVLQSDGTFKVQTNDVQMNTENVIQISDDEDNEGAPYSVKHGVLKCEICDLQFSTQKTLKFHMKYKHLESRLVYPCPDCLDIFSTSWSVYRHLFKVHRKTAAQIRRLRESIQAKAFKMNNPPAFYEKRKSVLKNFPAQKITEEERIYQENQSWELEVEGEGRRCGGCGRSFERRAALAAHAHTCARRHTRRIQIQIRKDYHKEQSAPYLVMNRNNENKPSEEKSEKPPEKEIKEKEPKPLEEAVMSTVDVKQQETEDYRDDDTQDVPAGNTLQYYTNTLINKLPFAQQAEKSNLNAFKKRLQSDVEIDQLLCKKCNSKFEQIGELLEHVAGHYKWLRYACKLCNFKHFNFDKLPEHVKVVHKLKGDTDFYYSTVKAIDGSEASELSSPVEELTESNETSPDSRRPSRCSSDSSRLSDDSSSSSTRVETGSRKRKARLVKNIGKKKKDTVVIDDNEESKEVMHKGVLLGENDSSSNSKIFEENSSDLDEVDEKIAKRENMTSVACRRPVRKKTKRKNEDFEYDLSNLLKMEAQGYRDSQVTPKTAPSKKKVQQDVNPQYELINKECCGALVTMSRSSVEKAQAHMKTATFAVFNTSKEPRVSNIFVRPLVPKINRVDKISPKKAENEETKEISHPSPTKIIDASTLSNLCKELVITKVVNKKCEEKEANVSANETPKETEPIPQVDNKTVSDDSKEKKEEKNKVSEIEAKSDESASSEQTKTNVNVPTILPIKFRRQSLEVIQNPLIKKNITDFTKAGMKTKILVIKPINRSTDGTKTLKFQTIKLKDPNKTTTKNDEMKTEQVVVVKVPKVDCSISRSIPASDAPVALDEKCDENENEKVKTNAANPSNPTGENSVEEPKKDIKIENDITDLVEDKPESKLIECIELEEAVMQSG-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: