MonarchBase - Protein-coding gene

DPOGS201072
Transcript	DPOGS201072-TA	1389 bp
Protein	DPOGS201072-PA	462 aa
Genomic position	DPSCF300185 - 226736-229996
RNAseq coverage	227x (Rank: top 44%)

Annotation
*Heliconius*	HMEL005837	0.0	73.88%
*Bombyx*	BGIBMGA007164-TA	2e-167	61.91%
*Drosophila*	CG43088-PA	3e-18	23.83%
EBI UniRef50	UniRef50_UPI0002061305	2e-39	30.36%	UPI0002061305 related cluster n=5 Tax=unknown RepID=UPI0002061305
NCBI RefSeq	XP_001943491.1	1e-46	35.29%	PREDICTED: hypothetical protein [Acyrthosiphon pisum]
NCBI nr blastp	gi\|193610737	2e-45	35.29%	PREDICTED: putative nuclease HARBI1-like [Acyrthosiphon pisum]
NCBI nr blastx	gi\|193610737	1e-43	35.20%	PREDICTED: putative nuclease HARBI1-like [Acyrthosiphon pisum]

Group
KEGG pathway
Orthology group	MCL10102		Insect specific

Nucleotide sequence:

>DPOGS201072-TA
ATGGCTGATAAGCCGCCAGAAGACAGCTACATATCTGTTGTTGACGAAGAACCTGTGTTTTTTGAGTTACTCAAATGGGATTCGTCACAATCGCAAAAGCAACAAGAGCCGAGGAGTTTAGAAAAAGCAAAAAGTCCGGAGAAAATGGTGACAAAATCTAAAGAAGAGTCAGATCCGTTTGATTTGAGTGATGCCGCCTTTTTAGATATGTATCGACTTTCAAAAGATCTGGCGCGAAATCTTTGTGAGGAATTGAAACCTGTTATGCCCGATTCTATTAAATCGATTGAGTTTTCAGTCGAAAGTAAAGTTTTAGCAGCTTTATCATTCTATGCTACTGGCAAGTATCAGAAATCAATAGGGGGTAGATCGGACCCCAGTATAACTCAGTATTTTGTGGCAACAGCGGTGATGCAGGTCACTGAAGCTATGAATGACCCCAGTATTATTAAGAAATATATACACTTCCCACATTTGAGAAATGAGAGGGAAGTCATCAAAAATGGTTTTTACATGAAGTATGGCATCCCTAATGTTGTTGGCTGTGTGGACTGTGTGCATGTGCCCATCGCCCGGCCCGATGAAGATCAGAAGAAGCACTTCAACAAATCATACCACTCTAAGAAAGTACAAATAATAAGCGACAGTCGCCAGCGCATCATGAGCGTGTGTTCTGAGGGTGGAGGCTCATACTCCCACGACGCTCTGCTGGCCAGACACGCCGTCACCGTGGACCTGGTCAGTCTGAACAACTCACGGGATCTCTGCTGGCTGCTAGGCGGGCCGCATTACTCACAGAAACCGTACCTGATGGCCCCAGTGCCGAAAATGACGAAGAAGTCTTCCATGTCACCGGAAAAGTATTACACGAACCTGCACGCGCAGGCGCACTCGGCCGTCACGGAGACTATCAAACAGTTGAAGGCGCGCTGGAAGTGTCTGCAGGCCACCAGCAACAAGCAGTTCGACCCGCCCACCGTCGCCAAGATGGTCCTCGCCTGCTGCGTGCTACACAACATATGCACGGAGCACGGCATTCCGCCCGTGGACATGACGCAGGCCGAGGAGCGTCTGGAGGCCATGAAGCAGAGGGTGGCCAACGCCCCGGCCTCCAGGAGACAGGAACACGACCAGCTCGGCCTGCAAGCGCGGGCTGCGCTCATACAGAGGCTGTGGGCCGAGAGGAGCATCACGACCGACGCCTGCCCCGCCACCAAGAGGAGGCTGGCGAAGAAGGACCGGCCGCCGGAGACCCACCCTGTACATCACCCAGAGGTGCATCAGCATCAGATGCACGACGACCCCAAGAGACCCAGAATACTCATGAACAACCCCTACAGCATCGGAGTGGGCATGCCGCCGGCCTGGGGTCACTACCCGCAACACTGA

Protein sequence:

>DPOGS201072-PA
MADKPPEDSYISVVDEEPVFFELLKWDSSQSQKQQEPRSLEKAKSPEKMVTKSKEESDPFDLSDAAFLDMYRLSKDLARNLCEELKPVMPDSIKSIEFSVESKVLAALSFYATGKYQKSIGGRSDPSITQYFVATAVMQVTEAMNDPSIIKKYIHFPHLRNEREVIKNGFYMKYGIPNVVGCVDCVHVPIARPDEDQKKHFNKSYHSKKVQIISDSRQRIMSVCSEGGGSYSHDALLARHAVTVDLVSLNNSRDLCWLLGGPHYSQKPYLMAPVPKMTKKSSMSPEKYYTNLHAQAHSAVTETIKQLKARWKCLQATSNKQFDPPTVAKMVLACCVLHNICTEHGIPPVDMTQAEERLEAMKQRVANAPASRRQEHDQLGLQARAALIQRLWAERSITTDACPATKRRLAKKDRPPETHPVHHPEVHQHQMHDDPKRPRILMNNPYSIGVGMPPAWGHYPQH-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: