MonarchBase - Protein-coding gene

DPOGS211074
Transcript	DPOGS211074-TA	3399 bp
Protein	DPOGS211074-PA	1132 aa
Genomic position	DPSCF300007 - 1408856-1419669
RNAseq coverage	57x (Rank: top 69%)

Annotation
*Heliconius*	HMEL009384	0.0	68.41%
*Bombyx*	BGIBMGA002956-TA	0.0	58.82%
*Drosophila*	Phlpp-PA	7e-101	32.84%
EBI UniRef50	UniRef50_UPI00022C8E6F	2e-153	39.26%	UPI00022C8E6F related cluster n=1 Tax=unknown RepID=UPI00022C8E6F
NCBI RefSeq	XP_973398.2	1e-152	40.85%	PREDICTED: similar to adenylate cyclase [Tribolium castaneum]
NCBI nr blastp	gi\|350401465	8e-153	39.26%	PREDICTED: PH domain leucine-rich repeat-containing protein phosphatase 2-like [Bombus impatiens]
NCBI nr blastx	gi\|157115169	1e-152	39.13%	adenylate cyclase [Aedes aegypti]

Group
Gene Ontology	GO:0003824	8.9e-24	catalytic activity
KEGG pathway
InterPro domain	[634-882] IPR001932	8.9e-24	Protein phosphatase 2C-like
Orthology group	MCL11006		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS211074-TA
ATGGTCTGTGACGACGGCCTCACTCCATCGCCTCTTATCTCACGCAAATCGCTTCGAAGACTAGCATCAACAAGAGGATTCAAACCGCGCTCTGAATCAACCTGGATACGCGTATTTGATGGTCTTGAACCTTATGCTGTGGATGCGCCGAGCAAGCTCGTAAAAGTGTCCCCCTATACTACCGTCGAAGACATAAACAAGAAACTTGGCTTCAATGAAGAATTGACGCTATGGGTGCAGATAGGAGGAGAAAATTCTCGACGGCTGGAATTGAACGAGTTCCCATTCCAAATACAAGAGAAGTTTTTAATTAACAATGGTTGGAAGTCAGAGGCTAGGCGACAGCGGCTTGCGGTAGATCCGGAGTTACGTCACAGTCTGCGCTGGTGTGCAGGACCTTCCAGTCGGTCTGGTGGTGTCCTGCGGTCAGGCACTGTTTATGTTTTAAAAGGGCACGTGTTCCCACAATGGAAGCCCCGACAGGCCCACATTATTGGATCGCAATTACATACACACGGTGTGTCCTGGGATATGTTGGAGCTCAGTGGAGGTAGTATTGAAATGTGTCAACCGAAAGCTCAGAAACTAGTCCTCTGCGTAAAGCTTCTTTGTCAAGGCAATGGTGTACTTGACACGGGAGTCAATCATTTATTTCTGGGGTTCAATACAATTTGGGAGCGTAATATGTGGTGCCGTTGGTTAAAAGAGAGTAATAAAATGAAATGTGAAGACGAGGAGATAGACAGCTTGGATGTTTTCTCTCAAGAAAATGAAGATGTGTTCTTGGATAGCTTGGAACCAGCTACGTATAGAGAGAAATATGAAAACTCGGGCACTCAAAGTACACAGCCACCAAATGTCTTAGACTTGAGCGGTGGCGGACGGTCCTGTCTGCCCGTAGCTCTAAACCAGCACGCCTCAGATGGGTTCGCGGTGAAAGTTTTAAGGATGCGGAGCAACACTCTACCAGCCTTGCCTCCTCAAACATGCAATCTGATAGCCCTAACTCATCTCGATGTGAGCGACAATAAAATCATTGAGCTACCAAAGGAGATTTCACATCTAACGCAATTAGAAGAAATAAACGTGAGCAACAACGAAATTAAGTCGCTGGACTGTCTCTTACGACTTCCTCGTCTACGAACTGTCGTAGCTGCTAGAAACCTGATCACGCAATTCGGAGTCAATGACACTAGCCAAATGGGTTTTCTAGAGGAAAATAAATCAGAATATCGTGCACCGCTAACGAATGTCGACCTCCGATACAATAAACTAAAAGGAAGCATAATTCTTGGTAATTATGAGCATCTGGTGACTCTTGATGTCTCTCAAAACTCCATTGAGGTTTTGGTGCTTTCATCGCTGCGTGGACTACGGGAGCTGTATGCTGCTCATAATTCTATCCAGCACTTGGCCTTGCATGGTGCTTCGTTACGAGTCCTACATGCTCCGTACAATAATATGGAGAATTTGACAACAATGGTGCCACCAATAAATTTAGTGGAGATGAACCTGACATACAATAAATTATCATCTTTACCACAGTGGATCAGTGGTTGTTCAGATCTGACCAAACTCTTTGCAAAAATTGAAGAACTGGTTCTTTCTGGTAATTCACTCTCGAAATTGCCAGACAATTTGCCACAGATGAATAACATAAAAATTGTGAGGGCACATTCAAATCGTCTTCGCTCAGTTCCAATGTTTGCTTGCAGTGCTAGCGTTAAAATTCTAGACTTTGCTCATAACGAACTGGACAGCATTGATCTGCGTCTTTTAGCACCGAAGCAATTAAAATTTTTAGACATATCATGTAATAAGAAGTTACAAATGAATCCCTCGCAGTTTAACGCTTATAAATGTCAACGACCTTTAAGCCTAGTTGATGTCACTGGACAACATGGAAATTCTTTATCGCAAAAAAATAATTTTCATGAAGAATTAAGTGGTGGGACCCCGTGGGTAACTGGTTTTTCGGAATGTCCAAATAAAAAACTTCTTCTATCTTGTGCACAAATACGACTTCCATCGTTTTGTAACAAGGAAGGCTTATTTGCTATAATTGACGGGGAAACAGATATCGAAGTCCCAAGAATACTACAGTCATGTCTTCCAGGACTACTACTTGAAGAAAAATCTATTAAGGAAACAGTCAATGAATATATGAAATATGTTATACTAGCTGCACATAGAGAATTGAAACAAAAAGGACAGACAAAAGGTGCATGTCTTGTTATGTGTCACTTGTCTCCTATTAGTACCCCCGATAACAGTTTTGGACAATCTATAAGACGATATAATATAAGATTAGCGAATGTCGGCAATACAAAAGCAGTGTTAAGTCGTCGTAATGGCCCTTTATGTTTAGGTATAGATGATAATAAGCGATTAGGTTATTCTTCAAGATACCCAGTTAATGTACCTGATCCCGATATTATACAAACTGTAATTAAAGAAGACGATGAGTTTTTAATATTAGGAAACGCTAAATTTTGGGAATCCGTTACAGTCGATACTGCAATATCAGAAGTGAGGGCTGAACGGAATCCAGTATTAGCAGCAAAGAGATTACAAGATTTGGCTCAAAGTTATGGAATAGAAGATTGTATATCGGTGGTAATCGTAAGATTTGATACAGTTCGTTCTGATGTAGATTTATTAATGCGAGAATTACGACATACGATCAACACAAACAAACCTGTATGTAATCCTGACTGCTGTTGCTCTCGTTTAGAACCATGTTGCCATTCTATCTCACCACCAAAATCAAATAGCGATAGATCTTCTCCAAGTGGACAAAGCGATCGACCTTCTAGTGAAACAGTTAGTCATCAACACTATGCCAGTGTACGTTCTCATAATAGGGCCTCAGAAAGAAAACCAAGAGGCGGAGTTGCACGAGCAATTCGAGTACGAGTTGAAGAAGATAAAGAGACTGAAAAAATTATTGACGATGTTCCCTCTTCAGATGAACAATTCAAATGTTGGGAATATATGCTGGAGCAAAATACACAAATGATATTTGATAAAGAGCTAGATAATCTTTCAAAAGGTATCAAATCAAATTCAAGTAGTTTAAGAAATTTAAAGGGACTCTCAGGAAGTAGTCCCCAACTACATCTAAATACGAAACAAACAAAACTACCGTTTCTCTCAAAACATTTCGGGAGTGCTAGATCTTTCGGTAGTAATATAAAGCCTGAGTTTCGTTTCGGTTCAGGAAGAATGCCTAATGGTGGTCCAAATGCTGCTTACTTTGGTTCACTTCAAAGGTTAATGCCTTATCATTTAGAATACGATTTCGCGGTTATTCAAGAAAAACAAACACAATCACAGGACTCTCTTGATCTCGAGGGCCGGATGCAACAATATTGGGGAGTTGCAACAACTGAACTTTAA

Protein sequence:

>DPOGS211074-PA
MVCDDGLTPSPLISRKSLRRLASTRGFKPRSESTWIRVFDGLEPYAVDAPSKLVKVSPYTTVEDINKKLGFNEELTLWVQIGGENSRRLELNEFPFQIQEKFLINNGWKSEARRQRLAVDPELRHSLRWCAGPSSRSGGVLRSGTVYVLKGHVFPQWKPRQAHIIGSQLHTHGVSWDMLELSGGSIEMCQPKAQKLVLCVKLLCQGNGVLDTGVNHLFLGFNTIWERNMWCRWLKESNKMKCEDEEIDSLDVFSQENEDVFLDSLEPATYREKYENSGTQSTQPPNVLDLSGGGRSCLPVALNQHASDGFAVKVLRMRSNTLPALPPQTCNLIALTHLDVSDNKIIELPKEISHLTQLEEINVSNNEIKSLDCLLRLPRLRTVVAARNLITQFGVNDTSQMGFLEENKSEYRAPLTNVDLRYNKLKGSIILGNYEHLVTLDVSQNSIEVLVLSSLRGLRELYAAHNSIQHLALHGASLRVLHAPYNNMENLTTMVPPINLVEMNLTYNKLSSLPQWISGCSDLTKLFAKIEELVLSGNSLSKLPDNLPQMNNIKIVRAHSNRLRSVPMFACSASVKILDFAHNELDSIDLRLLAPKQLKFLDISCNKKLQMNPSQFNAYKCQRPLSLVDVTGQHGNSLSQKNNFHEELSGGTPWVTGFSECPNKKLLLSCAQIRLPSFCNKEGLFAIIDGETDIEVPRILQSCLPGLLLEEKSIKETVNEYMKYVILAAHRELKQKGQTKGACLVMCHLSPISTPDNSFGQSIRRYNIRLANVGNTKAVLSRRNGPLCLGIDDNKRLGYSSRYPVNVPDPDIIQTVIKEDDEFLILGNAKFWESVTVDTAISEVRAERNPVLAAKRLQDLAQSYGIEDCISVVIVRFDTVRSDVDLLMRELRHTINTNKPVCNPDCCCSRLEPCCHSISPPKSNSDRSSPSGQSDRPSSETVSHQHYASVRSHNRASERKPRGGVARAIRVRVEEDKETEKIIDDVPSSDEQFKCWEYMLEQNTQMIFDKELDNLSKGIKSNSSSLRNLKGLSGSSPQLHLNTKQTKLPFLSKHFGSARSFGSNIKPEFRFGSGRMPNGGPNAAYFGSLQRLMPYHLEYDFAVIQEKQTQSQDSLDLEGRMQQYWGVATTEL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: