MonarchBase - Protein-coding gene

DPOGS215355
Transcript	DPOGS215355-TA	3165 bp
Protein	DPOGS215355-PA	1054 aa
Genomic position	DPSCF300351 - 41826-62670
RNAseq coverage	672x (Rank: top 19%)

Annotation
*Heliconius*	HMEL005222	75.72%
*Bombyx*	BGIBMGA009563-TA	67.92%
*Drosophila*	uex-PE	54.45%
EBI UniRef50	UniRef50_E2BD06	54.69%	Metal transporter CNNM2 n=19 Tax=Metazoa RepID=E2BD06_HARSA
NCBI RefSeq	XP_001664301.1	56.38%	ancient conserved domain protein 2 (cyclin m2) [Aedes aegypti]
NCBI nr blastp	gi\|157138710	56.38%	ancient conserved domain protein 2 (cyclin m2) [Aedes aegypti]
NCBI nr blastx	gi\|157138710	56.39%	ancient conserved domain protein 2 (cyclin m2) [Aedes aegypti]

Group
KEGG pathway
InterPro domain	[442-613] IPR002550	9.1e-34	Domain of unknown function DUF21
	[872-952] IPR018490	4.6e-09	Cyclic nucleotide-binding-like
	[901-953] IPR014710	9.6e-06	RmlC-like jelly roll fold
Orthology group	MCL10515		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS215355-TA
ATGGCATCTGTCTGTGTTGTATTGCGGACTTGTGGGATATTATTATTATTATTAATTATGCAAGTGTCCGCTAAAAATAATTTATCGGTTGAACCATGGATAGTGTCTTTAAACGTAGTGGCGAAATCTTGTGTTGATGTTAAGTGTAAATATTTATTGTTAGTTAATGGCAGTGAGTTTTTGGGGCACAATTCTTGGAAATTAACGTCCAAAGAAGGGTCTAGAGGCAGTTATTGTGATACTATATATCCAAATTATGAATTACACGAAGTAGAAACAACACAATGGTTTTCAAAGATAAAAATATTAATACCGAATGTGAACGAAAAAATATATATTTGTCTGAGACATAACAAACAAAAGAATAATCCGGTGAACGGATTATGGATACATCAGGGCGTTGAATTATTTCTCAATCCCAGCGGCGACGATAATATATTACAAGAAAATAGAACCGAATCGTTAAATTTAATGAAAGATCAGATGGCGAAGGATATTGAGCTTCAGGAAACATCAACCTGGTCAGATCTTTCTAGAGACATTAGTGTAAACTATATCAATGCGGTTAGACCATCAGACGAGGAGGCCAAAGATATAGAGGTCCTGAGAGACAATAAATATGTACCTCTGAATGATATAGGAACAGAATTCATAGATAGAAACGATATTAATGATGGTATAGAAAGCTTCAATGATAGGAGGAGAGAAAATGATGATAAAGGAGATAGTAATGATATAAATGATAGATTGAAAAGAGATATCATAAAGGATCTCAATCATGAGATGTGGAAAATGAATGATGGCAAGGTACCGGAGAGGCCTCCCGAGATGTTTCAGAACGACGGTGTGGCTAACGTGGTCAATCCGCAAGTTGGTGATTTCACTGTGGTTAGATCTGATGCTGTACCGATATTTGTTGAGGGTCTGAGGGTGGAGGACGCAGCGAAAGAACCGAAGATCATAGAAGATGGTATACCAAGCGTTTTAGCTGATACGAAGGTTGTGCTCAGGTTATTCGGCCAAGGTTTCACTCCGAGGACGGTAATCGCATTCACGCAAGATCCCATGGACTACGGCCAGCCGTGCAAGTTTCTTGTTAAGGGCGAATATATGGCTATGGAGGGATCTGTAACAAAATCTTCAGTACTATTCGATATTATAGCTCCATCACCGATAGTAGGTTCGAAGTTATATATATGCGCAAAAAATTTAAAACCGGGCGTCAGTGATCCTAATCAGGACGAGGAGAAATACATTCACCAGGGTACTGAGAATTTTAAGATATTGGCTACCCACAACAAATTATTGCCGCTTTGGGTGTCACTAACACTGATTCTCGTCTGTCTGATGTTCTCCGCTCTGTTCTCCGGATTGAATCTCGGCCTGATGTCTCTGGATAGGACGGAACTGAAAATCATATCCAATACGGGAACAGAACAGGAGAGGAAATACGCCAGAGCGATAATGCCTGTCCGTGATCATGGCAATTATTTACTATGCAGCATTTTATTGGGCAACGTCGCAGTCAACTCCACATTCACGATACTCCTGGATGAATTGACTTCCGGTCTGTTTGCCGTTATATTCTCGACGCTGGCTATAGTACTCCTGGGTGAGATAACACCGCAGGCTATATGTTCGAGACACGGGCTCATGGTAGGGGCTAAAAGCATCGTCATCACCAAGGCGGTGATGGCGCTCACAGCGCCACTGGCGTTTCCGGTGAGCAAACTGCTGGATTACTTCCTGGGTGAGGAAATTGGCAGCGTTTATAACAGAGAGAGGCTCAAGGAACTCGTGAAGGTTACTACGGACGTCAACGACCTGGATAAGGACGAGGTGAACATCATCTCCGGGGCGCTGGAGCTTAGGAAGAAGAAGGTCTCGGACGTGATGACGAAGTTGGAAGACGTGTTCATGCTGCCTATAACGTCTGTGCTGGACTTCGAGACGATGTCCGAGATCGTGAAGTCTGGTTTCTCCCGTATCCCGGTATACGAGGGCACCCGCACCAACATCGTGACCGTGCTCTTCATCAAGGACCTGGCGTTCGTCGACCCTGATGACAACACTCCTCTGAGAACCCTCTGCCAGTATTACCAGAACCCCTGCAACTTCGTCTTCGAGGATGTCACGCTGGATGTCATGTTCAAACAGTTCAAAGAAGGTCACAAGGGTCATATGGCGTTCGTCCACCGCATCAACAACGAGGGCGAGGGCGATCCGTTCTACGAGACCGTGGGTCTGGTGACGTTGGAGGACGTCATCGAGGAGATGATACAGGCTGAGATCGTCGATGAGACGGATGTGTTCAGCCACAAAGGTCATATGGCGTTCGTCCAACGGATCGAGGAGGGCGACGGCGACCCGGTGTACGAGACCGTCGGTCTGGTGACGCTCGAGGACGTCATCGAGGAGATGATCCAGGCTGAGATCGTTGATGAGAGCGATGTTATAAGTGACAATCGCACCAAGAAGCGCCTCCTCCGCCCCATGAACAAGCTGCACGACATCGCAGCGTTCGCCGGCCACCAGCACCAGCGAGTGCACGTCTCCCCACAACTTATCCTCGCCACCTTCCAGTTTCTCAGCACCAGTGTTGATCCCTTCCGGGCTGATATGATATCTGAGAACGTCCTGCGTCGCCTGCTGAAGCAGGACGTCATCCAGCACGTGAAGCTGAGGGGTGATGAGGATAAGAACGACCCCAAGAGATACGTCTTCCAAGAGGGGAAACCGGTGGACTACTTCGTGCTGATCCTCGAGGGGCGAGTGGAGGTGACGGTCGGCCGAGAGAACCTCATGTTCGAGGCCGGACCCTTCACGTACTTCGGAGTGCAGGCGCTCACGCAGAACGTCGGAGTCGGTGAGAGACAGATGGAGATAGAGAGAGATGGATCCATGTATCTGGCTGCGAAACGCGCGACCCTCATGGAGAAGGGGGCCCTCAACAAGGGAGGAACCAACGAGCAGATAGAACCCGAAGTAGACAAGCTTCTGCGCGAAGGTGACGGCCACAAGCTGGAAGAAATAGTCGAGAACGAAAAAGAAAACTCTATAGTTAAACAGTTCAACCCTACATCGGCAAGCCCATTCACGAATTCCACCTTCAAGTCATACGACAAAGGGGATAATCCTGAAGAGGAGAAGCTTTTAAAGAAATGA

Protein sequence:

>DPOGS215355-PA
MASVCVVLRTCGILLLLLIMQVSAKNNLSVEPWIVSLNVVAKSCVDVKCKYLLLVNGSEFLGHNSWKLTSKEGSRGSYCDTIYPNYELHEVETTQWFSKIKILIPNVNEKIYICLRHNKQKNNPVNGLWIHQGVELFLNPSGDDNILQENRTESLNLMKDQMAKDIELQETSTWSDLSRDISVNYINAVRPSDEEAKDIEVLRDNKYVPLNDIGTEFIDRNDINDGIESFNDRRRENDDKGDSNDINDRLKRDIIKDLNHEMWKMNDGKVPERPPEMFQNDGVANVVNPQVGDFTVVRSDAVPIFVEGLRVEDAAKEPKIIEDGIPSVLADTKVVLRLFGQGFTPRTVIAFTQDPMDYGQPCKFLVKGEYMAMEGSVTKSSVLFDIIAPSPIVGSKLYICAKNLKPGVSDPNQDEEKYIHQGTENFKILATHNKLLPLWVSLTLILVCLMFSALFSGLNLGLMSLDRTELKIISNTGTEQERKYARAIMPVRDHGNYLLCSILLGNVAVNSTFTILLDELTSGLFAVIFSTLAIVLLGEITPQAICSRHGLMVGAKSIVITKAVMALTAPLAFPVSKLLDYFLGEEIGSVYNRERLKELVKVTTDVNDLDKDEVNIISGALELRKKKVSDVMTKLEDVFMLPITSVLDFETMSEIVKSGFSRIPVYEGTRTNIVTVLFIKDLAFVDPDDNTPLRTLCQYYQNPCNFVFEDVTLDVMFKQFKEGHKGHMAFVHRINNEGEGDPFYETVGLVTLEDVIEEMIQAEIVDETDVFSHKGHMAFVQRIEEGDGDPVYETVGLVTLEDVIEEMIQAEIVDESDVISDNRTKKRLLRPMNKLHDIAAFAGHQHQRVHVSPQLILATFQFLSTSVDPFRADMISENVLRRLLKQDVIQHVKLRGDEDKNDPKRYVFQEGKPVDYFVLILEGRVEVTVGRENLMFEAGPFTYFGVQALTQNVGVGERQMEIERDGSMYLAAKRATLMEKGALNKGGTNEQIEPEVDKLLREGDGHKLEEIVENEKENSIVKQFNPTSASPFTNSTFKSYDKGDNPEEEKLLKK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: