MonarchBase - Protein-coding gene

DPOGS214207
Transcript	DPOGS214207-TA	3372 bp
Protein	DPOGS214207-PA	1123 aa
Genomic position	DPSCF300014 + 302425-306846
RNAseq coverage	86x (Rank: top 63%)

Annotation
*Heliconius*	HMEL006807	91.19%
*Bombyx*	BGIBMGA005934-TA	86.49%
*Drosophila*	CG8211-PA	44.41%
EBI UniRef50	UniRef50_E0VMM5	59.44%	Integrator complex subunit, putative n=13 Tax=Neoptera RepID=E0VMM5_PEDHC
NCBI RefSeq	XP_623755.2	60.91%	PREDICTED: similar to integrator complex subunit 2 [Apis mellifera]
NCBI nr blastp	gi\|383858000	61.52%	PREDICTED: integrator complex subunit 2 [Megachile rotundata]
NCBI nr blastx	gi\|383858000	61.44%	PREDICTED: integrator complex subunit 2 [Megachile rotundata]

Group
KEGG pathway
Orthology group	MCL13596		Single-copy universal gene

Nucleotide sequence:

>DPOGS214207-TA
ATGGATATCGAATTTATGAAACCCGTTAAGCCTCTAGTTTTCAAGGCTTTAAAAGATGTCGATATTGAAACTTTAATAAAATGCACACCGGATGAAATAAGACCGATCATACCATGTCTAGTCCGTATGGCTCTTATAGCACCTCTTGATATAACTAGATATTGTGCCGAGGCTAAAAAAGACATCCTGACTCTACTATCTGGGATTGATCTAGTAAATTTCATCGTATCTTTACTGTCTATTGAATTTCATGCTCTAGAAGTGGATCTAAAGAAAGAACAACAAATGCGCTTAAAAAGTGGATCCCAGAATACTGAATCCTTTTTAATACAGAATGTAGTAAATGGAATTGCAAATGACTTTGAACAGTCAGATTCCGCAAGAAGAGTCCGACTTGTTCTCTCTGAGTTGCTGCAGATGCAAGCGCAGTTGGCAGAGTATAATCAGAATAAAAATTCAAATTCTGAATCTTCTATAAAACCATCGGAACTCTTTGATAATGAGGTGTATCTTGAAGAAATTACAGATGTTATTTGTATAAGTCTTGCTGAATTACCAAATCTTTTAAATATATGTGAAATTGTTGAAGTATTACTGCATGTGAACAAGGGACCAATTATTATTTCTTGGGTTGTAGCAAATATGCCTGACACACTTTTAGATGTGGCAGAATCTTTGGTTTTAAATGCTGAAAGAGGAGAAGAAGGTGGCATTAGAGCCAAAACTTTATCCACATTATGTGACGCCTGTCCCTATATTGCAACAGCTGTTAGAGCAAAAGCTGTATCTGCTTCCAGACTACCGTGTTTAATAATAAACCTCACTTTGACACATCATCAAGACTTGGTATCCTTTATATCTGGTTTGCTATTGGGTTCAGACCAGAGTACCAGAACATGGTTTGCAACATTCTTACGTAACTCCCATAAAAGGGGGAAAGGAGATGGCCATGCAATATTGGTGAAGTTACGCCAAGAACTTCTGATTAGATTAAAAGAAGCTTCAGCTGGGGTTGATGCCTCTGCATTATTAAGGTTATACTGTGCCTTGAGAGGAATCGCGGGAATAAAGTTCCAAGATGATGAGGTGTCAGGACTCTTACGACTTGTGACACAAAAGCCACCGCCAACTCCAGCTGGTGTGAGATTTGTTTCCTTGAGTTTATGTATGATCCTAGCATGTCCTTCACTTATGGCTGCTCCTGAATATGAGAAGAAAGCAATAGAATGGGTACAATGGCTTGTAAAGGAAGAAGCTTATTTTGAAAGCAATTCAGGCGTCACAGCTTCGTTTGGGGAGATGTTGCTGCTAATAGCAATCCACTTCCACTCTGGACAGCTGACGGCCGTCGGTGAACTAGTCTGTGCTACACTTGGCATGAGGGTCCCCGTGCGACCAAACGGACTTGCGAGGATCAAGCAGGCCTTCACACAGGAAATATTTACTGAGCAGGTCGTCACTGCACATGCTGTTAAAGTACCTGTCACTGCAAATCTCAACAGCAACATATCCGGTTATTTGCCTGTGCATTGTATTCACCAATTACTGAAGTCGCGAGCATTTTCGAAACATAAAGTGCCAATAAAAAATTGGATATATAGTCAAATTTGCAACTGTATTGCTCCCTTACACCCTGTAATGCCAGCCCTCGTCGAAGTTTACGTCAATTCTATTCTGGTTATTAATAATAAAGGAACAAATGAATACTTCAACAAGCCAATAACAGAAGAAGAAATACGCAGGGTATTCCGAAAATCTATTTTTGGTGTTAATTATGACTCAAACAGCAAACCATTTACTTCTATGGATGTTGATAGTGATTCCACAGTTGACATAAACATTGAGAAACCAACTCTAGCCTCACAACTATTATTGATCTATTACCTGCTCCTGTATGAAGATGTAAGATTGGCTAATACAGCTATACTGATTGCCAATGGAAGAAAAGTGAAAAGTTATTCAACAACATTTCTTTCCGAATTGCCAATAAAGTATTTGCTACATCAAGCCCAGAAAGATCAAATGAGTTATGGTGGTCTTTTCAGCCCGCTGCTTCGTTTGCTTGCGACTCATTTTCCGCAGCTATCGCTTGTAGATGATTGGATGGATGACCAGGTCTTTGGAGATTCCTGTCGTCACCAAATAGACATTAATCTTTCAGAAGTATCTATAACTGAAGCATTCCAGTGCATCGAAGAAAATCCATATAAAACGGGTAAAATATTAAAAGCCATGCTTAATAAAAATCCTACTGACATATGGCCTTTTGCAGAAATATTTGTTAAATACGTGAAGAGTGTGTTAGGAGGTAGAGTCCCAAGACATATACAAGAACTCTACAGAGAGGTTTGGTTGCGTTTAAACACGGTTCTACCCCGATGTTTGTGGATATTGACAATTAACGCGTTGCTGGATATAAATAATGGATGCGGTAAATACGTTACCATAACACAGGAAAACGTTCTAGTTGATCCTTTACAAGTCTTAAGATGTGATATAAGAGTATTTAGATGTGGTCCTATATTAAAAATAATTCTGAGAATTTTAGAAGCGAGCTTAGCTGCATCGAGAAGCCAGTTAAGTCGCCATTTATTGGACAAGCCACTTCTTGAAAAAAGCGGCCAATTGACATCAGACTCCGAGAGGGAAGAATTGAAAAATGCCTTAGTTGCCGCTCAAGAAAGTGCAGCACTACAAATTTTACTAGAAGCTTGTTTGGAGACTGAAGAAGACCAATCTAAACCCGAACTAATGTGGTCTTTGAAAGAAGTACGAAGTATAATATGTTCGTTTTTACATCAAGTGTTTATAGCTGAGCCATCACTTGCAAAATTAGTACACTTCCAAGGATATCCGAGGGAATTATTGACAGTAACCGTCCAAGGCATACCGTCAATGCACATATGTTTAGATTTTATTCCTGAACTTCTAAGTCAAGCTTCTCTAGAGAAACAAATTTTTGCTGTGGACTTGGTATCTCATTTATCAATTCAGTATGCTTTACCCAAAGCTATGTCCATTGCGAGGTTATGCGTGAATACTCTATCCACCCTCCTATCTGTCCTACCAAGTGACCTGCGTCTGGAACTCTTCCAACCAGTTTTAAAATCGCTCGTACGGATTTGTATCGCATTTCCCTCCTTACTTGAAGATATTACATCGTTATTGTTACAGTTAGGTCGAATTTGTGAATCTCAGGTATCACTTGGCCATTGTTGGAATGACACAAATATATTGGGCGAAGGAGCTTATGTATCCTCTGAAGTTCACAATGACAGTAAAGTATTACTCGCCGAGGTTTTATGTAGGGACATTAAATCAACAATGTCAGAAATTATACAGAAAGCACTTTTAAATGATAAACTGTATTGA

Protein sequence:

>DPOGS214207-PA
MDIEFMKPVKPLVFKALKDVDIETLIKCTPDEIRPIIPCLVRMALIAPLDITRYCAEAKKDILTLLSGIDLVNFIVSLLSIEFHALEVDLKKEQQMRLKSGSQNTESFLIQNVVNGIANDFEQSDSARRVRLVLSELLQMQAQLAEYNQNKNSNSESSIKPSELFDNEVYLEEITDVICISLAELPNLLNICEIVEVLLHVNKGPIIISWVVANMPDTLLDVAESLVLNAERGEEGGIRAKTLSTLCDACPYIATAVRAKAVSASRLPCLIINLTLTHHQDLVSFISGLLLGSDQSTRTWFATFLRNSHKRGKGDGHAILVKLRQELLIRLKEASAGVDASALLRLYCALRGIAGIKFQDDEVSGLLRLVTQKPPPTPAGVRFVSLSLCMILACPSLMAAPEYEKKAIEWVQWLVKEEAYFESNSGVTASFGEMLLLIAIHFHSGQLTAVGELVCATLGMRVPVRPNGLARIKQAFTQEIFTEQVVTAHAVKVPVTANLNSNISGYLPVHCIHQLLKSRAFSKHKVPIKNWIYSQICNCIAPLHPVMPALVEVYVNSILVINNKGTNEYFNKPITEEEIRRVFRKSIFGVNYDSNSKPFTSMDVDSDSTVDINIEKPTLASQLLLIYYLLLYEDVRLANTAILIANGRKVKSYSTTFLSELPIKYLLHQAQKDQMSYGGLFSPLLRLLATHFPQLSLVDDWMDDQVFGDSCRHQIDINLSEVSITEAFQCIEENPYKTGKILKAMLNKNPTDIWPFAEIFVKYVKSVLGGRVPRHIQELYREVWLRLNTVLPRCLWILTINALLDINNGCGKYVTITQENVLVDPLQVLRCDIRVFRCGPILKIILRILEASLAASRSQLSRHLLDKPLLEKSGQLTSDSEREELKNALVAAQESAALQILLEACLETEEDQSKPELMWSLKEVRSIICSFLHQVFIAEPSLAKLVHFQGYPRELLTVTVQGIPSMHICLDFIPELLSQASLEKQIFAVDLVSHLSIQYALPKAMSIARLCVNTLSTLLSVLPSDLRLELFQPVLKSLVRICIAFPSLLEDITSLLLQLGRICESQVSLGHCWNDTNILGEGAYVSSEVHNDSKVLLAEVLCRDIKSTMSEIIQKALLNDKLY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: