MonarchBase - Protein-coding gene

DPOGS200642
Transcript	DPOGS200642-TA	3336 bp
Protein	DPOGS200642-PA	1111 aa
Genomic position	DPSCF300076 + 633990-644893
RNAseq coverage	83x (Rank: top 64%)

Annotation
*Heliconius*	HMEL001044	0.0	77.83%
*Bombyx*	BGIBMGA011319-TA	0.0	70.96%
*Drosophila*	defl-PA	4e-90	51.69%
EBI UniRef50	UniRef50_C3PPH1	0.0	75.04%	DNA sequence from clone AEHM-21P16 (Fragment) n=1 Tax=Heliconius melpomene RepID=C3PPH1_9NEOP
NCBI RefSeq	XP_396796.2	3e-127	42.90%	PREDICTED: similar to integrator complex subunit 7 isoform 1 [Apis mellifera]
NCBI nr blastp	gi\|229487377	0.0	75.04%	unnamed protein product [Heliconius melpomene]
NCBI nr blastx	gi\|229487377	0.0	75.04%	unnamed protein product [Heliconius melpomene]

Group
Gene Ontology	GO:0005488	6.6e-17	binding
KEGG pathway
InterPro domain	[20-472] IPR016024	6.6e-17	Armadillo-type fold
	[432-468] IPR011989	2.1e-09	Armadillo-like helical
Orthology group	MCL11879		Single-copy universal gene

Nucleotide sequence:

>DPOGS200642-TA
ATGATCGGAGTAAGATTAAACTCATTCAGCGATAATTCAGGGGAACCTGAACAGGACGCTAATTCTGCTTTAACAGAGTTGGATAAAGGTCTAAGGTCTGGTAAAGTCGGAGAACAATGTGAAGCTATAGTCCGTTTTCCTCGTTTATTTGAAAAGTACCCGTTTCCTATATTAATTAATTCATCATTTTTAAAATTGGCGGACGTGTTTCGTATGGGTAACAACTTTTTACGGCTCTGGGTTTTACGCGTGTGTCAACAGAGCGAGAAGCATTTGGATAAGATATTAAATGTGGATGAGTTTTTGAGGCGGGTTTACAGCGTGTTGCATTCAAATGACCCTGTGGCGCGAGCGTTGGCGCTGAGAACTTTGGGTGCCGTGGCAGGAATAATTCCCGAGCGTCAGAACGTCCATCATGCAATCCGCAGAGGTCTAGAGAGCCACGATAATGTAGAAGTCGATGCCGCTATTTATGCTACTACTAGATTTGCTGCACATTCAAATTCATTCGCAGTGGCCATGTGCAATAAGCTGTCGGACATGGTCGAGTGCGAGAGTACGGGGGTTGAGCGGAGAGCAAAACTCGTCAGGGCCTTACGGACAGTACATGGCGGAGCGGTTCGTGCTCAAGGTGTCCTGAAGCTGCTAAGGTCCCTGCTGGAGAGATTCCCTTCATCCAGCTCAGTCCGAGCTGCAATCACAGCTCTCACTGCCATCGCTGCGGATACAGTAGTGCATGTACCCGATCAGGTGGAGCTTCTGCTTAAACTGGCGGTTAACGACGCTCGGTCAGCTGTTCGCCGCGCTGCGCTAGTGGGTCTTCGTAAACTGGCTGAGCATGCTGCGCTATGGCCCACTGACTGTATCCAAGACCTGGTGCACGCGGCTTCAGAGATGCAGGACGATGAGCATAGCATGCTCTGCCTACAGGTCATGCAGATCCTGGTCCGTTGCCCGGCGGTGTGCGCGGCGGCCGGGCCCGAGGCGTCTCTCCGGCGCCACTGCAGCGCTGCAGCGCTCAGCGTCAACATGAAGCTAGCTGCAATCGCTGCAGACGTACTCACAAGAATCGTAGCCCACTGCTACGAGGAGAATCTCCCGGTCGAAGGTTCGGAGCTGATGCTGGCCCTGGAGTCGCTGGTGATCGCCACCGGCATGGACAACGGACAGAATAATATACGACCCCTGCGGATAGCGCTCAGATGTCTGGTACAATTGAGTTCCTCCGCCCCTCACCTGTACGCGAGTCGAACCGCTGGTGTTTTGGGGTCCGCCGCCCAGAGCTCCGTGGGTCCGCGACAGGCTGCACTACTCGAAGGCCTGGCTGCGCTCGGGGCCCTAGGGGCCTCCGCCGCACCCTATCTCATACCAGCCCTAGAGAGAGCCAAGGAGGACTGCAAGGACCCGACCTACGACGGCACCACTCTAGTGCTGATCTGCACGGTGCTGCTGCAGGAGAGGGCGGTGGCAGCGCTGCGGTACAGGATCCGGGGCTCGTGGGAGGAGAGGATCAAGGATGCCGTGAGGGGAGCCGACGGCTGGACCAGATACAGGGTCGCCAGGACCGCGCTCAGCGCCGTCTGTCGTCCGCGTCCCCGTGCTAGCGACACGGTCTGTACGCGACTGTTGTATCTGAAACATACCATTGCAGAGTTTTATCAAAATCCGTTCAGTGCACAAACCTCCGCGGGTACAAGGTACGGCCACCACCGCCTGGCGGGGGAGCTCCTGGAACAGCTGGCTACTCAAGCGCCGTCCGAGGCGGCGCAGCGCTGGCTCACAGCACTACACCGAGCGGCCGCAGCTGATAGGCTGCTGGAAGATGAAGTTATTCCATGTCGTTTTTATTACGACACCGATCCCCTCGGCTCCTCGAGCTCGCCGTCCTGCAAGCCACATCATGTTTTAAAGTCCGCGCCGCTTTCCTTTGACGTTAATTTGTGCATAACACTCGGCCACCGACAGGTGTCTCGGCGCTGGAGGAGGCGAGCAGAACAGATCAAACCCTGGGCACCTCCCTATAGATACTCTCGCACGAACTCCCAAATACTTAACTTGAGCCAAATGTTGCAGCAAATAGGTGCGCTACTCGCCTGTATATCGTTACTATACTTAGTCAAAGATTTTATTATTTCTATGGGTCATGCTAGCGACACCTTCCGTGCACCGTTTGTCACCTTCCACCACAGCAATATCACACGGAAGCAAGGATTGAGGGCAAAGAAGACGAAGGAGGAGTCGGATAAGGGTCAGAGAGAGTCCGGAAACGAGAAGGAGGGCGAGGGTCAGGAGTTACCCCTCTACTGTCAGAGCGTCTACACCTACCCCCACACGGACTATATCAATTTCCAGCCGATGCCTGTTGAAGTAAAAGCACTTCCCCTGATGGTGGACTGCCGGCCGGCGGGCGCTCCGCCCCACGACATGCCCCACAATAACGGGACCGGCGATAACAGCCATCAGCAGGCTCCCAGTGGCGAGCTGGTGTCGCACGCCCGCGCCTCCACTCCCGCCGCGCCCACCTACCAGCACGCCTACAACGCACGGGTGGTGTCCTCCGAGATAGCTATATTCAATCAGTCAGTACCCGGAGGCGGTCCGTGTCCACACGCGGAGGCCGTGGTGGCCGGGGTCCGAGCTCTGTGTCGGGGGATCGTGTGGCCGCGGGCGGTCTGTGCGGGCGGGGCGGGCGGGGCGCCCTGCCGCGTGTCGCTGTCCCCTGCGCCGCGAGCGCCCCCCGCCGACCACGCCGCCGCCCTCCCCCTGGCGCACCGCCTGGCCGTTAAGCTGGAGGGCGTTCTGCTGCCGCCGCCGGGCAAGATGAAGAACAAGCGGCAAGTTAAAGGAGTCCAGATCACTGTGACCGCGACTCCACATCCGCGGACCAACGAGAAGACGGTGGAGCTGACGAACGTACAGCCGACGCTGACGGCCGTGCAGACGGTGACGCCCGTGAGGGACTTCTTCTCCGCCCAGCAGCTGGTGAGCGTCCCGGCTCCCGGACTGTACACGGTCGCCGTGGAGGCGGCCTTCGTGGACGAGAAGGGCCAGCTGTGGCACACCGGGCCCAGGAGCTGCATCGTCATCAAGGCGCACGAGGACCCCGGCACCAAGGGGAACTCGCAGACCTCGAGGAGCAGCGGCTTAAACTCGCCAAACGTTACGTTATACAGGGTGTCCCGAACTCAACGACCGGCACAATGTGACATGTTAATTTATTGTTTAAATTCTCTTCATCTAAACGCGCTTCATCCCGTTCTCAACGCTCCCGTGAACGACGACTATTACTTTCTGTCGCTGCTCGGCAAGCACCCTCTGACATGCTCGCAATTCTAG

Protein sequence:

>DPOGS200642-PA
MIGVRLNSFSDNSGEPEQDANSALTELDKGLRSGKVGEQCEAIVRFPRLFEKYPFPILINSSFLKLADVFRMGNNFLRLWVLRVCQQSEKHLDKILNVDEFLRRVYSVLHSNDPVARALALRTLGAVAGIIPERQNVHHAIRRGLESHDNVEVDAAIYATTRFAAHSNSFAVAMCNKLSDMVECESTGVERRAKLVRALRTVHGGAVRAQGVLKLLRSLLERFPSSSSVRAAITALTAIAADTVVHVPDQVELLLKLAVNDARSAVRRAALVGLRKLAEHAALWPTDCIQDLVHAASEMQDDEHSMLCLQVMQILVRCPAVCAAAGPEASLRRHCSAAALSVNMKLAAIAADVLTRIVAHCYEENLPVEGSELMLALESLVIATGMDNGQNNIRPLRIALRCLVQLSSSAPHLYASRTAGVLGSAAQSSVGPRQAALLEGLAALGALGASAAPYLIPALERAKEDCKDPTYDGTTLVLICTVLLQERAVAALRYRIRGSWEERIKDAVRGADGWTRYRVARTALSAVCRPRPRASDTVCTRLLYLKHTIAEFYQNPFSAQTSAGTRYGHHRLAGELLEQLATQAPSEAAQRWLTALHRAAAADRLLEDEVIPCRFYYDTDPLGSSSSPSCKPHHVLKSAPLSFDVNLCITLGHRQVSRRWRRRAEQIKPWAPPYRYSRTNSQILNLSQMLQQIGALLACISLLYLVKDFIISMGHASDTFRAPFVTFHHSNITRKQGLRAKKTKEESDKGQRESGNEKEGEGQELPLYCQSVYTYPHTDYINFQPMPVEVKALPLMVDCRPAGAPPHDMPHNNGTGDNSHQQAPSGELVSHARASTPAAPTYQHAYNARVVSSEIAIFNQSVPGGGPCPHAEAVVAGVRALCRGIVWPRAVCAGGAGGAPCRVSLSPAPRAPPADHAAALPLAHRLAVKLEGVLLPPPGKMKNKRQVKGVQITVTATPHPRTNEKTVELTNVQPTLTAVQTVTPVRDFFSAQQLVSVPAPGLYTVAVEAAFVDEKGQLWHTGPRSCIVIKAHEDPGTKGNSQTSRSSGLNSPNVTLYRVSRTQRPAQCDMLIYCLNSLHLNALHPVLNAPVNDDYYFLSLLGKHPLTCSQF-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: