MonarchBase - Protein-coding gene

DPOGS202081
Transcript	DPOGS202081-TA	4230 bp
Protein	DPOGS202081-PA	1409 aa
Genomic position	DPSCF300116 - 67122-80400
RNAseq coverage	191x (Rank: top 48%)

Annotation
*Heliconius*	HMEL003383	84.96%
*Bombyx*	BGIBMGA011306-TA	88.24%
*Drosophila*	rols-PB	45.01%
EBI UniRef50	UniRef50_E0W098	46.36%	Rolling pebbles, putative n=7 Tax=Neoptera RepID=E0W098_PEDHC
NCBI RefSeq	XP_969896.2	56.00%	PREDICTED: similar to rolling pebbles [Tribolium castaneum]
NCBI nr blastp	gi\|270003434	56.13%	hypothetical protein TcasGA2_TC002665 [Tribolium castaneum]
NCBI nr blastx	gi\|270003434	56.23%	hypothetical protein TcasGA2_TC002665 [Tribolium castaneum]

Group
Gene Ontology	GO:0005488	5.5e-12	binding
	GO:0005515	2.2e-05	protein binding
KEGG pathway
InterPro domain	[892-1270] IPR020683	2.4e-59	Ankyrin repeat-containing domain
	[1248-1365] IPR011990	5.5e-12	Tetratricopeptide-like helical
Orthology group	MCL11026		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS202081-TA
ATGCCGAAAAATCGACGAATCCATCTCAAAAGGTCAGAAAAGGAAAGCGCGCCGCGGGCGAGAACGGACTTGGCCGCTTTACGACAACTTCTGGAGAGCGAAACGGGAGGCACAACCTGTCCGAGTTGTAACATGCCCTTTGATAAGGGTAAAAAGAGAAAGTTAATTGACACATGCGGACATGAGCGCTGCTATTCCTGTATGTTCAGAAACGAAGCCTGCCCAATTTGTGCAAGAAAAAGTCAGGGAAGACGTCCAGTTATGGAGAGATATACCCCTTCTCCACAGCGACAAGTGGATCATGAATGGCAATCACCGATGCGACTACCAAAACCACCGAAGCCTTCGAGTCTCGCTCAAAGCTGCCCCACACCCCCTCATACGAGAAGAAGATTCTTCCTTAGTCCTAAATCCTTGCGCAGTCCATTCGGCCAGCGAAGCCGCCATTCTCACGAAAACCACGTGCCTCTATCAGGGTTACCAGAAGAAGGTCCTAGGAACGCAGCCTGGACGAGCTTGGTGTTTAATAAGATAAGATCGTTGTGGTCAGCGCAGTCCTCAGTGCCTCAAGGACTCAACCAATTGACAGGCACGGAAACACAATATGACGAAGGAGGTCATATCAAACAAGGTTACGAGACAAGACGTCAAAATGACTTGTACATGCGGTTGGGATTACTTCTTGGAGAGCGACGTGGATCCAGAAACAAATCCCGGGACAGTTGCACATCTCTGGCCTCATTGGACGCTCATACTCTAGCCTCTCACAATACCAGTCCAGTGTCAACTCTAACTGGATCGTCAGAAGTGGATGCTGCGACACCACTTGGTAGGGATTCTTTAGGATCACTAGCCTCAATGTCACTCTCTGCCGCCAGCAATTGTTCATCATCAAGTCCAGGAAGCAGACGGCATTCTGTTAACACCTTGCAAAATGGACGAGAAGAATTGACACGGATGTCAAGTGGATTCTTTAAGAACAGAAAAACAGCAGCACGGAGATCAGCTCGTGTCAACAGCAAACAGTCGTCATCTTCGTCAGAAATAAAGAAAGTTCATCCAACTCCGCAACTGACATTGAGACCACTATTCTTCGAAGTGCCGGCAACCAATAACGACACTTGCTTTTCTGGACGACACTGGCTTATGAGAGACATGGAAAAAGCTTTGGAATCTTCTTCACCTGGTATAATGATATCAGGCTGTCCAGGTACAGGCAAAACTGCTTTAATACTTCAGCTGGTCGAATATTCATGTTTCGGCCGCAAAAGGAATTATCAGTATCAAGAATTAAGAGAGCAGTCAGATATTAGAGAAATGCTGCCAGAAGAAATAGCAGCAGGGATGATCACACAACTAGCATCACAAGTTGTTGCTTATCATTTCTGCCAAGCAGACAACAACAGCACTTGCCTTGTTGGCGAATTTGTACATTCCCTGGCGGCCCAACTATGTCAAGCACCAAGACTACAGGCATATAGAGAATACCTACTTAGCGAACCACATTTGCTATCCTGCCTTTCATTAAAAGAATGTATAGCCGATCCAGACTTAGCCTTTATGAGAGGCATTATAGAACCTCTTATAATATTAAGAAGAAATGGAAGTATAGATTCAAGTAATAGTATTATACTTGTTGATGGGCTCTGTGAAGCTGAATATCACCGACCCGATCACGGTTATACTGTTGCTTCATTTCTTATAAGACATGTACCAGAAATGCCAGCATGGCTTAAAGTTGTAGCCACCATAAGAAGTCAATTTCTGGAACTAACAAAGCAACTACCATACACAAGGTTCAGTCTAAATGAATGTGACAATGTCCAAAAAGATCTATTGGAATATTTTAATGCCAGGGTACAAGCAGCCCCAATTATAGAAACAAATATTAAAAGTTCCACGGGGAAATCCGAAGGAGTTCATAATTCTGTCATGAAGTTTGCCCAATATGTTATTCATCTCAGTCAAGGGTCATTCCTGTTTCTAAAATTAATTTTAGACCTTCTTGAACGCAGTCATATAGTCGTAAAGTCGACTAACTACAAAGTTGTGCCAATTTCGTTAGCTCAAATATTTTTGCTGCAATTCAATTTAAGATTCCCCACGGTACAATCTTTTGAAAAAGTAACCCACATTTTAAGTGTTTGTCTAGCAGCACTGTATCCTCTCACCTTGGTAGAGATTTATTACTCTGTAAATTCTCTTCTTGTCGACACTTACTTGCCGTGGGAAGAATTTTGTCACAGATTTGAAAGCCTATCCGATTTCTTGGTGAAAAGAATCGATAATACTTACATGTTCTTCCACCCATCATTCAGAGAATGGTTAATACGACGCGATGATAATGAGAGTCCAAAATTTCTATGTGACCTGCGGGCTGGTCACTGCGGTATTGCTTTTAGACTTGCTAGAGTGCAAGCGCCTCTAGACCCAGAAAAGTCTATGGAACTCGGACACCACATTTTAAAAGCTCATATGTACAGAAATATGGGACCAGCACAGTTAGGACTATGTCCGAGAGATTTACAAGCAATGATGGTAGCGTCGAGCTCTTCGAATGTAGGCGAAGCAGTAGCTAATTTACGTAACGTATATACTCCAAATGTAAAAGTATCGCGTCTCATGCTGCTGGCTGGTGGATCACCTAATCAAATTACTGATTGTCTTGGAAATGCTCCTCTATTATGTATGTATGCATATCAAGGAATTATATCAATGGTGGGATTACTGATTGAATTTGGAGCTGATTTAGAAATGACAAACTCGCAAGGATGTTCAGCTTTATCATTAGCTTGTCAGAGAGGTCACACCGATGTTGCGAGGATGTTGATAGCATCAGGCGCATCTTTAAGTCACACTGATACAGCCGAACAAACACCTCTCGTCCACGCAGCAAAGAATGGTCATAGAGATACAGTAATTTACCTGCTGGGTTGTCAAACTGGTAAAGACGATCGAAACTCAATAGAAATAGACGAAGGCAACATTGAACAACTAGTTCCCGGATCAAGACATGCTCTGATAGCGGCAGCTCAAAACGGTCATTTGGATATTGTCGAGTATCTTCTAGATACAGCTGAATTAATCCCCGACGGTATTTGTCCAGTAACAGGTGAGACAGCACTGACAGCTGCTTGCTCTACTGGTAACGCTGCCATCGCTGATGCTCTCCTAATTCGAGGAGCTACGCCATACTCATTAAATGCCAGACAAATGTCACCTTTGGCCCTAGCAGCTAAAAATGGCAGAACAGCATTAGTTTTACGACTCCTGGATTCTGGAGCTGATGTTATGGGGTCGAGTGGGAAAATACCATTAATTTTAGCAGCTGCGGAGGGTCATTCAGATGTTGTTGAAATGCTTTTAGGTCATGGAGCTGATCCCAATGCTGTGGATGGTGATGGCATATCTGCTTTAGGTTGGGCAAGTCTGAGATCTAGAATACCCACGGTAGTAATGCTTTTAGACAAAGGAGCAAATATAGAGCAAGCTGACAGTAGCGGCCGTACACCGTTAGGACTAGCTTGCGGTGGACCGGCGGAGCTAGCGGAACTTCTTTTAGAACGTGGCGCATCACTAGAACGTGGAGACCACAGCGGCTTACGACCATTAGATCGCGCCATCGGACAGAGGAATGTACCGATAGTAAATTGCTTTCTACGGAAAGGAGCGAAACTCGGTCCAACGACATGGGTAATGGCGTCAGGAAAACCAGAATTTATGCTCATCCTACTCAACAAACTTCTGGAAGACGGTAACATTTTATACCGCAAGAACAGGCCGTCTGAAGCTGCTCATAGATATCAATACGCCCTCAAGAAGATCTCTCCGCTCATCAGCGATGACGTCACCAACGCCCAGGAACACTTGAACGTTTTCGTGCAGCTTAAAACCAATCTGCTGCTAAATTTATCGAGATGCAAACGAAAACTTAATGAACCATCAGAGGCTTTGGATTTAGCCGCCCGCGCGTCCGTGTTACGTCCGAACGCTTTCGAATGTTCCTACGCCATGGCGAGAGCGATACTTGCTCTGAACAAACCATCAGATGCTCTTCCTCATGCTAGACGAGCTTTACTCCTCGCTCCACAGACAGATCTATCAGCCATGAGAACCTTGAAAGCCCTTCAACAAGAAATTCTGACGCGTATTAATGCCGGTACACAAAGTTTAAACGGTGACACACGATCTTTAAGAAATTTTGACAGCATTAGTCTAAACATGCCTTAA

Protein sequence:

>DPOGS202081-PA
MPKNRRIHLKRSEKESAPRARTDLAALRQLLESETGGTTCPSCNMPFDKGKKRKLIDTCGHERCYSCMFRNEACPICARKSQGRRPVMERYTPSPQRQVDHEWQSPMRLPKPPKPSSLAQSCPTPPHTRRRFFLSPKSLRSPFGQRSRHSHENHVPLSGLPEEGPRNAAWTSLVFNKIRSLWSAQSSVPQGLNQLTGTETQYDEGGHIKQGYETRRQNDLYMRLGLLLGERRGSRNKSRDSCTSLASLDAHTLASHNTSPVSTLTGSSEVDAATPLGRDSLGSLASMSLSAASNCSSSSPGSRRHSVNTLQNGREELTRMSSGFFKNRKTAARRSARVNSKQSSSSSEIKKVHPTPQLTLRPLFFEVPATNNDTCFSGRHWLMRDMEKALESSSPGIMISGCPGTGKTALILQLVEYSCFGRKRNYQYQELREQSDIREMLPEEIAAGMITQLASQVVAYHFCQADNNSTCLVGEFVHSLAAQLCQAPRLQAYREYLLSEPHLLSCLSLKECIADPDLAFMRGIIEPLIILRRNGSIDSSNSIILVDGLCEAEYHRPDHGYTVASFLIRHVPEMPAWLKVVATIRSQFLELTKQLPYTRFSLNECDNVQKDLLEYFNARVQAAPIIETNIKSSTGKSEGVHNSVMKFAQYVIHLSQGSFLFLKLILDLLERSHIVVKSTNYKVVPISLAQIFLLQFNLRFPTVQSFEKVTHILSVCLAALYPLTLVEIYYSVNSLLVDTYLPWEEFCHRFESLSDFLVKRIDNTYMFFHPSFREWLIRRDDNESPKFLCDLRAGHCGIAFRLARVQAPLDPEKSMELGHHILKAHMYRNMGPAQLGLCPRDLQAMMVASSSSNVGEAVANLRNVYTPNVKVSRLMLLAGGSPNQITDCLGNAPLLCMYAYQGIISMVGLLIEFGADLEMTNSQGCSALSLACQRGHTDVARMLIASGASLSHTDTAEQTPLVHAAKNGHRDTVIYLLGCQTGKDDRNSIEIDEGNIEQLVPGSRHALIAAAQNGHLDIVEYLLDTAELIPDGICPVTGETALTAACSTGNAAIADALLIRGATPYSLNARQMSPLALAAKNGRTALVLRLLDSGADVMGSSGKIPLILAAAEGHSDVVEMLLGHGADPNAVDGDGISALGWASLRSRIPTVVMLLDKGANIEQADSSGRTPLGLACGGPAELAELLLERGASLERGDHSGLRPLDRAIGQRNVPIVNCFLRKGAKLGPTTWVMASGKPEFMLILLNKLLEDGNILYRKNRPSEAAHRYQYALKKISPLISDDVTNAQEHLNVFVQLKTNLLLNLSRCKRKLNEPSEALDLAARASVLRPNAFECSYAMARAILALNKPSDALPHARRALLLAPQTDLSAMRTLKALQQEILTRINAGTQSLNGDTRSLRNFDSISLNMP-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: