MonarchBase - Protein-coding gene

DPOGS203584
Transcript	DPOGS203584-TA	4395 bp
Protein	DPOGS203584-PA	1464 aa
Genomic position	DPSCF300063 - 1091466-1100378
RNAseq coverage	856x (Rank: top 15%)

Annotation
*Heliconius*	HMEL015868	0.0	78.35%
*Bombyx*	BGIBMGA001380-TA	7e-150	68.04%
*Drosophila*	chb-PB	0.0	36.47%
EBI UniRef50	UniRef50_Q7QJR3	0.0	39.48%	AGAP007623-PA n=4 Tax=Culicidae RepID=Q7QJR3_ANOGA
NCBI RefSeq	XP_308248.4	0.0	39.48%	AGAP007623-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|158285331	0.0	39.48%	AGAP007623-PA [Anopheles gambiae str. PEST]
NCBI nr blastx	gi\|158285331	0.0	39.19%	AGAP007623-PA [Anopheles gambiae str. PEST]

Group
Gene Ontology	GO:0005488	5.3e-40	binding
KEGG pathway
InterPro domain	[8-990] IPR016024	5.3e-40	Armadillo-type fold
	[8-221] IPR011989	6.5e-22	Armadillo-like helical
Orthology group	MCL11440		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS203584-TA
ATGTCTCACTATCCCCAACCGTCCTCCCTGGAGGCCGCCCTGCCGCTGCTGTCTCGGCCGGACCTGCGTCTCCGGCAGCAGCTGGGGGAGCGTCTGGTGAGCCTGGTGCGCTCGGAGGAGCTGACCCCCGACCTGAATCCCGATCTGACCGGACCTCTGCTTGACGCGCTCGTCGGTTGGCTCAACGGAGGGAACTTTAAGGTCGCCCAGAACGGTCTGGAGGTGATGTCGGCCCTCGTTGAACGTATGGGCCCCGAGTTCTCACACTACGTGCCCACAGTGCTGCCTCACATCATAGACAGGCTGGCGGACACCAAGGAGGGCGTGCGGGTGTCGGCCCGCGCCTGCATAGCGACCCTCAGCTCGTGCAGGGCGGCGGCGCCCAGGGCCATACTCGCGAGACTCACTCCAGCGCTGGGGCACAAGGCGGCGCACACCCGGGAAGAGGCGCTCACCTGCATAGGAACGCTGCTGCATGAACACGGCGCAGCGGAGTTACAGCTGCGGGGTGCGGTCCCGCAGGTGGCGGCGCTTCTAGGAGACCCCAGCGGGGCCGTCAGGGACGCCGCGCTCGAACTCATCGTGGACGTCTACAGACACGTCGGGGAGAGGCTCCGGCAGGACCTGCGGAGGAAGGACCTCGTGCCGCAACAGAAGATGGCGCTGCTGGAACACAGGTTCGACGAGGCAAAGGAGGCCGGCCTGCTGCTGCCCTCGGCGTTGGGCGCGGACGAGGCGGACTGCGCTCCTCGTGTGAAGCGCGCCCTCACGCTGCCCACGCCGAGAGGACGAGAAGATACTTCAGGATCCAGTACACCCGCGGGTGAGCCGAAGCGTACAGCGGCGGGTCTGTACAGCCTGCCGTCGGCGAGCAGGAAGCCGCCGCCGCCCACCAAGCTGAACAGCGCGCAGAGCGCGAGCGGAAGCGGAGGCGGAGGGGTGGGCGGCGAGGCGGGCGCGGTGTCCAACGAGTCGTTCGAGGCGGCGTTCGCGAGCACGGCCCCCGCCGCCGTGTACGGAGCCCGCGGCCTGGACGACCTGTGCCGCCACGCCGCCGCCCTGCTCGGGGACCGCGCCGCCGACTGGGAGAAGAGGGTCGACGCTTTGAAGAAGATCCGCTCGTTGTTAGCGGCGAACGCACACGTTCAGTTCCCGTCGGAGTTCGCGGCGCACCTCAAGGACCTGTCGGTGCCGTTCCTGGTGGTCATCAAGGATCTGCGCAGCCAGGTGGTGAGGGAGGCCTGCATCACCATCGCCTACATGGCCAAGGTGCTGCGGAACAAGCTGGACCAGTTCAGTCTCTACATACTACAGGAACTCATCAACCTCATACAGAACGCCGCCAAGGTGGTGTCGTCGGCGGGCACGGTGTGCGTGCGGTACATCGTGCAGCACGTGCCGGCGCCGCGCCTGCTGCCGGTGCTGGTCACCAACCTTACCACTCACAAGAGCAAGGAGATCCGCGCCACGCTCAGCGAGGTGCTGCTGCTGCTGCTGCGCTCGTGGCCGCGGCCGGCGCTGGACCGGCACCAGGCGGCCATCGCGGACGCCATACGAAAAGCCTGCGCCGACGCCGACAGCACGGCCAGGAACAACGGCAGGAAAGCGTTCTGGTCGTACAAGAGTCAGTTCCCGGAGCAGGCGGAGGCGCTGTTCAGTCGCATGGACGTGGCCGCGCAGAAACAGCTGGAGAGAGACAAGGCCGGCTCCATGGACGGACTGCAGCAGTTGATACCCGAGAGAACTAGAACCATCACCAGTCCGCGGAGTCCTTCGGCCAGCGTGTCCGCGTCCACTGAGAGCCTGGTGTCGGTGGTGAGTCGCTCGGGTTCTCTCCGCCGGCGCCGCTCGTCCCAGGAGCGTCCGCCCATCTCTCACATCCCGGTGGCCATGCGAGATCGTTCGCCGGCCACCGGCTGCGTGTCGTCCCGGTCCGTGTCGGCGGTGGACGCGGCGGCCGCCCAGCGAGCCCGCGCCCGAGCTGTTTACTCGCACCTCGCTAGGACTAAAGTCGCCGCCGGCAGCGCCAGTCTGCCCCGCGTCAAACGTTCCCCGGTGGCGGCGGTGCCCCCCAGCCCTGAGCGGAGCGTGCGGTCCAGGTCGCGCCCCGGAGTATCGCAGTCACAACCGACGTCCCGGTCGTCGTCTCCGTCGTCTCGCAGCGGTCCCGTGTCGCTGTCGTGTCGCCGCCGTCCGTCCGGGATCCCCAGGTCGCTGGCGGGGTCTCGAGAGACCAGTCCGACCCGCACCCGCTCCGGCAGCCTCGCTCGTCGCCGGGACTCCGTGGACCGCCGCCCCCCCGCCGCGACGCTGCGACTCCTGCAACAGTCCAGAGACGCCGAGAACGCGCTGCGGAGTCCCGAGGACAGCTCGTCGTGTGAGGTGCGGCGAGACGATGACTCGGAGGCGTCCTCCGTGTGTAGCGAGCGGAGTCTGGACTCGTACAGGAGACACGACAGCGTGTCCTGGTCGGGGTCCAGCCGCCTGGTATGGGAGGGGTCTCCGCCGCCCCCGCCTCCCGCCGATGACGTCATAGCACTGTGCGCCTCGACACACTGGACCGAGAGGAAAGACGGACTGACGCATCTAGCGAACTATCTGAACAGCGGGCGACTGCTGACGGAGGACCAGCTGAAGAGGCTGACGGACTTACTCAACAAGATGTTCGTAGACGCTCACACAAAGGTGTTCTCCCTGCTGCTGGACGCCGTCTGTGAGCTGCTGCTGGTGCACTGGCAGCAGCTCAGGGACTGGCTCTACCAGCTCATGTTCAGATTACTGATGAAGCTCGGCACAGACATCCTGGGCTCCGTGCAGAGTAAGATCATGAAGACGCTGGACGTCATACACGAGTGCTTCCCCGCGGAGCTGCAGCTGCATAACATATTCAGGTTCCTCGCGGACGGAGCGACGGCCCCCACCGCCAAGACGAAGGCGGCCGCGCTGCGCTTCCTGGCCGACCTCGCACACGACTACTGCACGCCCGCGGGCCTCGCCGCCGCCTTACACGGCGGCTCGTCCGGCGTGGCGGGTCGAGCTCTAACGAAGGTGGCGGTCCTGGCGGGAGACGCCCGCGCGGGCGACGTGCGCCACTGCGCCCGGCGCGCCCTCGCCGCTCTGTATGATTGTAACCCCGGCCCCTTCACGACTCTCATGTCGGAGCTGTCGGCCGACACGCAGGCGCTCGTCAACGGGGTGGTGCAGCAACACGTCAGGAGGACCTCCAGCACCGGCAGCGACAGTCCGCTGAGGTCGACGGCCGCGCCCGACGACGTCTACAGCCGGATACGGAAGACGACCAGCGAGATACACACGTACACCACGCAACACGCGAACGCGGAGTGCGCGAGCCACGCCTGCAGCAAGGACTCGGGGATCAGTCAGATGTCGGAGCGGCACAACGGGCACGCGCATGAGGCGGTGGCTCGAGCGGCGTCCGCGGACAGCTCGGAGGCGAGCAGCACCAAGGAGTCCTCGCCGGGCCCGCACCGACCCGACTATCACGGAGAATACAACGCGACCGCCGGAAACAACAACAGAGACAAGATGAAGCCCTACGAGATGGACGAGAACGGGATGATCATCACCAAGTCCGGACTCCGCGAGAGTGAGGTGCTGGAGGCGCTGTCCTCCCTAGACGTGGCGGCGGCGGCCCCGGAACACACGGAGCGTTTGCTGCTGGCCACGCACGAGGTGCTCAAGTACGGAGACTGCCGGCTGCCGCTGGAGTACTTCAAGAACATCGTCCGCGCCGCGCTCGCCGCTCTCTCCATCGACGACAACTCGGCAGACAAGGAGAACGCCGAGAATGCCACCAACACACAGCACGCCTCAGGGTGGGGCACGGCCCAGGAGCGGGCGGCGGCCGAGGCGGTGCGCGTGCTGGTGTGGCTGTGTCGGCGGACGGAGACGCGTGCGCTGTGGGCGGAGTACTTCGACCTCATCCTGCTCAAGCTGATCAACGCGTACGGAGCCTCCAGCAAGGAGGTCATGAGGGCCGTGGACGCGGGCATGACGCACATCGCACACGCGCTGCCGGCGGCACAGGTGCTGGCGCTCCTGAAGCCCGTGATCCGGACCCGCGGGTACCCCACGTCTCTGTGCGCTCTCAAGCTGGCGGCCGAGGTGGCGAAGGCTCGAGGAGACGAACTGACGGACGAGACAGTGGCGCAACTCATGGAGGGAGTCGGGCAGCTGGCCGACCACCAGAACTCTGCGGTGCGCAAGGCGGCCGTGTTCTGTATGGTGGCCTTCACGTGCGCTCTCGGCGACGAGCGGATGACGCCCCACCTGAAGCACCTGTCCGTCAGCAAGTACCGCCTCCTGCAGGTTTACATCAGTAAGCAGCGCGAGGAGTCCTCTCGGCCCCCTCCACCCTCCTCCACACACTCGTAG

Protein sequence:

>DPOGS203584-PA
MSHYPQPSSLEAALPLLSRPDLRLRQQLGERLVSLVRSEELTPDLNPDLTGPLLDALVGWLNGGNFKVAQNGLEVMSALVERMGPEFSHYVPTVLPHIIDRLADTKEGVRVSARACIATLSSCRAAAPRAILARLTPALGHKAAHTREEALTCIGTLLHEHGAAELQLRGAVPQVAALLGDPSGAVRDAALELIVDVYRHVGERLRQDLRRKDLVPQQKMALLEHRFDEAKEAGLLLPSALGADEADCAPRVKRALTLPTPRGREDTSGSSTPAGEPKRTAAGLYSLPSASRKPPPPTKLNSAQSASGSGGGGVGGEAGAVSNESFEAAFASTAPAAVYGARGLDDLCRHAAALLGDRAADWEKRVDALKKIRSLLAANAHVQFPSEFAAHLKDLSVPFLVVIKDLRSQVVREACITIAYMAKVLRNKLDQFSLYILQELINLIQNAAKVVSSAGTVCVRYIVQHVPAPRLLPVLVTNLTTHKSKEIRATLSEVLLLLLRSWPRPALDRHQAAIADAIRKACADADSTARNNGRKAFWSYKSQFPEQAEALFSRMDVAAQKQLERDKAGSMDGLQQLIPERTRTITSPRSPSASVSASTESLVSVVSRSGSLRRRRSSQERPPISHIPVAMRDRSPATGCVSSRSVSAVDAAAAQRARARAVYSHLARTKVAAGSASLPRVKRSPVAAVPPSPERSVRSRSRPGVSQSQPTSRSSSPSSRSGPVSLSCRRRPSGIPRSLAGSRETSPTRTRSGSLARRRDSVDRRPPAATLRLLQQSRDAENALRSPEDSSSCEVRRDDDSEASSVCSERSLDSYRRHDSVSWSGSSRLVWEGSPPPPPPADDVIALCASTHWTERKDGLTHLANYLNSGRLLTEDQLKRLTDLLNKMFVDAHTKVFSLLLDAVCELLLVHWQQLRDWLYQLMFRLLMKLGTDILGSVQSKIMKTLDVIHECFPAELQLHNIFRFLADGATAPTAKTKAAALRFLADLAHDYCTPAGLAAALHGGSSGVAGRALTKVAVLAGDARAGDVRHCARRALAALYDCNPGPFTTLMSELSADTQALVNGVVQQHVRRTSSTGSDSPLRSTAAPDDVYSRIRKTTSEIHTYTTQHANAECASHACSKDSGISQMSERHNGHAHEAVARAASADSSEASSTKESSPGPHRPDYHGEYNATAGNNNRDKMKPYEMDENGMIITKSGLRESEVLEALSSLDVAAAAPEHTERLLLATHEVLKYGDCRLPLEYFKNIVRAALAALSIDDNSADKENAENATNTQHASGWGTAQERAAAEAVRVLVWLCRRTETRALWAEYFDLILLKLINAYGASSKEVMRAVDAGMTHIAHALPAAQVLALLKPVIRTRGYPTSLCALKLAAEVAKARGDELTDETVAQLMEGVGQLADHQNSAVRKAAVFCMVAFTCALGDERMTPHLKHLSVSKYRLLQVYISKQREESSRPPPPSSTHS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: