MonarchBase - Protein-coding gene

DPOGS209971
Transcript	DPOGS209971-TA	3696 bp
Protein	DPOGS209971-PA	1231 aa
Genomic position	DPSCF300148 + 95105-112180
RNAseq coverage	400x (Rank: top 30%)

Annotation
*Heliconius*	HMEL013559	4e-165	66.67%
*Bombyx*	BGIBMGA011331-TA	0.0	83.22%
*Drosophila*	Liprin-alpha-PA	0.0	55.26%
EBI UniRef50	UniRef50_Q7PKP8	0.0	58.15%	AGAP001469-PA n=9 Tax=Coelomata RepID=Q7PKP8_ANOGA
NCBI RefSeq	XP_002432747.1	0.0	57.83%	Liprin-alpha, putative [Pediculus humanus corporis]
NCBI nr blastp	gi\|332028436	0.0	58.54%	Liprin-alpha-2 [Acromyrmex echinatior]
NCBI nr blastx	gi\|242024665	0.0	58.00%	Liprin-alpha, putative [Pediculus humanus corporis]

Group
Gene Ontology	GO:0005515	1.5e-11	protein binding
KEGG pathway
InterPro domain	[967-1047] IPR010993	1.5e-11	Sterile alpha motif homology
	[1144-1213] IPR011510	1.7e-10	Sterile alpha motif, type 2
	[970-1039] IPR001660	8.9e-10	Sterile alpha motif domain
	[1060-1121] IPR021129	1.5e-09	Sterile alpha motif, type 1
	[1066-1121] IPR013761	1.6e-06	Sterile alpha motif-type
Orthology group	MCL10462		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS209971-TA
ATGGTGTTTGTGCAAATCGCCTGGTGCTGTAATTCTCATATCGCCATTAAATCGTTCGAGGAGCATGGTGATAAGGACGATAAAGTAGTATGGTGTGAGGGTGAGAGGGTGAGTGTGGGTGTGGAGGAGGGATGTTCGGAAGGCATGCAGCGCGGCGGGGGCGGCGCCTGCGCATTGCTGGGGGCGAAATGCACGCGCAGGAACGGGGAGCTCTGCACGTGCACCGTGCACACAACCCTACTGCAGGAATTCGCGACCCTCACGAAGGAGCTCAACCAGGCCCGGGAACAGCTCCTGGAACGGGAGGAGGAAATTTCGGAACTCAAGGCGGAAAGAAACAATACCAGATTGTTACTGGAGCACTTAGAATGTCTGGTGTCGCGGCACGAGCGCTCTTTGCGCATGACGGTGGTGAAGCGGCAGGCCGCCGCCCAGTCTGGGGTCTCCTCGGAAGTGGAGGTCCTGAAGGCCCTCAAGAGTCTCTTCGAACACCACAAGGCCTTAGACGAGAAGGTTCGAGAAAGATTAAGAGTGGCGCTAGAGAGGAACACGGCTCTGGAAGAGGAGTTGGCTCTGACCAAAGAAGAGTTGCAGCAATATAAATCATCCGGTGCCCAGGAAGGCGACAAGCCCAAGGAGAATGGCACCACCGCCACCGGCTCGCCCGAACAGAACGGGGAACCCCCCAAGGAACAAAGTAGTGTTAACGGCGAAACGGACGTCAAGAAGCTCACTGAACTACAAAACACTATCGCCAAACAGTCGGCGGAACTGAGCTCGTGGCAGAGACGGGTCGCCGAGCTGAACAACAAGGTCACGGAACTGGAGGAGAGGTTGAGTAAGGGGGAGAAGGAGTTGGTCAAGAAGCAGGAGGAGTGCGCGAAGCTACAGAGGGACCTGAGGGAGAACGTGGCTCAGAAGGAGGATCAGGAGGAACGCATAGCCACATTGGAGAAACGATATCTTAACGCTCAGAGAGAGTCCACCTCCTTACACGACCTGAATGAGAAGCTGGAACAGGAGTTGCAGCATAAGCAGGCACAGCTTAAGCTCCAAGAAGAGAAGATAGCGGCCATAGAGGAGAAGCTGGAACTGTCCACGCAGAAGTTGGCGCAGATGTCCTCGCTGCCGGAGATGGAGGAACAGCTCAAGGCGAGGATGGAGGCCCTCAGCCAGGCGCAGGAGAGGCACGGCTCGGCCGAGGACCGCATCCAGAGGCTGGAGGCGAGTGTGGAGGAGAAGAACGCCGAGCTCATGAGACTCAACCAGCGGCTGCGGATGAACGAGGAACACAACACCAGGCTCTCCGCCACCGTGGACAAGCTGCTGTCCGAGTCTAACGATAGGTTGCAGGTCCACCTGAAAGAGCGGATGCACGCTCTGGACGAGAAGAATGCCCTCACCCAGGAGTTGGAGAAAACGAGAAAGTACGCTGATGAACTGTTACAAGAAAAGGCGGACATACTCAAGGAGCTGGCCAAGTGGAGGATGGAGACGGAACAGTTGAAGCGCCAGATGTTGCAGGCGGAGATAGCGTTCAACATCCAGCAGACGGATGCCCTGACGAGGTCGCTGTCACCAGCTGCCGCTCAGCCGCCCACCAACATATATGGAGCCAAGCTGGACGGGTCCTGGGAGAAGCTGCAACAGGCGCACGTGCTGGGTCCACCCTTCGACACCAGTGACGCCGAGAACGAGGAGTCTGAAGGTGCAGAAGGGCACACGGATGCGGCGGCGCTGGCGCTGATGCTGCAGGAACAGCTGGACGCCATCAACACGGAGATCAGACTCATACAGGAGGAGAAGCAGAGCACTGAGGCGCGAGCCGAGGAGCTGGAGTCCAGGGTGAGCTACGACCTAGACACGGATACAATCCAAACATTCATTGACAACAGCGAGGGTGGCGGTCTGTCTAAACTGTTGCAGCAGTGCACGGTCGCTATGCCAGGACCACTAGTCGGCAGTTACGAGCACATGAACGTAGTGTCTCGGCGGGCGGAGTCCCCGCCGCCGGCAGCCTCGCCCTCCAGACCGAACCATCACAAGTACCACACTGCGCCGGCGTCCATGTCTCCGGCTCACGCTCACTTCCGGCCGCCGGCCTCCGAGAGCCTGCCCTCCAGCCAGGTCGGTCCACCCCCCACCCACGCCCCACCAATCCACTCACATATCAACTCACCCTGTACTAAGCGTTCACCCCTTGTATACAAATCGCTAGTCGCTCGGAGCAGTCGTAACAGCTTTCATAGTATAGGGCATTTGCGATTCGCTTTCTCTTGTCCATATTTACCAGATCGCTGGGGAGGTTTGCAGCCCCTTGTTCTCCTCGCTCCAAGCTTGACTGTGTCTGATCCCGGTGCTAGGAGTAGTTCCAACCTTCCCCCCCACCCCGCTTCCAGTATCGCCTTACGTCCGAGCACACACGACTGTGATGTATATAGGGTGTTCCCCCAGTTGCAGCTGTGCGGGGAGGGAGACGAGCGTGCTGGGCGTCTGGAGCGGGCCATGCATCCCGACAGGGAGAGACTCCGCCCTCCACACCACTACGACTCCTCGAGCCAAGAGTCTCTGGGTGCGGGCGCGTGGGGAGGATCTCCACTCCCGCGAGGAGTGGCTTCAGCATCAGCCGTCTCTATAGCATCGATGCACCAACAGAAGAAGAGAGGAATCAAAAGCTCGTTGGGACGGTTCTTCAGTAAGAAGGAGAAAGCTGGCATGCCGATGCAGCAGGGTCAGAGTCCTCGGTCGTTGTCGTCCGCCTCCTCTCTAGGTCTGTCCTCGTTGGCTGATGAAGGTGAACCCTCGCATCCTCCCACACACCAGCACCCGGACTACGCTCGCACTAAAACTAAAGAGCGCGACTATCGCCATGAACTCCTGGGCGAGGCGATGAGAGCGGGGACGCCCTTCGCGCTCTGGAACGGTCCCACGGTAGTGGCTTGGCTGGAGCTCTGGGTGGGGATGCCGGCCTGGTACGTTGCGGCCTGCAGGGCCAACGTCAAGTCGGGCGCCATCATGTCCGCGCTGTCCGACCAGGAGATACAGCGGGAGATAGGCATCAGCAACCCTCTCCACCGGCTGAAGCTGCGCCTGGCCATACAGGAGATGGTATCATTGACCTCACCATCAGCCCCGCGAGGTACCGCTTGTGCCGCGCTGGCGTTCGGGGACATGAACCACGAGTGGATCGGCAACTCGTGGCTGCCGTCGCTCGGCCTGCCGCAGTACAGGACCACCTTCATGGAGTGCCTGGTGGACGCACGAATGCTGGAACACCTCACCAAGAGAGACCTGCGGACGCAGCTCAAGATGGTTGACAGTTTCCACAGAACTTCGCTTCACTTCGGCGTGGCATGTCTGAAGAGGGTCGGCTACTCCGTGAGGGCGCTGGAGGAACGTCGTCGGGCAGCGGAAATAGGGCTCCGGGACGTGCTCGTGTGGACCAACGAACGTCTCCAAAGGTGGCTGCTCTCCATCAACCTGAAGGAATACGCCAACAATCTGTCGGAGTCTGGAGTGCACGGAGCGTTGATAGCGCTCGACGACAACTTCGACGCGAACAGTATGGCGCTCGCGCTACAGATACCGACCCAGAACACGCAGGCGCGCCAGATCCTCGAAATGGAGTTCAACAACCTGCTGAGTACAGGCACGGAGCGTACGCGCGCACCTCACGACCACGCGCCGGCCTCCTGA

Protein sequence:

>DPOGS209971-PA
MVFVQIAWCCNSHIAIKSFEEHGDKDDKVVWCEGERVSVGVEEGCSEGMQRGGGGACALLGAKCTRRNGELCTCTVHTTLLQEFATLTKELNQAREQLLEREEEISELKAERNNTRLLLEHLECLVSRHERSLRMTVVKRQAAAQSGVSSEVEVLKALKSLFEHHKALDEKVRERLRVALERNTALEEELALTKEELQQYKSSGAQEGDKPKENGTTATGSPEQNGEPPKEQSSVNGETDVKKLTELQNTIAKQSAELSSWQRRVAELNNKVTELEERLSKGEKELVKKQEECAKLQRDLRENVAQKEDQEERIATLEKRYLNAQRESTSLHDLNEKLEQELQHKQAQLKLQEEKIAAIEEKLELSTQKLAQMSSLPEMEEQLKARMEALSQAQERHGSAEDRIQRLEASVEEKNAELMRLNQRLRMNEEHNTRLSATVDKLLSESNDRLQVHLKERMHALDEKNALTQELEKTRKYADELLQEKADILKELAKWRMETEQLKRQMLQAEIAFNIQQTDALTRSLSPAAAQPPTNIYGAKLDGSWEKLQQAHVLGPPFDTSDAENEESEGAEGHTDAAALALMLQEQLDAINTEIRLIQEEKQSTEARAEELESRVSYDLDTDTIQTFIDNSEGGGLSKLLQQCTVAMPGPLVGSYEHMNVVSRRAESPPPAASPSRPNHHKYHTAPASMSPAHAHFRPPASESLPSSQVGPPPTHAPPIHSHINSPCTKRSPLVYKSLVARSSRNSFHSIGHLRFAFSCPYLPDRWGGLQPLVLLAPSLTVSDPGARSSSNLPPHPASSIALRPSTHDCDVYRVFPQLQLCGEGDERAGRLERAMHPDRERLRPPHHYDSSSQESLGAGAWGGSPLPRGVASASAVSIASMHQQKKRGIKSSLGRFFSKKEKAGMPMQQGQSPRSLSSASSLGLSSLADEGEPSHPPTHQHPDYARTKTKERDYRHELLGEAMRAGTPFALWNGPTVVAWLELWVGMPAWYVAACRANVKSGAIMSALSDQEIQREIGISNPLHRLKLRLAIQEMVSLTSPSAPRGTACAALAFGDMNHEWIGNSWLPSLGLPQYRTTFMECLVDARMLEHLTKRDLRTQLKMVDSFHRTSLHFGVACLKRVGYSVRALEERRRAAEIGLRDVLVWTNERLQRWLLSINLKEYANNLSESGVHGALIALDDNFDANSMALALQIPTQNTQARQILEMEFNNLLSTGTERTRAPHDHAPAS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: