MonarchBase - Protein-coding gene

DPOGS214891
Transcript	DPOGS214891-TA	3150 bp
Protein	DPOGS214891-PA	1049 aa
Genomic position	DPSCF300487 + 27669-38409
RNAseq coverage	57x (Rank: top 69%)

Annotation
*Heliconius*	HMEL010142	0.0	85.08%
*Bombyx*	BGIBMGA010946-TA	0.0	88.27%
*Drosophila*	Grip-PA	3e-88	37.84%
EBI UniRef50	UniRef50_D6X3C7	1e-137	41.03%	Putative uncharacterized protein n=1 Tax=Tribolium castaneum RepID=D6X3C7_TRICA
NCBI RefSeq	XP_973894.1	2e-138	41.03%	PREDICTED: similar to glutamate receptor interacting protein 1 [Tribolium castaneum]
NCBI nr blastp	gi\|91090646	5e-137	41.03%	PREDICTED: similar to glutamate receptor interacting protein 1 [Tribolium castaneum]
NCBI nr blastx	gi\|91090646	1e-137	40.97%	PREDICTED: similar to glutamate receptor interacting protein 1 [Tribolium castaneum]

Group
Gene Ontology	GO:0005515	4.9e-24	protein binding
KEGG pathway	cin:100186631	4e-20
	K06095 (MPDZ, MUPP1)	maps->	Tight junction
InterPro domain	[443-574] IPR001478	4.9e-24	PDZ/DHR/GLGF
Orthology group	MCL11494		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS214891-TA
ATGCATGTCAGATACCGTTTGTTGTGTAAATCAGAATGGCACTCTATCTTCCCATTGTGTCGTTCCGAGCCGGGCGTAGTTCCATCAATAGTTGGGTTCACGAAAGACTCGGTAGCAAATGATTCGGATCGATTAGCTCCAGGTGATAGAATATGTAGTGTTAATGGTATTTCAACAGCAAGATTAACTAATGATGAAGTACTGAGGTTGTTAGATAATGTGGAAGAAAGGGCATCGTTGGAAGTAGAATACTATATGCCAAACTATGCTTCACAGAGTTCTCTTTATATTACAACCAAGCTAGCAGAGGTGCCGGTTGAAAAAATAAATGGCTCTCTGGGAGTAACAATACGAGGTGGTTTACCCGAAAACTCATCGTCTAGTGCTGATTTAGTTTTAAACAGCAGGTCTCTAGATGCATTACCTTTAGTCGTCACTCATATTAGGCCAGGTGGTGCTGCCTATAATACGTCTAGGATAAAACCTGGCGATAGGCTTTTAAAAGTCGACCATATCTCTTTAACGAATAAAACACTGTCAGAAGTTCATCATATACTCCAAAGTTGTCCTCAAGTGACGAGTCTTACAATTGAATACGATGTGTCAATAATGGAATCGGTTAAATTAGCAACCGGACCTCTACTAATTGAAATCGAGAGACCGTGTAATGAGGATTTAGGGTTATTTTTAAGCAATCAAAGATACTCTGACGATGTTTATAGTTCTGGATCTGATACTTATCAGAGAGTTGGAACTAGCAATGCTATTTACATAGACAGTATCCTTCCAGCTAGTATCAGTGATCGATGTGGTGCATTACATCCTGGAGATCAGCTCCTCGCATTTGATGACCACGTTATAGATGGTAACAACTACACAGCAGAGGAGGTTATGTGCTATCTTGAAAACTGCGAGGCTGGTTTTACAAGATTACATATTGCCCCACGACACATACTGAGCCACGGCGGAAGATTTACTAGAGATAATTCAATGTCGGGTTCATCAACTTTAAATCCTAAAAAGCATCGGCAATGGAATTATCGACAGAGCTCAATGCCTAAATTAGGTCCACAAGAAGATTACGATGGTCAGCAGAATTACATGAGTTTGGGCATGTGTCGTAGTGAATCGTTGAATATACAACTGGAAGTGCCTCCAGGACAAACCAGCGGTTTGGCAGTTCATGATGAAAACGCTATCTTAATTATATCACACGTTGCCACACAGTCACCGGCGTATCGAACCGGCTGCTTACAAGTTAGAGACAGAGTAATGTCTATTAATGGTCACGAGAATCTCACTTGTGATGTAGCCAATGAGATATTACAGAGGAGAAACGACTCTCACAATCCTAAATACCTCACCCTTAATATTGAATTCAGTATGCCTAATGCTATTGAAGCTTCAAGTGGAGTGTTTAACGTTAAGCTCGCCAAAACGTCAGCAGGTCTCGGCGTCACAATAACAGGCTGCAAACAGAAGTTGCTTACTAATGAAGAACCCATGGTAATATCAGATATCAAGCCAGGATCTGTTGCTCACCGAAGCGGCGCTTTGACACCAGGGGACCAACTTCTCGCCATAAACGGACAGCCTTTACATAATCTGTCCCTGGACACAGCCTTCAACATACTTCAGAATTCACCAGAAGACATAATAACTTTGAAAATACGAAAGCGTGATCTAACGGAAGACTGGTCCAATATTCACAAACATAACGCAAAATTGACATTACAGAGCTTCAGTAACATTGAAACAAAGGCTGTCGTTCATAGCGGGGAAGATTCAGGTCACCATACGGGTAGTCCCAACAATAGTGCCAAAGATAGTGAAAGAAGTCACGGCAGTGATAATGGAACTGTAGTTTTTATGGTTGAGTTGATAAGACAAGAAAACGGTCCCCTAGGACTTACGATAGCGGGAAGTGAAGACGTCACACAGGCCATCTTATTAAGTGGTTTGGTTGAAGGTGGACTAGCTGAAAAATGTGGGAAATTGTCAGTCGGGGACGAATTACTGAGTATTAATGGAGAAAGCGTGTTGAATAAACCATTATCGGAGGCCATTAAACTCTTACAACAGAGCGGGAAACGCGTTCAATTACAAATGTGTAGAAAAATAACTGGTTCCCTTGACTGTGCTGAATCTAGTGTACGCGATTCCAGTCATTCCACATCCAGTCCAGGGCTCTCAAACGACAGCGCTGTTGAATCCTGGGATCAAAACACGCCAGTTAGAGTTAGTGCTAATTGCGGTAATTCCGAAGTAATAGAATATGCGGTTCCCGACAAGAGCCGAATAATAGATAAGCAGCCCTACTCACCGACAGATGAGGATAAACTTTTAGCTTGTAGTTTCAATTCAACAACTCCGTACACGGTGCACGATTTGCCTCTCCCGAATTATTCACTCAATAATTCTCTGAAGACCTTCCACTACGAAAATACATGTATCATTCCAGAGAACACTTTGAAAAATAAACAGAATATAACAAGAGAAGATGATGTTCAACAAATTGAAATTCTGACAAGCAACATGAAAGACTGTCAGTTACATAATATGGAAAAAAGTTCGTGTAAATGTGATTATGTACAAATGGGACCTTATGGTATCGTGTCACCAAAAAATAGACGCCCAAATTGGGACAGCGATTACTTGAGTAATGGTATTTACACTGTCACAACTCCACAGAAGTCACCTTTAAAGCCAAATGTTCCCGGCCCCAGTTTTCAGTTTACAACAAGTCCTATTTATGAAAACGACGTACCCAGTATTTATGGTAGTGAAACTCTTTCACCAGCTCGAGGTTCTGTCCATCACGTAATTTTATATAAGGACGCAATTTATGATGACTATGGATTCTCTGTATCCGATGGGTTGTATGAAAGAGGAGTGTATATTAATCGTATAAGGAAGGGAGGGCCGGCTGATATAGTAGGGCTGTTGAGACCCTACGACAGAATTTTACAGGTGAACGGCACAAGAACTGTGGACTACGACTGCTGTCTTACAGTGCCTTTGATAGCAGCAGCCGGAGATAGGCTGGAAATTGTTGTCCAAAGGAATGTTACATCTAGAGATCTCAAAAACCAGAGACATGAAGACAGTTCAAGCCCTAGTGAAAGTAGTATCGTGACTAAGACCATATAG

Protein sequence:

>DPOGS214891-PA
MHVRYRLLCKSEWHSIFPLCRSEPGVVPSIVGFTKDSVANDSDRLAPGDRICSVNGISTARLTNDEVLRLLDNVEERASLEVEYYMPNYASQSSLYITTKLAEVPVEKINGSLGVTIRGGLPENSSSSADLVLNSRSLDALPLVVTHIRPGGAAYNTSRIKPGDRLLKVDHISLTNKTLSEVHHILQSCPQVTSLTIEYDVSIMESVKLATGPLLIEIERPCNEDLGLFLSNQRYSDDVYSSGSDTYQRVGTSNAIYIDSILPASISDRCGALHPGDQLLAFDDHVIDGNNYTAEEVMCYLENCEAGFTRLHIAPRHILSHGGRFTRDNSMSGSSTLNPKKHRQWNYRQSSMPKLGPQEDYDGQQNYMSLGMCRSESLNIQLEVPPGQTSGLAVHDENAILIISHVATQSPAYRTGCLQVRDRVMSINGHENLTCDVANEILQRRNDSHNPKYLTLNIEFSMPNAIEASSGVFNVKLAKTSAGLGVTITGCKQKLLTNEEPMVISDIKPGSVAHRSGALTPGDQLLAINGQPLHNLSLDTAFNILQNSPEDIITLKIRKRDLTEDWSNIHKHNAKLTLQSFSNIETKAVVHSGEDSGHHTGSPNNSAKDSERSHGSDNGTVVFMVELIRQENGPLGLTIAGSEDVTQAILLSGLVEGGLAEKCGKLSVGDELLSINGESVLNKPLSEAIKLLQQSGKRVQLQMCRKITGSLDCAESSVRDSSHSTSSPGLSNDSAVESWDQNTPVRVSANCGNSEVIEYAVPDKSRIIDKQPYSPTDEDKLLACSFNSTTPYTVHDLPLPNYSLNNSLKTFHYENTCIIPENTLKNKQNITREDDVQQIEILTSNMKDCQLHNMEKSSCKCDYVQMGPYGIVSPKNRRPNWDSDYLSNGIYTVTTPQKSPLKPNVPGPSFQFTTSPIYENDVPSIYGSETLSPARGSVHHVILYKDAIYDDYGFSVSDGLYERGVYINRIRKGGPADIVGLLRPYDRILQVNGTRTVDYDCCLTVPLIAAAGDRLEIVVQRNVTSRDLKNQRHEDSSSPSESSIVTKTI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: