MonarchBase - Protein-coding gene

DPOGS203808
Transcript	DPOGS203808-TA	1254 bp
Protein	DPOGS203808-PA	417 aa
Genomic position	DPSCF300010 + 1967696-1969821
RNAseq coverage	175x (Rank: top 50%)

Annotation
*Heliconius*	HMEL013311	0.0	84.67%
*Bombyx*	BGIBMGA003714-TA	8e-172	76.54%
*Drosophila*	a-PB	9e-27	57.47%
EBI UniRef50	UniRef50_UPI00015B435A	2e-35	34.30%	UPI00015B435A related cluster n=1 Tax=unknown RepID=UPI00015B435A
NCBI RefSeq	XP_001608193.1	4e-36	34.30%	PREDICTED: hypothetical protein [Nasonia vitripennis]
NCBI nr blastp	gi\|156537990	7e-35	34.30%	PREDICTED: hypothetical protein LOC100124270 [Nasonia vitripennis]
NCBI nr blastx	gi\|156537990	3e-33	34.30%	PREDICTED: hypothetical protein LOC100124270 [Nasonia vitripennis]

Group
Gene Ontology	GO:0005515	2.4e-28	protein binding
KEGG pathway	dre:368723	1e-15
	K06092 (INADL, PATJ)	maps->	Tight junction
InterPro domain	[295-413] IPR001478	2.4e-28	PDZ/DHR/GLGF
Orthology group	MCL24936		Lepidoptera specific

Nucleotide sequence:

>DPOGS203808-TA
ATGGGTGCCCCAGCATGGGGGTCGCGTGGTGGCGATCGTCCCCGCCTGCTTCGGATGACGCCACTGCGACATAGCTTTGCCGCGCCAGCCACGCCGCCGGCGCAGCAACAACGGACACATGACTACGCATCTGATGCTGATAGTAACAAAAAAGAAGAAAGCTGGAATGCCAACTTGTCGCAGAGATGGAGAAAGTTACGACGTAGGTGTTCCCGACTACGGCCTGGATCTGGCAATCGTGAAGCAAGTCCCGTACGATGTTCTCCATCACCACCGCGACCTCAACCACAATGTTCACCTCCACCCCCATCAAAACTCTCATTTAGACATCGTGGTAAAGTTTACACAACCGCTTCTTTACGTGTCACCAGCGGAGCACCGGACTTGCTCAGAGCGCTGGGGAAATTAGGAGGAGGATTAAGAAGACGTGCTCTTTCCGCCCATGACGTGCTTACACCACCTCAACCGCAACAACCAGCAACTTTTTATGTTCCTAGTCCAAGTACAACTCGGTCTCCCTCGTCACCAATGTCACACAGAGAGGCTACAGTTCGCAGACGATGTAGCTCCCCTAATGTGTATAGACCTAAAGATGTACCTAGAGATCGAGCACCACTTATATCTCAAGAAGATGAAAGTCGAGACGTTGTTGATTACAACTACACGCCTGAAAGAAGGAAACCGCACAAAGAGATAAGAAGTCGACCATATAGCGAAAACGTAGAAATAGATCCTAAATTCAAAAATGGCTATAATCGTCTCACCCCAGAACCTACTGAGAGACTATGGGAAGAGCCTTATCGACTACCCCGTGTACAGGTTCGTCAAGAACCTATTCAACAATTAAGAAATTGTGTAGCTGAGTTAAGAGTTAGCACTACTCCACGGGCTCCACGCCCTCCTCCGGCTCCTACATCCCCGCAGAAAATAATTAAACGACCGCCAGCTCCTGAACCCCGAGATTCAAATACCTTTGAGGTGCGTTTCACCAAATCAGCTGGAGGTAAAGGACTCGGGTTTAGCATCGTAGGCGGACGTGATTCACCTCGTGGGGACATGGGCATATTTGTAAAAACTATATTTAATAACGGCCAAGCCGCTGAGTCTGGACTACTTCGAGAAGGGGACGAGGTTCTTTCAGTTAACGGTCGTGGTACGGCTGGTTTAACTCACAGCGAAGCTATAAGGCTGTTTAAGGACGTGCGTGCGGGACCGGTGTTGCTAAAAGTAACAAGACGTGCTCCAACTCGCTGA

Protein sequence:

>DPOGS203808-PA
MGAPAWGSRGGDRPRLLRMTPLRHSFAAPATPPAQQQRTHDYASDADSNKKEESWNANLSQRWRKLRRRCSRLRPGSGNREASPVRCSPSPPRPQPQCSPPPPSKLSFRHRGKVYTTASLRVTSGAPDLLRALGKLGGGLRRRALSAHDVLTPPQPQQPATFYVPSPSTTRSPSSPMSHREATVRRRCSSPNVYRPKDVPRDRAPLISQEDESRDVVDYNYTPERRKPHKEIRSRPYSENVEIDPKFKNGYNRLTPEPTERLWEEPYRLPRVQVRQEPIQQLRNCVAELRVSTTPRAPRPPPAPTSPQKIIKRPPAPEPRDSNTFEVRFTKSAGGKGLGFSIVGGRDSPRGDMGIFVKTIFNNGQAAESGLLREGDEVLSVNGRGTAGLTHSEAIRLFKDVRAGPVLLKVTRRAPTR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: