MonarchBase - Protein-coding gene

DPOGS208694
Transcript	DPOGS208694-TA	1089 bp
Protein	DPOGS208694-PA	362 aa
Genomic position	DPSCF300043 - 455105-461476
RNAseq coverage	6x (Rank: top 87%)

Annotation
*Heliconius*	HMEL009658	1e-50	95.88%
*Bombyx*	BGIBMGA003601-TA	5e-94	89.94%
*Drosophila*	krz-PB	1e-78	77.27%
EBI UniRef50	UniRef50_Q16ID9	3e-79	79.89%	Beta-arrestin 1, putative n=2 Tax=Culicinae RepID=Q16ID9_AEDAE
NCBI RefSeq	XP_972556.2	4e-85	84.36%	PREDICTED: similar to beta-arrestin 1 [Tribolium castaneum]
NCBI nr blastp	gi\|189233648	7e-84	84.36%	PREDICTED: similar to beta-arrestin 1 [Tribolium castaneum]
NCBI nr blastx	gi\|189233648	1e-82	84.36%	PREDICTED: similar to beta-arrestin 1 [Tribolium castaneum]

Group
Gene Ontology	GO:0007165	3.1e-116	signal transduction
KEGG pathway	tca:661293	1e-84
	K04439 (ARRB)	maps->	Phototransduction
			Chemokine signaling pathway
			Endocytosis
			MAPK signaling pathway
InterPro domain	[13-166] IPR000698	3.1e-116	Arrestin
	[13-178] IPR014753	3e-76	Arrestin, N-terminal
	[12-182] IPR014756	6.5e-70	Immunoglobulin E-set
	[25-172] IPR011021	1.4e-28	Arrestin-like, N-terminal
Orthology group

Nucleotide sequence:

>DPOGS208694-TA
ATGGACGACGGAGGCAGCAACAAGCAGCGTCAGGCCACCAGGGTCTTCAAAAAGAGCTCACCAAATGGAAAGATCACAGTGTATTTAGGGAAGAGAGACTTCGTCGATCACATCACACACGTAGATCCTATTGATGGCGTGGTGCTGATAGATCCGGAGTACGTGAAGGATCGGAAGGTGTTCGGCCATGTCTTGGCGGCCTTCCGCTACGGCAGAGAGGACCTGGACGTGCTGGGGCTCACCTTCAGGAAGGACCTGTACCTCGCCGCGGAACAGATATATCCGCCCACGAGCAGCCCGAAGCGTCCCCTGACCCGTCTTCAGGAGCGTCTGGTCCGCAAACTGGGTCCCGCGGCACATCCATTCTACTTCGAGCTGCCGCCTCACTGTCCCGCCTCGGTCACGCTCCAGCCGGCGCCCGGTGACACCGGCAAGCCATGCGGCGTGGACTACGAGCTGAAGGCCTTCGTGGCGGACTCCCAGGACGACAAGCCTCACATTGATTCGGCTGCTTCGTTACTTTTGAGTCACGTCGTTTCGGTGGTGCGGGGGGCGAGGCGGAACTATGGACGACGGAGGCAGCAACAAGCAGCGTCAGGCCACCAGGGTCTTCAAAAAGAGCTCACCAAATGGAAAGATGGCGTGGTGCTGATAGATCCGGAGTACGTGAAGGATCGGAAGGTGTTCGGCCATGTCTTGGCGGCCTTCCGCTACGGCAGAGAGGACCTGGACGTGCTGGGGCTCACCTTCAGGAAGGACCTGTACCTCGCCGCGGAACAGATATATCCGCCCACGAGCAGCCCGAAGCGTCCCCTGACCCGTCTTCAGGAGCGTCTGGTCCGCAAACTGGGTCCCGCGGCACATCCATTCTACTTCGAGCTGCCGCCTCACTGTCCCGCCTCGGTCACGCTCCAGCCGGCGCCCGGTGACACCGGCAAGCCATGCGGAAAGACTTGTTCTATATTACATGTCTTAATGTCAACTTCTCTTGACCGACCTGCGCTCTACATAGTTAATGCTATTGAAGTGTCAACGGAGGCATCTCGAACAGATCTCATGTCACAGGAAGTGGTCGAGCACTCCACTTGA

Protein sequence:

>DPOGS208694-PA
MDDGGSNKQRQATRVFKKSSPNGKITVYLGKRDFVDHITHVDPIDGVVLIDPEYVKDRKVFGHVLAAFRYGREDLDVLGLTFRKDLYLAAEQIYPPTSSPKRPLTRLQERLVRKLGPAAHPFYFELPPHCPASVTLQPAPGDTGKPCGVDYELKAFVADSQDDKPHIDSAASLLLSHVVSVVRGARRNYGRRRQQQAASGHQGLQKELTKWKDGVVLIDPEYVKDRKVFGHVLAAFRYGREDLDVLGLTFRKDLYLAAEQIYPPTSSPKRPLTRLQERLVRKLGPAAHPFYFELPPHCPASVTLQPAPGDTGKPCGKTCSILHVLMSTSLDRPALYIVNAIEVSTEASRTDLMSQEVVEHST-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: