MonarchBase - Protein-coding gene

DPOGS215730
Transcript	DPOGS215730-TA	1569 bp
Protein	DPOGS215730-PA	522 aa
Genomic position	DPSCF300041 + 448617-459505
RNAseq coverage	490x (Rank: top 25%)

Annotation
*Heliconius*	HMEL009658	4e-170	77.02%
*Bombyx*	BGIBMGA003601-TA	0.0	90.29%
*Drosophila*	krz-PB	6e-177	69.48%
EBI UniRef50	UniRef50_Q16ID9	2e-160	64.48%	Beta-arrestin 1, putative n=2 Tax=Culicinae RepID=Q16ID9_AEDAE
NCBI RefSeq	XP_972556.2	0.0	80.31%	PREDICTED: similar to beta-arrestin 1 [Tribolium castaneum]
NCBI nr blastp	gi\|189233648	0.0	80.31%	PREDICTED: similar to beta-arrestin 1 [Tribolium castaneum]
NCBI nr blastx	gi\|189233648	0.0	80.31%	PREDICTED: similar to beta-arrestin 1 [Tribolium castaneum]

Group
Gene Ontology	GO:0007165	1.9e-267	signal transduction
KEGG pathway	tca:661293	0.0
	K04439 (ARRB)	maps->	Phototransduction
			Chemokine signaling pathway
			Endocytosis
			MAPK signaling pathway
InterPro domain	[94-519] IPR000698	1.9e-267	Arrestin
	[94-264] IPR014753	3.1e-85	Arrestin, N-terminal
	[93-263] IPR014756	2.2e-79	Immunoglobulin E-set
	[500-520] IPR014752	6.5e-47	Arrestin, C-terminal
	[106-261] IPR011021	1.3e-32	Arrestin-like, N-terminal
	[282-463] IPR011022	1.1e-26	Arrestin-like, C-terminal
Orthology group	MCL10905		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS215730-TA
ATGACGTCCGACACACATCACATTAGTACGTTCAGTGATGAAGTCCAGGCAGCGTCGATGAGAGGCCTTCGCGTTACAGGCCGGTGTTCCAATATCCTCGTTCCTCGATTCACAGTAACCATTACAAATTCTGATGTCTATGCGTCACGCAGCAAGCTGTCAGACCGCATGTTGTTTTCATGTCCATCTCACGATACACGTATTTATTACTCAGTTGAGTGGTGCGGGGGGCGAGGCGGAACTATGGACGACGGAGGCAGCAACAAGCAGCGTCAGGCCACCAGGGTCTTCAAAAAGAGCTCACCAAATGGAAAGATCACAGTGTATTTAGGGAAGAGAGACTTCGTCGATCACATCACACACGTAGATCCTATTGATGGCGTGGTGCTGATAGATCCGGAGTACGTGAAGGATCGGAAGGTGTTCGGCCATGTCTTGGCGGCTTTCCGCTACGGCAGAGAGGACCTGGACGTGCTGGGGCTCACCTTCAGGAAGGACCTGTACCTCGCCGCGGAACAGATATATCCGCCCACGAGCAGCCCGAAGCGTCCCCTGACCCGTCTTCAGGAGCGTCTGGTCCGCAAGCTGGGTCCCGCGGCACATCCGTTCTACTTCGAGCTGCCGCCTCACTGTCCCGCCTCGGTCACGCTCCAGCCGGCGCCCGGTGACACCGGCAAGCCATGCGGCGTGGACTACGAGCTGAAGGCCTTCGTGGCGGACTCCCAGGACGACAAGCCTCACAAAAGAAATTCAGTCCGCCTCGCCATCCGCAAGATAATGTACGCGCCGAGCAAGCAGGGCGAGCAGCCGTCTGTGGAGGTGTCCAAGGAGTTCATGATGAGCCCCAACAAACTGTACCTGGAAGCGTCGCTGGATAAGGAGCTGTATCATCACGGTGAGAACATAGCGGTGAACGTCCACATAGCGAACAACTCCAACCGCTCAGTGAAGAGGATCAAGGTCTCCGTCAGACAGTTCGCTGACATCTGTCTCTTCTCCACGGCTCAGTACAAATGCACCGTCGCTGAGGCGGAGAGCGAGGCAGTGGCTGTGTGGAAGAGAAACAAATTTCCATTTTTCGGATCATACAATAAGAAATTTAAAAAGTCGGTAGAAGGCTGTCCCGTGGGTCCAGGCTTCACCCTCAGCAAGGTGTTCACGCTGACTCCACTGCTCGCTAACAATAAGGACAAATGGGGCCTCGCTTTGGACGGACAACTCAAGCATGAGGACACCAACCTGGCGTCCAGCACACTAATCGCGGATCCTTCGCAGCGTGAAAATTTAGGCATCATAGTACAGTACAAAGTAAAGGTCAAACTGTGCCTCGGTCCACTCGGCGGCGAGCTGAGTGCGGAGCTGCCGTTCATCCTGATGCATCCCAAGCCGGAGGAGGAGCCTCGCGCCGCGCCCGACCCGCCGCGCGCCGACCCTGACCTCATACAACTAGACCCCAACCCTGACGAACACGCAGCTCACAGAGACGAGAACGGCCAGGAGCAAGACGACGATATAATATTCGAAGACTTCGCTCGACTGCGGCTGAAGGGAGCGGACGCGGACGCCTGA

Protein sequence:

>DPOGS215730-PA
MTSDTHHISTFSDEVQAASMRGLRVTGRCSNILVPRFTVTITNSDVYASRSKLSDRMLFSCPSHDTRIYYSVEWCGGRGGTMDDGGSNKQRQATRVFKKSSPNGKITVYLGKRDFVDHITHVDPIDGVVLIDPEYVKDRKVFGHVLAAFRYGREDLDVLGLTFRKDLYLAAEQIYPPTSSPKRPLTRLQERLVRKLGPAAHPFYFELPPHCPASVTLQPAPGDTGKPCGVDYELKAFVADSQDDKPHKRNSVRLAIRKIMYAPSKQGEQPSVEVSKEFMMSPNKLYLEASLDKELYHHGENIAVNVHIANNSNRSVKRIKVSVRQFADICLFSTAQYKCTVAEAESEAVAVWKRNKFPFFGSYNKKFKKSVEGCPVGPGFTLSKVFTLTPLLANNKDKWGLALDGQLKHEDTNLASSTLIADPSQRENLGIIVQYKVKVKLCLGPLGGELSAELPFILMHPKPEEEPRAAPDPPRADPDLIQLDPNPDEHAAHRDENGQEQDDDIIFEDFARLRLKGADADA-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: