MonarchBase - Protein-coding gene

DPOGS211041
Transcript	DPOGS211041-TA	1107 bp
Protein	DPOGS211041-PA	368 aa
Genomic position	DPSCF300202 - 251556-254885
RNAseq coverage	2359x (Rank: top 5%)

Annotation
*Heliconius*	HMEL004329	4e-145	74.46%
*Bombyx*	BGIBMGA003755-TA	1e-163	74.80%
*Drosophila*	Arr1-PA	2e-129	61.39%
EBI UniRef50	UniRef50_P15372	3e-127	61.39%	Phosrestin-2 n=26 Tax=Endopterygota RepID=ARRA_DROME
NCBI RefSeq	XP_001663732.1	4e-151	66.93%	phosrestin ii (arrestin a) (arrestin 1) [Aedes aegypti]
NCBI nr blastp	gi\|1703415	5e-173	79.27%	arrestin homolog [Heliothis virescens, antennae, Peptide, 381 aa]
NCBI nr blastx	gi\|1703415	4e-174	79.27%	arrestin homolog [Heliothis virescens, antennae, Peptide, 381 aa]

Group
Gene Ontology	GO:0007165	7.9e-204	signal transduction
KEGG pathway
InterPro domain	[1-368] IPR000698	7.9e-204	Arrestin
	[166-361] IPR014752	2.7e-69	Arrestin, C-terminal
	[4-161] IPR014756	6.9e-64	Immunoglobulin E-set
	[6-161] IPR014753	1.4e-62	Arrestin, N-terminal
	[180-336] IPR011022	1.1e-28	Arrestin-like, C-terminal
	[18-156] IPR011021	6.1e-24	Arrestin-like, N-terminal
Orthology group	MCL16437		Insect specific

Nucleotide sequence:

>DPOGS211041-TA
ATGGTGTATAATTTTAAAGTGTTCAAGAAATGTTCTCCCAACGGAAAGCTTACCTTGTATATGGCGAAGCGGGACTTCGTGGATCATATATCGTATGTAGAACCGATAGACGGCATCGTGGTCGTGGATGAGGAGTACGTTCGAGATCGTCGCGTGTTCGCTCAGGTGGTGTGCACCTTCAGGTACGGTCGCGAGGAGGACGAGGTGATGGGCTTGTCCTTCTATAAGGAACTGTATCTCGCCTCTGAACAAGTCTATCCACCGCTTCAGAAACGTCCTTACGAACTCACACGAACACAGGAGCGCTTAGTGAGGAAGCTGGGTCAGTGGGCGCTGCCATTCCGCTTAACCCTCCCGGCGGGTTCGCCTGGATCCGTAACGCTACAGCCAGGACTGGAGGAAGAAGGAGAACCCTGCGGAGTTCACTACTACGTAAAGTTGAGCACTGTGGCGCTCGGTATCCGCAAAGTTCAGTTTGCTCCGGATAAGCCCGGGCCACAGCCCTGCACCGTCGTCCGAAAGGACTTCGTGCTGTCCCCGGGGCAACTTGAATTGGAGCTTACTCTAGATAAACAGCTTTATATTCACGGGGAGACAGTTGCAGTGAACATAAGTATAAGGAACCACAGCAACAAAGTGGTGAAGAAGATTAAGGCGAGTATCCTGCAATCTGTAGATATCGTCCTGTTTCAGAATGGCCAGTATAGGAATGTTGTCACAGGAATTGAGACACAGGATGGTTGTCCACTGCAACCAGGAGCCAACATGCAGAAAGTAGTCCAGCTCCGTCCTACTCTGGGAGCTCTGCGTGACCGCCGTGGACTCGCGCTTGACGCTCAGCTCAAAAGACAGGAGACCACGCTCGCCTCCACCACGCTTCTGTTGGACCCCGAGCAGCGTGATGCGTTCGGGATCGTGGTCAGCTACAGCGTCAAGGTCAAACTGTACCTCGGAGCGCTCGGCGGAGAGCTCAGCGCCGAACTGCCCTTCATACTTATGCATCCGAAGGAAGGTCGTACTAAACTAATCCAGGCAGACAGCGAGGCAGATGTAGAAATGTTTAGACAGGACACAGTCATGCATCAGGAGAGTGTCGAGGTTTACTAA

Protein sequence:

>DPOGS211041-PA
MVYNFKVFKKCSPNGKLTLYMAKRDFVDHISYVEPIDGIVVVDEEYVRDRRVFAQVVCTFRYGREEDEVMGLSFYKELYLASEQVYPPLQKRPYELTRTQERLVRKLGQWALPFRLTLPAGSPGSVTLQPGLEEEGEPCGVHYYVKLSTVALGIRKVQFAPDKPGPQPCTVVRKDFVLSPGQLELELTLDKQLYIHGETVAVNISIRNHSNKVVKKIKASILQSVDIVLFQNGQYRNVVTGIETQDGCPLQPGANMQKVVQLRPTLGALRDRRGLALDAQLKRQETTLASTTLLLDPEQRDAFGIVVSYSVKVKLYLGALGGELSAELPFILMHPKEGRTKLIQADSEADVEMFRQDTVMHQESVEVY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: