MonarchBase - Protein-coding gene

DPOGS208812
Transcript	DPOGS208812-TA	1536 bp
Protein	DPOGS208812-PA	511 aa
Genomic position	DPSCF300036 - 72262-86652
RNAseq coverage	71x (Rank: top 66%)

Annotation
*Heliconius*	HMEL015084	1e-90	77.94%
*Bombyx*	BGIBMGA007666-TA	2e-101	84.85%
*Drosophila*	krz-PB	2e-65	37.34%
EBI UniRef50	UniRef50_E0VU89	2e-134	57.41%	Putative uncharacterized protein n=3 Tax=Neoptera RepID=E0VU89_PEDHC
NCBI RefSeq	XP_623442.1	2e-140	56.08%	PREDICTED: similar to kurtz CG1487-PA [Apis mellifera]
NCBI nr blastp	gi\|328777200	2e-140	56.05%	PREDICTED: phosrestin-1-like [Apis mellifera]
NCBI nr blastx	gi\|328777200	6e-136	55.79%	PREDICTED: phosrestin-1-like [Apis mellifera]

Group
Gene Ontology	GO:0007165	1.2e-139	signal transduction
KEGG pathway
InterPro domain	[1-400] IPR000698	1.2e-139	Arrestin
	[11-177] IPR014753	3.3e-61	Arrestin, N-terminal
	[235-428] IPR014752	9.6e-60	Arrestin, C-terminal
	[9-180] IPR014756	1.2e-59	Immunoglobulin E-set
	[246-401] IPR011022	1.1e-32	Arrestin-like, C-terminal
	[23-177] IPR011021	1.6e-16	Arrestin-like, N-terminal
Orthology group	MCL17269		Insect specific

Nucleotide sequence:

>DPOGS208812-TA
ATGACGTCAGACACCGCGCTCAACTCCCAGCGAGTTTTTAAGAAGGCATCACCGAATAATAAACTAACTTTGTATTTAACCTCGCGGGATCTGGTGGTGGAGAATGGCAGCATCGATAAAATACAGGGAGTGATCCATGTGGACACTGACAGCTTGGAAAACAAAAAGCTATTTGGACAAGTGACGTTAACTTTCAGGTACGGGCGCGAGGATGAAGAGGTTATGGGGCTCAAGTTCTGCAATGAAGCTATTATGAGTCTGGCACAGATATGGCCTATACATTGCAATTTGGATAGGGAACCAAATACACCATTGCAGGAAGCTCTAATAAGGAGACTAGGAGCGAATGCTTTTCCATTCCACTTGGAGTTGACTCCGCTCGCACCCCCCAGCGTACAACTGGTCCCCGCCAAACAATACCACGGGGCTCCAATAGGGACCTCGTATGACGTGCGAGCCTTTATTGCTGAACGAGCTGATGAAAAGGTATCACGTCGGAATACAGTACGTATGGGGATCCGGGTCCTGCAAGGTCCAGGGAAGATGTCCGTTCCTCCAACACTACCGCCGGATTCTCCACATCATACCTTCGGCAACCTCACACATCACAATGTTTTGCGACTAAAAAACAAAACTAAATTAGAAGCAGATGAGAACAGCAGGAGAAAACGAGATCAAATTGAAACCGTAGAGCCCACTCCACCCCGAACCACTGTGGAGAAACCATTTCTTTTATCAGACGGCAGAGTGGAACTTGAAGCGTGGCTGGATAAGGCGACGTACTCTCACGGCGAGTCGATACGTGTCAATATTCTTGTCACCAATAATTCATCTAAGACCGTCCGAAGAATAAAGGCGCTAGTTGTCCAACATGTCGACGTGTGTATGTTTTCGAACGGCAAGTTCAAGAACGTTGTAGCATTGGTTAAGGGAACCGGCACTCCCGTACTTCCGGGACAGACGCTCACTGATGCTTTTACACTTACACCGCATAAAGGTGCTACCAAGAATTGGATAGCGCTAGAAGATTCGTATTCAAAATCGGGAGCAAGCCTCGCATCAACAGTATTGTGTAATTCCGACTCACCCGAAGATCGTAACGTATTTGCAATTTACGTTTCGTATTACGTAAAAGTTAAACTCACGCTTAGCACCATGGGGGGTGAAGTTTCTGCCAAACTACCATTTACATTGACGCACTCGTGCATAAACGAAGCGCCAACTGACAGCGTTACAGAAGAAGCCACACATAAAATGATTCTAGAAGGTAAAGAAAACAGCGAAGACGAGGATAGCAAAGCTGAAGCAGAAAATGATAAGCAGAACAACAATGGAAATAAAGTAGAAGGAACCCGGAATGAAACAGAGGAAGCTCTCAAACAAGAGAACAGATGTGTTGCGGACGTTCTTGTGAATATTGAAAACAAGGTAAGTGATAGGCCGAAGAAGTTTGAGGGACAGACGGAAGTAAGGAATATTAAGCCCAACGAAGAGGAATTGGATCTGATTGTAAAATATCCCGGTTCTGATACGTGA

Protein sequence:

>DPOGS208812-PA
MTSDTALNSQRVFKKASPNNKLTLYLTSRDLVVENGSIDKIQGVIHVDTDSLENKKLFGQVTLTFRYGREDEEVMGLKFCNEAIMSLAQIWPIHCNLDREPNTPLQEALIRRLGANAFPFHLELTPLAPPSVQLVPAKQYHGAPIGTSYDVRAFIAERADEKVSRRNTVRMGIRVLQGPGKMSVPPTLPPDSPHHTFGNLTHHNVLRLKNKTKLEADENSRRKRDQIETVEPTPPRTTVEKPFLLSDGRVELEAWLDKATYSHGESIRVNILVTNNSSKTVRRIKALVVQHVDVCMFSNGKFKNVVALVKGTGTPVLPGQTLTDAFTLTPHKGATKNWIALEDSYSKSGASLASTVLCNSDSPEDRNVFAIYVSYYVKVKLTLSTMGGEVSAKLPFTLTHSCINEAPTDSVTEEATHKMILEGKENSEDEDSKAEAENDKQNNNGNKVEGTRNETEEALKQENRCVADVLVNIENKVSDRPKKFEGQTEVRNIKPNEEELDLIVKYPGSDT-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: