MonarchBase - Protein-coding gene

DPOGS213594
Transcript	DPOGS213594-TA	1698 bp
Protein	DPOGS213594-PA	565 aa
Genomic position	DPSCF300033 + 524991-536848
RNAseq coverage	3107x (Rank: top 4%)

Annotation
*Heliconius*	HMEL007905	0.0	70.68%
*Bombyx*	BGIBMGA011660-TA	0.0	65.83%
*Drosophila*	CG9619-PA	9e-78	57.14%
EBI UniRef50	UniRef50_Q29DH3	5e-78	42.95%	GA21917 n=3 Tax=Drosophila RepID=Q29DH3_DROPS
NCBI RefSeq	XP_002047502.1	8e-79	50.32%	GJ11905 [Drosophila virilis]
NCBI nr blastp	gi\|195377449	2e-77	50.32%	GJ11905 [Drosophila virilis]
NCBI nr blastx	gi\|194751660	3e-87	36.59%	GF10772 [Drosophila ananassae]

Group
Gene Ontology	GO:0005515	2.6e-30	protein binding
KEGG pathway	dvi:Dvir_GJ11905	2e-78
	K07189 (PPP1R3)	maps->	Insulin signaling pathway
InterPro domain	[432-537] IPR005036	2.6e-30	Putative phosphatase regulatory subunit
Orthology group	MCL16410		Insect specific

Nucleotide sequence:

>DPOGS213594-TA
ATGAATTCTCCAAATCTGACTATGTCATTGGAACATCAAATGCCGGTGCTTATGAAAAAGACGCAGATGAGTGGAGATTGCGCGGGGTCACAGTGCGGTTTGACGTCACTGCTGCCGATGTCCTGTCGCGGGAGAGCCGCAGCGTTCGCGCGCGACTTGCATTCAAGACTGCGTAATTTGGGAGCATCACATGACGGTGAATTGGAAAACAGCTGGCTGGCCAGGGACAGCGCACACAGGCCTACCAACTCGAACCACTCACGTGACATTGACACCTTCTACGACTTCGAGCTCGAGTGTGAAAGTCCGTCTAGTCCTGTTGATGAATACGTTCAGTTCCCGGACAAACACAACGAAGATAAGGATCCGCCTTTTTATGATGTAGACTCAGATCCAGAACATAAGGAGCAAACTAAATCGATGCTCAAGCAGCCCGATAAGGGGGTTAATGGATTTAAATTTTCAACAGCATTTTATACGGAATCTCCAATAAACTTCCAACCATCGTCCAAAGAAAACGGACATATCGATAAACCACTCTATTCTCCTATCACTTTTGAAGGCTGTGCTCGGCAGAACAGTTTCGATGAGGTTGATTGCGCACAACCTTTGAGGCCTTACGACACAGAACGACTATTTTCACAGTTTAATTCAAACGACAGCGACTCAGAATTCGAATCGGCTAAGAGCGATCCCTCTGAAGGAACAGATGACGTTACACAGGATGATACCCTCTCACAAAATAACTTAGTGGATGCTATCGATGCATTTTCAATTACAGATACCGAAAATTTGCAAAAAGGAAATGTTCCTGAATATAGTGTGGAAGTTTCTTTAGCAATTTCGGAGTGTCAGACTGTCGATAAAACTGAAGCGGAAACAATTTTAAATAATGGCTTGACTGAAACAGTTACCAGTGAAGCTTTCAACGAGAACGATTCATTGTCAGTTCAAGAAAATGATTCCAGTTCACTCGATGCAGAATCTAAATCAGAGGACGATGGTGAAGATGATCGACCGCAACGAGTACGGAGATGTTCATCATTAAAAACTGGGAAAACGCCGCCCGGTACTCCCGGACGTAAAAAAATTGTTCGATTTGCTGACGTGCTTGGACTCGATCTGGCGGACGTGAAGACCTTCATGGATGAAATACCGGTAATACCAAAATCCGCTTACGATGATCTCACTGGTTGTGATGTACAAAATTCCCCTCCCACGAGACCACCGCCCCGTCTAGGGGCATTGACGTTAGTTCCTTTATTCCAAGTTCCTCGCGATGTAACGGAAAAACTAGAAAGGCAAAACGTGTGCTTAGAGAGTTCACGTGTATGTGATGGCGTCCATGTAACAATTTGTGGCTCTGTACGAGTACGTAATTTAGATTTTCACAAAACTGTACACATACGCTACACAATGAATCGTTGGAAGACCTACACGGATTTACAGGCGAACTATGTACAGGGCTCGTGCGACGGATACTCGGACCGCTTCCAATTCACGTTATACGCACCTTGTATTTCATCGGGCCAAAGGTTAGAAATCGCCGTCAGATTCCAATGTAAGGGGCAACAGTTTTGGGACAACAATAGCGGAGCTAACTACTGCTTCGATTGCTTGGCTCTGGGTAATATCCATGCTACATCTTCGCCGATGACGCTACATCCGACTGTTGACTGGCACCCATCCTTCTACTGA

Protein sequence:

>DPOGS213594-PA
MNSPNLTMSLEHQMPVLMKKTQMSGDCAGSQCGLTSLLPMSCRGRAAAFARDLHSRLRNLGASHDGELENSWLARDSAHRPTNSNHSRDIDTFYDFELECESPSSPVDEYVQFPDKHNEDKDPPFYDVDSDPEHKEQTKSMLKQPDKGVNGFKFSTAFYTESPINFQPSSKENGHIDKPLYSPITFEGCARQNSFDEVDCAQPLRPYDTERLFSQFNSNDSDSEFESAKSDPSEGTDDVTQDDTLSQNNLVDAIDAFSITDTENLQKGNVPEYSVEVSLAISECQTVDKTEAETILNNGLTETVTSEAFNENDSLSVQENDSSSLDAESKSEDDGEDDRPQRVRRCSSLKTGKTPPGTPGRKKIVRFADVLGLDLADVKTFMDEIPVIPKSAYDDLTGCDVQNSPPTRPPPRLGALTLVPLFQVPRDVTEKLERQNVCLESSRVCDGVHVTICGSVRVRNLDFHKTVHIRYTMNRWKTYTDLQANYVQGSCDGYSDRFQFTLYAPCISSGQRLEIAVRFQCKGQQFWDNNSGANYCFDCLALGNIHATSSPMTLHPTVDWHPSFY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: