MonarchBase - Protein-coding gene

DPOGS212395
Transcript	DPOGS212395-TA	3069 bp
Protein	DPOGS212395-PA	1022 aa
Genomic position	DPSCF300019 + 1063646-1075868
RNAseq coverage	229x (Rank: top 44%)

Annotation
*Heliconius*	HMEL010708	0.0	62.66%
*Bombyx*	BGIBMGA012078-TA	6e-154	45.76%
*Drosophila*			%
EBI UniRef50	UniRef50_C3Z7E0	2e-72	27.68%	Putative uncharacterized protein n=1 Tax=Branchiostoma floridae RepID=C3Z7E0_BRAFL
NCBI RefSeq	XP_966626.2	6e-99	30.52%	PREDICTED: similar to sorting nexin 14 [Tribolium castaneum]
NCBI nr blastp	gi\|189235075	1e-97	30.52%	PREDICTED: similar to sorting nexin 14 [Tribolium castaneum]
NCBI nr blastx	gi\|189235075	1e-96	30.51%	PREDICTED: similar to sorting nexin 14 [Tribolium castaneum]

Group
Gene Ontology	GO:0005515	1.5e-09	protein binding
	GO:0007154	1.5e-09	cell communication
	GO:0035091	1.5e-09	phosphatidylinositol binding
	GO:0004871	2.1e-07	signal transducer activity
KEGG pathway
InterPro domain	[326-402] IPR003114	3.6e-15	Phox-associated domain
	[432-566] IPR016137	7.2e-12	Regulator of G protein signalling superfamily
	[648-766] IPR001683	1.5e-09	Phox homologous domain
	[445-564] IPR000342	2.1e-07	Regulator of G protein signalling
Orthology group	MCL15983		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS212395-TA
ATGAACATTTTCCAGACATTCTTAGATACGATATCGTGCCATTTTATGAGGAAGCTGCCCAGTCCAGATCAGAAAAAAACTTCTGTCAGAATTTGTAATGCCTGTGATGCTCCTAACTGCAGTCGCCATGATCCAGAACTATTACCCGATCCCTGGGTCGGATTACTCATTCATAAACAATTGGACCAGGCTATAGAAGATTTTTATAACAGAATTTTAGAGCAATTTATAAATACATGGTACAGCAAAATAACTTTGCAGCCATTTTTTATTGATGAACTTCGACAACAGTTGAGATATGCATCGGCATGTTTGTACAGGAGAGCTCTTACAATAGATCCAGGTGTGTTCATCTTCAGCCGCCTTTTGCCATGTGCGTTACGTCACGTGTCCCTCCCCCCGGCCGCCACTCACACCGCTCTGAGCTCGCGGGCGTCTGAACTACGCTATCTGAGATGTCTGTCTGATACACTGCTGCCATATCTCCTACGACCGGCAGATTGTCATAATGAATTTCACCTGATCACAATAATAGTAAGCTATGTGTTGGGATGTTTGGCTTGTTATTATGGACTTCAGATGAACATTTTCCAGACATTCTTAGATACGATATCGTGCCATTTTATGAGGAAGCTGCCCAGTCCGGATCAGAAAAAAACTTCTGTCAGAATTTGTAATGCCTGTGATGCTCCTAACTGCAGTCGCCATGATCCAGAACTATTACCCGATCCCTGGGTCGGATTACTCATTCATAAACAATTGGACCAGGCTATAGAAGATAATTTTAGAGCAATTTATAAATACATGGTACAGCAAAATAACTTTGCAGCCATTTTTATTGATGAACTTCGACAACAGCTGAGATATGCATCGGCATGTTTGTACAGGAGAGCTCTTACAATAGATCCAGGTGTGTTCATCTTCAGCCGCCTTTTGCCGTGTGCGTTACGTCACGTGTCCCTCCCCCCGGCCGCCACTCACACCGCTCTGAGCTCGCGGGCGTCTGAACTACGCTATCTGAGATGTCTGTCTGATACACTGCTGCCATATCTCCTACGACCGGCAGATTGTCATAATGACCATGACCCGCCTATGTGTAGAGTGTTCCGCACCTTGGTCCGTGAGCTGGTGTCGTGGTGGGTTCTTCTGCCGATGGTGGACGTGCTGGCTGACCCCTACACCCTCAACACTCTCCTGCTGCTGGTCACCGGGGATGACACCATGGCGCCGTTACCCATCACGCCAGATTATAAAGTCGAGTTCCTGGAGTGTTTCGTTCGTCAGTCGGAGTGCGTGTATTCGTCGAGGCCTCGTCTGCTTCGCGTTCAGTTGGAACCATTAGTCCAGGAGTCAGGCGCTCTATACGCGCTCCTGCAATACTTGAAAACAACACCTCATTTACAGCTCTTACAGTTCTACCAGGACATCAAATCATTTCAAACTCGAATTCTCAACCCCGAGCTGACTGTATCAGAACAGGCGTCTCTCCAGCGTGAAGCCGAGGAGTTGTTTTCGCGGTACAGAAGTAGTGGACATCACGAGCTGATACAGGAGATGGAACAACTCATGAAGGAGGGAGGAGTTAGGAGACTTCAGACATCTCGAGCGCTCTATCAGGCCGCCAGACAGGCGCACGGTGCCTTAGAGAAGACAATGCTACCAAAGTTCTTACATAGCGAAGAATTCTACAAATTATTAATAGGCCCGAGGCTGCCGGTGGGGTACCAGAAACAAATGACGAAGAGGCCGGAAGACAAACAGAGCATGTTGAAACTCGGCGTGAGGATAAAGAATGCTTTAAAGCAGCAGGTCGTGGACGGCCAGGTGTTGGAGATGACGTCACAGCTGGACGAGGGGGAGAGTATAGAGAACATAGACATCCTGCAATACCTGGACTCCCTCGCCGCCGAGGACTCCTTGGATCAGGATCTCAGCACTTACTTTCACCAGGATATCTTAATGATACTTATCTCCGTCCAGCAAGCCCCTCCGCGTCGTGGTCCGGTGCGAGTGTTCACACTGGCGGTGCACCGCTCGGGGCGGTCCGTGGGAGCTATGGACGTTGAAGCGGCGTTGTGGCGCGTCAAGCGAAGCGAACATGACTTCCACCTGCTGCGAGCCAAGCTGAGGGAGTTCCACGGAGACGCGTTAGCGCTGCAGCAGCTGCCGTCTAGAAGAGACAATAGTCCTCTGGAGACTCTCCGCTACAAGTATGAAGACTTCCTCCAGAGACTGCTACAGATCTCCCTTCTCCAGACCAGCGAACTCCTGCATTTATTCCTTACAGTTGATGGAGATTTCTCCCTAGTGGTCCAAGCGTCGACCTTGAACGCCTCGAACACAGACCTAGGAAACATTTACCAGTCCGTGGCACATAAACTACGGAAGGAGAAGGGACAGCACCTGGAAAGCTTCCTCAGGAATTTTCTGGTGTCGTCGGATAAGGAGCGGTATCAGGCTTTAAAACAGGGTTCCCAAGTGGAAGAAGCTCATGAAGTGAACGAAGAAGATACGGAGAAGATCGTCAAGAGACAACACAACGTCCGCAGCATACAGTCCAGCGTGTTCGGGAACAACTTTGATACAGAACCGGAAGTGACGCACATTCAGACCCACTACCAGGACACCGTGGTCGGCTTCACACAGTGCTTTATGTATTTACTAATAAAAGTGTTAAAAGTCCCCGGGCTGGTGGTGGGCGTGGTGGGCAGCGTGCTATCTCTGGTGAGCGACTCGCTGGACCTCGCGGGCTCGGCCTTAACCAACAAGTACCTCAAGGAGCTGTTGAACGAGAGACGACTGGCGCATCTCATACGACTTGGACACAATCTCCTGTTCAATGACCGCACCCCCCGCAGCCCCGCGTCGCTGGTGACGTCACGGGCGCGGGCGCGGGTGGCGGGGGCGGGGAGGGGCGCGAGGCTGTGGTCGGGGGTCGTGCAGGATGTGTTCGACATGATGCAAGTACCGAGGATGAACAAACAGCTGGTTTATAATTTATTGGACCTGTGTGTGCTGGAACTGTTCCCGGAGCTGCGGACCCCGGGAGCGTCGCACGCGGACACCTGA

Protein sequence:

>DPOGS212395-PA
MNIFQTFLDTISCHFMRKLPSPDQKKTSVRICNACDAPNCSRHDPELLPDPWVGLLIHKQLDQAIEDFYNRILEQFINTWYSKITLQPFFIDELRQQLRYASACLYRRALTIDPGVFIFSRLLPCALRHVSLPPAATHTALSSRASELRYLRCLSDTLLPYLLRPADCHNEFHLITIIVSYVLGCLACYYGLQMNIFQTFLDTISCHFMRKLPSPDQKKTSVRICNACDAPNCSRHDPELLPDPWVGLLIHKQLDQAIEDNFRAIYKYMVQQNNFAAIFIDELRQQLRYASACLYRRALTIDPGVFIFSRLLPCALRHVSLPPAATHTALSSRASELRYLRCLSDTLLPYLLRPADCHNDHDPPMCRVFRTLVRELVSWWVLLPMVDVLADPYTLNTLLLLVTGDDTMAPLPITPDYKVEFLECFVRQSECVYSSRPRLLRVQLEPLVQESGALYALLQYLKTTPHLQLLQFYQDIKSFQTRILNPELTVSEQASLQREAEELFSRYRSSGHHELIQEMEQLMKEGGVRRLQTSRALYQAARQAHGALEKTMLPKFLHSEEFYKLLIGPRLPVGYQKQMTKRPEDKQSMLKLGVRIKNALKQQVVDGQVLEMTSQLDEGESIENIDILQYLDSLAAEDSLDQDLSTYFHQDILMILISVQQAPPRRGPVRVFTLAVHRSGRSVGAMDVEAALWRVKRSEHDFHLLRAKLREFHGDALALQQLPSRRDNSPLETLRYKYEDFLQRLLQISLLQTSELLHLFLTVDGDFSLVVQASTLNASNTDLGNIYQSVAHKLRKEKGQHLESFLRNFLVSSDKERYQALKQGSQVEEAHEVNEEDTEKIVKRQHNVRSIQSSVFGNNFDTEPEVTHIQTHYQDTVVGFTQCFMYLLIKVLKVPGLVVGVVGSVLSLVSDSLDLAGSALTNKYLKELLNERRLAHLIRLGHNLLFNDRTPRSPASLVTSRARARVAGAGRGARLWSGVVQDVFDMMQVPRMNKQLVYNLLDLCVLELFPELRTPGASHADT-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: