MonarchBase - Protein-coding gene

DPOGS200730
Transcript	DPOGS200730-TA	1704 bp
Protein	DPOGS200730-PA	567 aa
Genomic position	DPSCF300030 + 80644-83231
RNAseq coverage	839x (Rank: top 15%)

Annotation
*Heliconius*	HMEL008952	0.0	87.25%
*Bombyx*	BGIBMGA001032-TA	0.0	83.87%
*Drosophila*	SH3PX1-PA	4e-148	46.50%
EBI UniRef50	UniRef50_E3XGD4	2e-153	48.15%	Putative uncharacterized protein n=1 Tax=Anopheles darlingi RepID=E3XGD4_ANODA
NCBI RefSeq	XP_002084311.1	9e-150	46.52%	GD12900 [Drosophila simulans]
NCBI nr blastp	gi\|312370673	6e-153	48.15%	hypothetical protein AND_23209 [Anopheles darlingi]
NCBI nr blastx	gi\|157136204	2e-154	47.99%	sorting nexin [Aedes aegypti]

Group
Gene Ontology	GO:0005515	3.5e-31	protein binding
	GO:0007154	3.5e-31	cell communication
	GO:0035091	3.5e-31	phosphatidylinositol binding
KEGG pathway
InterPro domain	[329-565] IPR019497	2.6e-69	Sorting nexin protein, WASP-binding domain
	[202-336] IPR001683	3.5e-31	Phox homologous domain
	[14-72] IPR001452	2e-16	Src homology-3 domain
Orthology group	MCL11733		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS200730-TA
ATGTACAACGCTAGCAAAGTTCAAGGGTCCAAAATGTCGACCCAAGTACAGGCTTTGTATGACTTTACTGGTGAACCAGGCACAACCGAGATGTCTATCACCTCTGGAGAAATACTGACACTTATAAATACAGATATAGGGGAAGGCTGGTGGGAGGGGCGAAATTCCAGAGGTGAAACTGGTTTATTTCCTGCTGCATATGTGAGAAAAGTAACACCAGATGAGTCTGCACCCACAAAAATGGCTCCTCCAGCACCAAGATACGATCAGGCTGCAGATGATTGGGGAGATCACCAATACAGTGCTGGCGACAATAATTATCAAAGGGCGGCTTCACATGACGAGGGCTGGGATGATGATTGGGAGGATGACACATATTCAGAAATTGGACCTGGCCCACAGCAATCAAAGCAGGCAGTGAATCAACCTCTTACACCATTACCGGGAATGCCAATTAGTGATCTCAACCATCAGATGGACGACAACTCATCTACCTTTGGTTCATCAGTTGGCACAGTGAGAAAAAATAAATTTGCACCATCATCTAAAGTCAGCGGTGAGAGTTACCTTTTAGGTACTTTAAATGTTGAAGTACCAGATGCTGATAAAATATACATAGAACAAGAAGGGGATGCATATATTTGGTCGCCCATACCACAACCATATAATGTAACTGTTGCATCACCAAAAAAGGAATCCAAATTTAAGGGTATTAAGAGCTTCATAGCATATCAATTGACTCCCTCCTTTAATAATATTCAAGTATCCAGAAGATATAAGCATTTTGACTGGCTTCATGAGAGATTGCAGGAGAAATTTACACTCATCCCAATCCCACCTTTACCTGACAAACAGATCTCTGGAAGATATGACGAACAATTGATTGAGAGAAGAAGAGTTCAGTTACAGGAGTTTGTGGATTGGATGTGTAAACATCCAGTACTATCCAGATCGGAGGTCTGGCAACATTTCCTAACTTGCACAGATGAGAAACGTTGGAAGGCTGGTAAAAGACAAGCGGAGAGAGATAATTTATTAGGACTTAACTACTGTATATCATTAGTTGTACCTGAAAAAGCTTTACTTCAATCACAAGTAGACCACATCACGGAACAATGCCACATTTTCATGAATAGCATGGATAGTTCTGTTAAATCTCTGACAAATATGTGTATAGCACAAACAAAACGATTCCAAGGGCCTTATAAGAGCGATTGTCAAAAAGTAGGAGAGGCTTTTTACAACTTAGGAAATGCACTAAGTTTAGATGAAGGCACAATAGTTTCTACTTCAAAACTAACTTCAGCTATCAAAATGGCTGGCGGGGCCTACATTGAAATAGGCAGAATGTATGAGGAACAACCAAAATATGATTTCGAACCACTCGGTGATAAATTTCATCTTTACAAAGGTATAGTTGGCTCATTTCCTGATGTATTAGCAAATCACAAAGCAGCTGTGCAGAAGAAAAAAGAGTGTGAGAGATTGAGAGCTGAAAATAAAATGGAAAGGGAACAATTAAATGAAGTGTTTAGAAGAAATAATGTCATATCATATGCCCTTCTTGCCGAAATAAACCACTTCAAGTCGGAGAGGACGGTCGATTTAAATGCAACAATGCAGAAATTTCTCAAGCAGCAAATAACATTTTATAAGAAGATAGTTGATAAATTGGAAACAACACTACAACAGTTCCAAGAATAG

Protein sequence:

>DPOGS200730-PA
MYNASKVQGSKMSTQVQALYDFTGEPGTTEMSITSGEILTLINTDIGEGWWEGRNSRGETGLFPAAYVRKVTPDESAPTKMAPPAPRYDQAADDWGDHQYSAGDNNYQRAASHDEGWDDDWEDDTYSEIGPGPQQSKQAVNQPLTPLPGMPISDLNHQMDDNSSTFGSSVGTVRKNKFAPSSKVSGESYLLGTLNVEVPDADKIYIEQEGDAYIWSPIPQPYNVTVASPKKESKFKGIKSFIAYQLTPSFNNIQVSRRYKHFDWLHERLQEKFTLIPIPPLPDKQISGRYDEQLIERRRVQLQEFVDWMCKHPVLSRSEVWQHFLTCTDEKRWKAGKRQAERDNLLGLNYCISLVVPEKALLQSQVDHITEQCHIFMNSMDSSVKSLTNMCIAQTKRFQGPYKSDCQKVGEAFYNLGNALSLDEGTIVSTSKLTSAIKMAGGAYIEIGRMYEEQPKYDFEPLGDKFHLYKGIVGSFPDVLANHKAAVQKKKECERLRAENKMEREQLNEVFRRNNVISYALLAEINHFKSERTVDLNATMQKFLKQQITFYKKIVDKLETTLQQFQE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: