MonarchBase - Protein-coding gene

DPOGS202150
Transcript	DPOGS202150-TA	1887 bp
Protein	DPOGS202150-PA	628 aa
Genomic position	DPSCF300162 - 229812-250554
RNAseq coverage	616x (Rank: top 21%)

Annotation
*Heliconius*	HMEL010885	0.0	93.15%
*Bombyx*	BGIBMGA005255-TA	8e-61	45.45%
*Drosophila*	Cdep-PE	2e-164	77.75%
EBI UniRef50	UniRef50_E2BXI1	4e-172	80.40%	FERM, RhoGEF and pleckstrin domain-containing protein 2 n=4 Tax=Coelomata RepID=E2BXI1_HARSA
NCBI RefSeq	XP_966992.2	3e-175	79.66%	PREDICTED: similar to Cdep CG31536-PE [Tribolium castaneum]
NCBI nr blastp	gi\|189237184	6e-174	79.66%	PREDICTED: similar to Cdep CG31536-PE [Tribolium castaneum]
NCBI nr blastx	gi\|189237184	2e-167	79.66%	PREDICTED: similar to Cdep CG31536-PE [Tribolium castaneum]

Group
Gene Ontology	GO:0005515	1.9e-31	protein binding
	GO:0005488	2.9e-29	binding
	GO:0019898	7.3e-08	extrinsic to membrane
	GO:0008092	7.3e-08	cytoskeletal protein binding
	GO:0005737	7.3e-08	cytoplasm
KEGG pathway	nve:NEMVE_v1g216385	3e-88
	K06082 (FARP2, FRG)	maps->	Adherens junction
InterPro domain	[51-249] IPR019749	4.7e-59	Band 4.1 domain
	[244-337] IPR011993	1.9e-31	Pleckstrin homology-type
	[138-244] IPR019748	2.6e-31	FERM central domain
	[135-241] IPR014352	2.9e-29	FERM/acyl-CoA-binding protein, 3-helical bundle
	[253-338] IPR018980	6.7e-23	FERM, C-terminal PH-like domain
	[59-136] IPR018979	3.9e-19	FERM, N-terminal
	[88-100] IPR019750	5.7e-17	Band 4.1 family
	[558-593] IPR014847	2e-12	FERM adjacent (FA)
	[68-87] IPR000798	7.3e-08	Ezrin/radixin/moesin family
Orthology group	MCL10250		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS202150-TA
ATGGAAACTGAATTACCGCCCGGCAGCTGTAATTCTACTGGACATCTGTCCACTATTGGATGGCACATGCCAGGTCGTATGCACCACTCGGCGAGCACGCCGGCGGGCGTGGACGGAGGCGCCCGCACGCCGCCCGCCACGCCCAAGAAGGGTGGCAAGATGCTCGCCGTGCGAGTGCAGATGTTGGACGACTCCATATCAATGTTCCAGATACAGTCAAAGGCACACGGTAAAGTTCTGTTCGATCAAGTCTGCAGGCAACTTCATTTGTTGGAGGCTGATTACTTCGGGCTTGAATATCAAGATGCTAACGGGATAAAGTACTGGCTGGATGTGGAGAAGCCGATGTGCCGTCAGGTCGGCCTGTCGATGCTGGAGCCGACCCTCCGCTTCTGCGTCAAGTTCTACACCCCAGACCCGGCGCGGCTCGAGGAGGAGTTCACCAGATACCTGTTCTGTCTCCAAGTGAAACGTGACCTGATGCTGGGGTGCATACAGTGTAACGAGAACACCGCCGCGCTCATGGCCAGTTACATAGTACAAGCGGAGTGCGGAGATTTTGTCCCGGAAGACTACCCTGACCACACGTACCTCAGCGGGTACAAGTTCTTCCCCGGACAGGACGCAGACTCGGAGAGGAGAATCATGGAGAATCATAAGAAACATATCGGTCAGAGCCCGGCGGAGGCTGATTTAAATCTGTTAGAGACAGCGCGCAGGTGCGAATTGTACGGTATAAAGATGCACTCGGCGAAGGATCACGAGGGCGTGCCGTTGAACCTGGCGGTGGCTCACATGGGCATCGCCGTGTTTCAACACTGTACGCGCATCAACACCTTCAGCTGGGCCAAGATCCGGAAGATATCCTTCAAGCGGAAGAGGTTCCTCATTAAGCTGCATCCCGAGGGATATGGCTACTTCCGAGACGTGGTGGAATTTTTCTTCGAGAGTCGAAACGAGTGTAAGAATTTTTGGAAGAAATGCGTAGAGAACCACGGCTTCTTCAGATGTACCAGCGTACCGCGGCTTCCGCGACACAAGACGCGCGTCATGTCAAGAGGATCGTCCTTTAGTCGACTCATTTGTACACAAAAGTTGTACATCATCTGTATAACCTTGAGGAAGGACGACGTTGTATTTAATTTCTTACTTGTACATTACAGGTACAGTGCGGAGTGCGGAGATTTTGTCCCGGAAGACTACCCTGACCACACGTACCTCAGCGGGTACAAGTTCTTCCCCGGACAGGACGCAGACTCGGAGAGGAGAATTATGGAGAATCATAAGAAACATATCGGTCAGAGTCCGGCGGAGGCTGATTTAAATCTGTTAGAGACAGCGCGCAGGTGCGAATTGTATGGTATAAAGATGCACTCAGCGAAGGATCACGAGGGCGTGCCGTTGAACCTGGCGGTGGCTCACATGGGCATCGCCGTGTTTCAACACTGTACGCGCATCAACACCTTCAGCTGGGCCAAGATCCGGAAGATATCCTTCAAGCGGAAGAGGTTCCTCATTAAGCTGCATCCCGAGGGATATGGCTACTTCCGGGACGTAGTGGAATTTTTCTTCGAGAGTCGAAACGAGTGTAAGAATTTTTGGAAGAAATGCGTAGAGAACCACGGCTTCTTCAGATGTACCAGCGTACCGCGGCTTCCGCGACACAAGACGCGCGTCATGTCAAGAGGATCGTCCTTTAGGTACAGCGGTAAAACACAGAAGCAAATAGTGGAATTCGTAAGGGATAACTACGTGAAGCGGCAAACATTCCAAAGGTATTTAGATTCAGCCGGGGCTGATCTACATAATAACGGTGAGTTGGCACTTGGCATGGGGCTGGGGACGAGCCTGATCGTGGAGGGCAATGACCTCCCTAACTTCAGATAA

Protein sequence:

>DPOGS202150-PA
METELPPGSCNSTGHLSTIGWHMPGRMHHSASTPAGVDGGARTPPATPKKGGKMLAVRVQMLDDSISMFQIQSKAHGKVLFDQVCRQLHLLEADYFGLEYQDANGIKYWLDVEKPMCRQVGLSMLEPTLRFCVKFYTPDPARLEEEFTRYLFCLQVKRDLMLGCIQCNENTAALMASYIVQAECGDFVPEDYPDHTYLSGYKFFPGQDADSERRIMENHKKHIGQSPAEADLNLLETARRCELYGIKMHSAKDHEGVPLNLAVAHMGIAVFQHCTRINTFSWAKIRKISFKRKRFLIKLHPEGYGYFRDVVEFFFESRNECKNFWKKCVENHGFFRCTSVPRLPRHKTRVMSRGSSFSRLICTQKLYIICITLRKDDVVFNFLLVHYRYSAECGDFVPEDYPDHTYLSGYKFFPGQDADSERRIMENHKKHIGQSPAEADLNLLETARRCELYGIKMHSAKDHEGVPLNLAVAHMGIAVFQHCTRINTFSWAKIRKISFKRKRFLIKLHPEGYGYFRDVVEFFFESRNECKNFWKKCVENHGFFRCTSVPRLPRHKTRVMSRGSSFRYSGKTQKQIVEFVRDNYVKRQTFQRYLDSAGADLHNNGELALGMGLGTSLIVEGNDLPNFR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: