MonarchBase - Protein-coding gene

DPOGS204384
Transcript	DPOGS204384-TA	1821 bp
Protein	DPOGS204384-PA	606 aa
Genomic position	DPSCF300002 - 1683987-1694639
RNAseq coverage	800x (Rank: top 16%)

Annotation
*Heliconius*	HMEL013079	0.0	84.03%
*Bombyx*			%
*Drosophila*	Cip4-PB	1e-152	48.70%
EBI UniRef50	UniRef50_E2A0X3	6e-164	51.73%	Formin-binding protein 1-like n=9 Tax=Endopterygota RepID=E2A0X3_CAMFO
NCBI RefSeq	XP_397251.3	1e-163	51.13%	PREDICTED: similar to Cip4 CG15015-PA [Apis mellifera]
NCBI nr blastp	gi\|307188194	2e-163	51.73%	Formin-binding protein 1-like [Camponotus floridanus]
NCBI nr blastx	gi\|307188194	3e-164	52.72%	Formin-binding protein 1-like [Camponotus floridanus]

Group
Gene Ontology	GO:0005515	1.8e-09	protein binding
KEGG pathway	mdo:100026234	1e-89
	K07196 (TRIP10, CIP4)	maps->	Insulin signaling pathway
InterPro domain	[17-103] IPR001060	6.8e-18	Fps/Fes/Fer/CIP4 homology
	[521-598] IPR001452	1.8e-09	Src homology-3 domain
Orthology group	MCL12010		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS204384-TA
ATGTTCGTCAGTCTTAATGAGAAGCGACAGTACGCTATAGATGCTGGCTGGACCTCTGATCAATATGATAACTTAGCCACCCATACTCATAAAGGTATCGAATTCTTAGATAAATATGGGAATTTTGTGAAGGAACGGTGTGCTATAGAGTTAGAATATGCTGGCAAATTAAGGAGGCTTGTGAAGAGCTATCAACCAAAAAGAAAGGAAGAAGACGAATACGTATATACATCATGTAAAGCATTCAGACAGCTCCTTCAGGAGTTGGGTGATTTTGCTGGTCAGAGGGAGTTGGTGGCTGAGAATTTACAGTCGAACGTTGTACGAGAGTTACATTTACTAGCTAAGGAGCTGAGAGAGGCTAGGAAGGGACACTTAAACGACGGTTCAAAGCAAATGGCCGTCCTTAGTACGGCCGTGGGAGCGTTGGAGCGTGCGCGTCGTTCATACGAGAGGGCGGCGCGGGAGTCGGAGCGTGCACTGGAAGCCTTCCAGCGAGCGGACGCAGACCTGCACCTCAGTCGGGCCGAGGTCGAGAAACAGAAGATGAACATGAAATTAAGAAGTCAAGCGTGCGAGGACGCGAAACAGGAATACATGGACCAACTGAGGAAGACCAATGAGGCACAGAGGCAGCACTACGAACAACAGCTGCCGCACGTTTTCAAACAGTTACAGGATTTGGACGAGAAGAGAATAAAACATATAAAGAATTTCATGATCAGCTCAGTGGATGTCGAGAGGAAGGTGTTCCCGATTATAATGCAATGTCTCGACGGTATGGAACAGGCCGCCAAGAATATAAACGAGAAAGAGGACACTCAGTTAGTAATAGAGAGGTACAAATCTGGTTTCGTCCCGCCTGAAGACTTCAGATTTGAACCCGCGACTGGCGCTGACGCCACGGACTCTGTACCAGCCCCTACCCACAACCATATCACAGTTAGAGGCACGGTGTCCGGTAACCGGATCAAGAAGAGAGGTGGCCTGCTCTCTATATTCAGCTCAAACAAGAATAACTTGTCGGTCGATGGAAAGGAGGATTATTCAGATTTACCGCCCAACCAGAAGAAAAAGAAACTGCTAGCTAAAGTACACGAATTGACCAAGCAGGTTGGCCAAGAACAAGCTGCTATGGAGGGTCTTATGAAAATGAAAGGGGTCTACGAAACAAATCCCACGCTGGGCGACCCTATGACTGTGGAAGGTCAGCTTAACGAATGTTGTGATAAACTAAAGAAGCTCCGTCTCCAACTACGCAAATACGAAGAGCTACTGGCGGAAGCGAACAACCAGGTGTGCGCCCAGCCCATACACTCCATCAACAAGACTAACGGCGCCCCCACACAGGCCACGAGCATCGGTTCGAACAGCGGTTCCCTATCCCGCTCAGCGTCCGAATCCTCCGTGAGTACGGGTACCGGCACTAACACTGGCAACACCGTCATGGCGGTGTCGTCCCGGGCCGCGGGGGGTTCCCCGGAGTCGGGTCTCGGCGGCGAGCTGGCCGCGGGTCACGCGGAACACGCCAACGGTCATGACCACGATGACCACGACCACGACCACGACGACCACGAGTCCGACTTCGATTATTATTACGAGCCGGACTTACAGCCACTAGGTTACTGCAAGGCGCTTTATGCTTTCGAAGCGAACGGCACCGGCTCAACGATGCGTATGGAGTGCGGCGAGAAGCTGCTGGTGTTGGAGACGGACGCTGGTGACGGCTGGACGAGGGTGAGGCGGTCGCTCACCAGGGAGGAGGGCTTCGTACCCACCACGTACATCGCCACCACGCTGTACGCCGACGTGCATCACTAG

Protein sequence:

>DPOGS204384-PA
MFVSLNEKRQYAIDAGWTSDQYDNLATHTHKGIEFLDKYGNFVKERCAIELEYAGKLRRLVKSYQPKRKEEDEYVYTSCKAFRQLLQELGDFAGQRELVAENLQSNVVRELHLLAKELREARKGHLNDGSKQMAVLSTAVGALERARRSYERAARESERALEAFQRADADLHLSRAEVEKQKMNMKLRSQACEDAKQEYMDQLRKTNEAQRQHYEQQLPHVFKQLQDLDEKRIKHIKNFMISSVDVERKVFPIIMQCLDGMEQAAKNINEKEDTQLVIERYKSGFVPPEDFRFEPATGADATDSVPAPTHNHITVRGTVSGNRIKKRGGLLSIFSSNKNNLSVDGKEDYSDLPPNQKKKKLLAKVHELTKQVGQEQAAMEGLMKMKGVYETNPTLGDPMTVEGQLNECCDKLKKLRLQLRKYEELLAEANNQVCAQPIHSINKTNGAPTQATSIGSNSGSLSRSASESSVSTGTGTNTGNTVMAVSSRAAGGSPESGLGGELAAGHAEHANGHDHDDHDHDHDDHESDFDYYYEPDLQPLGYCKALYAFEANGTGSTMRMECGEKLLVLETDAGDGWTRVRRSLTREEGFVPTTYIATTLYADVHH-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: