MonarchBase - Protein-coding gene

DPOGS208917
Transcript	DPOGS208917-TA	2766 bp
Protein	DPOGS208917-PA	921 aa
Genomic position	DPSCF300009 - 373428-393661
RNAseq coverage	309x (Rank: top 37%)

Annotation
*Heliconius*	HMEL011553	73.06%
*Bombyx*	BGIBMGA002491-TA	75.72%
*Drosophila*	CG31158-PD	58.65%
EBI UniRef50	UniRef50_D6X4C1	51.07%	Putative uncharacterized protein n=1 Tax=Tribolium castaneum RepID=D6X4C1_TRICA
NCBI RefSeq	XP_969387.1	51.07%	PREDICTED: similar to arf6 guanine nucleotide exchange factor [Tribolium castaneum]
NCBI nr blastp	gi\|350405381	51.49%	PREDICTED: hypothetical protein LOC100742088 [Bombus impatiens]
NCBI nr blastx	gi\|350405381	52.29%	PREDICTED: hypothetical protein LOC100742088 [Bombus impatiens]

Group
Gene Ontology	GO:0032012	1.2e-46	regulation of ARF protein signal transduction
	GO:0005622	1.2e-46	intracellular
	GO:0005086	1.2e-46	ARF guanyl-nucleotide exchange factor activity
	GO:0005515	1.1e-22	protein binding
KEGG pathway	tca:657863	0.0
	K12494 (PSD)	maps->	Endocytosis
InterPro domain	[494-678] IPR000904	1.2e-46	SEC7-like
	[569-670] IPR023394	2.1e-32	SEC7-like, alpha orthogonal bundle
	[700-815] IPR011993	1.1e-22	Pleckstrin homology-type
	[5-91] IPR001478	1.9e-18	PDZ/DHR/GLGF
	[700-814] IPR001849	9.2e-13	Pleckstrin homology domain
	[702-721] IPR001605	5.4e-09	Spectrin/pleckstrin-like
Orthology group	MCL14755		Insect specific

Nucleotide sequence:

>DPOGS208917-TA
ATGGCTGACGAAAGGCTAGTGGTCCTGAATCGTTGTGACAACTTGGGTTTTGGATTTTCTTTACTCGGCGAAGCCGGTTTGCCTCATATTATTTACGAAATCGAAGAAAATTCTCCAGCTGCTAAGAGTGGTGAGGTTGAGGTTGGTGATGTATTGCTCAAGGTCAATGGAACTGATGTCAACAGGTTCAGCACACGCGAAGTCTTAAAATGCTTACGACTGTCGGCGGATCCTGTGACTCTTCGTCTCAAAAAAGATCCTCAGATCAAAGCGAACGTGCGACGCTATCTCTCATCCGGCGAGAGACGTTCTAGCGGGCCGCGTGTCAAACAAGATAAATGTGGATCGCCTCCGTCTAGTAATTCGAACAGCTCGTCTAGTTCGTCGAACGGTCTAGCTCGGTCTGGCGAGAGCTGCGAGGCGCTGATCGAGGACCGGTCTGACAGACCGAGACTCACCCAGCCGAAGTTCGAGGCCTACATGATGACCGGTGACCTGATGCTGAACCTCTCCAGGGTTGAACACCCACATCATAATCACCACGCGCCCACACACCGCACACACTATCATAGATATAATTCAACCCCAGCCTCCCCTAGTGAAAACCGTCTAGCTGCTCGTGTGGAACTAACACAGAGGCACAACTCATCACCTAACACCGGCCTATCGGATCATGCGAGTAAAATGTTCAACTCCCAGCCGGCATCTCCAGCTGGTGGTAATACCTCATCAGCTGAGTCCGCTACAAGGACCCAGCACATCGTCAGAACATCCAGATCCGAAGATCACTTACAGAAGGAATCGTCTTTGAGCGCGGTAGCTGTTGATATGGAAGAGGATGTGACGTCATCGCTCAATACACTATTGGACGCTCGGCCGGACTCCGCCACGCCAGGACCTCGCTCGGATTCCGACGAAAGAGACAGGATTGTATGGACGTACAATGCCCCGGTGTCGCAATGTAACGGGTCGGCCGCGACATCAAATTCTACCTCCATATCAGATGGGATGTCACAACGGTCTTCATCCCCGTTGTCGCCAACATCAGCGTCGTGGTCGGCGCTGTCACCACCTCACCGCGCACCCCCCCTACCACGAGCACCACTCAATGGCGACATGAGTTTATCGGAGGCTGTCTCAAACATATCCAGCCCCGATTTCCAAGACCAGGACGACATGTTCGAAACGGGTCGGGAGTGTCCGAGAATGGAACTGTCCGACCCGTCGGACTCGGACTCCACGATACTAGTGTCTGAGCCGTGTCACAAGAGAGCCAAGTCGAACTCCACGTACTCCACGGAACACGGGAGTGACGTCACCCTCAACGGCGACCACAGCAAGGAGTACAGAATAGTCATACAGGTCAAAGGTCCGGACAAACAGAACAACTCCAACGACAACGTCAACAATAATAATAACACGAATTACGCACAAAATGGCAAAGAGAACGGGCACAGCTCGCCCGAAAATCAAGGTTATCAGGAGCTGTGCAGTGGTTCGGACGCTTGTTCTGATGACGGGTCAGACGGTGATTCGCTTCACTCATTCCACTACAGTCCGAAGGCAGTGGACATACCTTCAGCTGAGAGGCTTGCGAAACGACTATACAATCTAGACGGTTTCAAGAAATCCGATGTTTCTAGACATTTAAGTAAAAACAATGATTTCTCCCGCGCCGTGGCGGAGGAATACGTGAAACATTTCGAGTTCGCCAACACTACTTTAGACGAAGCGCTACGAGCGTTCCTCGCGCGGTTCGCTCTCAGTGGAGAAACTCAAGAAAGAGAACGAGTCTTAGTTCATTTCTCACGACGGTATTTAGAGTGTAACCCGGGAGCGTTCAATTCACAAGATGCCGTTCACACGCTCACCTGCGCGATAATGTTACTTAACACAGATCTCCACGGCTGCGGAGGGACGTTCAGGCGCATGTCGTGCGCCGAGTTCATTGATAACCTGGCTGATCTTAACGACGGCGAAAACTTCCCTAGAGAAACATTAAAACACTTGGACTCTGAAGCAACAAACGAGATTCGGACCGCCCCCGCCGTTGGCAACAATCCGTTCCTCGACTTGCCGGACCAGAGCCGCGCGGTCGAGTACAAGAAGGGTTATGTCATGAGGAAATGCTGTTACGACGCTAACGGAAAGAAAACTCCATTCGGCAGACGTGGTTGGAAGATGTTCTACTGTACGCTGCGTGATCTAGTCCTTTATCTGCACAAAGACGAACACGGCTTCCGACGGAGTCAGATGTCAGATAACCTGCACAACGCTATAAGAATACATCACGCCCTGGCGACTAAAGCCACAGATTATACAAAAAAACAACACGTGTTTAGACTGCAAACTGCTGACCAGGCCGAATACTTGTTCCAGACGAGTGATTCAAAGGAGTTGTGCTCATGGGTGGAGACGATCAACTTTGTATGCGCGTCGTACTCAGCCGCGCCTCTGGCTGGCGCTGTCGGCTCGCAAAGGAAATTCCAAAGACCACTGCTGCCTTGTACTCACACCAAACTTTCCATGCGAGAACAGCTAGCGGAGCATGAGGAGCGCGCTGCCCGTTTAGAGGAGGAATTGGCAGCGTTGAGACTAGCCAGAGATCCACACAGCAGGGACAAAGATCATTACCTCGTGCACGAGATAAAGAGGTATCGAACATACGCGTATGTGATGCGTACTCGTGGTGGCGGCATCGGCGCCGAGGAGAACGCGCCCGCGCTGCCCGAGCGTCCTCACAACCCTCACCACGCGCCGCCCTGA

Protein sequence:

>DPOGS208917-PA
MADERLVVLNRCDNLGFGFSLLGEAGLPHIIYEIEENSPAAKSGEVEVGDVLLKVNGTDVNRFSTREVLKCLRLSADPVTLRLKKDPQIKANVRRYLSSGERRSSGPRVKQDKCGSPPSSNSNSSSSSSNGLARSGESCEALIEDRSDRPRLTQPKFEAYMMTGDLMLNLSRVEHPHHNHHAPTHRTHYHRYNSTPASPSENRLAARVELTQRHNSSPNTGLSDHASKMFNSQPASPAGGNTSSAESATRTQHIVRTSRSEDHLQKESSLSAVAVDMEEDVTSSLNTLLDARPDSATPGPRSDSDERDRIVWTYNAPVSQCNGSAATSNSTSISDGMSQRSSSPLSPTSASWSALSPPHRAPPLPRAPLNGDMSLSEAVSNISSPDFQDQDDMFETGRECPRMELSDPSDSDSTILVSEPCHKRAKSNSTYSTEHGSDVTLNGDHSKEYRIVIQVKGPDKQNNSNDNVNNNNNTNYAQNGKENGHSSPENQGYQELCSGSDACSDDGSDGDSLHSFHYSPKAVDIPSAERLAKRLYNLDGFKKSDVSRHLSKNNDFSRAVAEEYVKHFEFANTTLDEALRAFLARFALSGETQERERVLVHFSRRYLECNPGAFNSQDAVHTLTCAIMLLNTDLHGCGGTFRRMSCAEFIDNLADLNDGENFPRETLKHLDSEATNEIRTAPAVGNNPFLDLPDQSRAVEYKKGYVMRKCCYDANGKKTPFGRRGWKMFYCTLRDLVLYLHKDEHGFRRSQMSDNLHNAIRIHHALATKATDYTKKQHVFRLQTADQAEYLFQTSDSKELCSWVETINFVCASYSAAPLAGAVGSQRKFQRPLLPCTHTKLSMREQLAEHEERAARLEEELAALRLARDPHSRDKDHYLVHEIKRYRTYAYVMRTRGGGIGAEENAPALPERPHNPHHAPP-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: