MonarchBase - Protein-coding gene

DPOGS203250
Transcript	DPOGS203250-TA	1638 bp
Protein	DPOGS203250-PA	545 aa
Genomic position	DPSCF300210 + 119329-146954
RNAseq coverage	1346x (Rank: top 9%)

Annotation
*Heliconius*	HMEL005830	1e-154	99.60%
*Bombyx*	BGIBMGA004647-TA	5e-48	43.50%
*Drosophila*	step-PD	0.0	83.66%
EBI UniRef50	UniRef50_Q17HL6	5e-180	81.41%	Cytohesin 1, 2, 3, 4 (Guanine nucleotide-exchange protein) n=5 Tax=Metazoa RepID=Q17HL6_AEDAE
NCBI RefSeq	XP_002432546.1	0.0	85.11%	Cytohesin-1, putative [Pediculus humanus corporis]
NCBI nr blastp	gi\|307167289	0.0	76.94%	Cytohesin-1 [Camponotus floridanus]
NCBI nr blastx	gi\|307167289	0.0	76.94%	Cytohesin-1 [Camponotus floridanus]

Group
Gene Ontology	GO:0032012	4.2e-97	regulation of ARF protein signal transduction
	GO:0005622	4.2e-97	intracellular
	GO:0005086	4.2e-97	ARF guanyl-nucleotide exchange factor activity
	GO:0005515	1.5e-40	protein binding
KEGG pathway	ath:AT3G43300	4e-43
	K13462 (MIN7)	maps->	Plant-pathogen interaction
InterPro domain	[205-390] IPR000904	4.2e-97	SEC7-like
	[281-397] IPR023394	2.3e-50	SEC7-like, alpha orthogonal bundle
	[404-526] IPR011993	1.5e-40	Pleckstrin homology-type
	[407-523] IPR001849	1.5e-22	Pleckstrin homology domain
Orthology group	MCL10570		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS203250-TA
ATGATAAGTGAATTCGAAAATTTGTCTCTCGGAGGAAATAATGCTGCGAGTAATCATGGGGATCCTTTTACACATACGGAGCTGACACCGGAGCAGCAAAAAACCTTAATAGATATACGACGCCGAAAAACTGAACTACTGCTAGAAATACAGGTAGTTGTCACGGTGCCAAAGACGGTGGCGCACGCGGCTCTCTTCAGTCGAGTGCGTTCCTTAGCGGGAAGTGTATGGCGCGCGATGTGTTTACATTTTCGGCTGCTGTGCGGGGCGCTCTGGTGGCCGGTGCTGATGCGCTGCGCTCGCGCAGCACGCTCCTATGACGACGATTACGATCAGGCCGTGCCCGTGGCCGCCGAAGAGGAGCGCCGTGGTTCAGTGTCTAATTGGTTCTCGTCTTTGAGACGGGGCGGTCGCCGTAAACGTGAAGACAGCGCCGTGCCGACTGTTACTGTCGGTTACGGTTCATTAGGCAGGCGGAAGGATGGCGGCCAGGCACGCGGGAAGACGAGATCGGCATGGGATCTCACCACCGTCACCAGGCTGCAACTTAAAGATGAGCTCGGCGAGGTGGTGGCCGAACTGGAAGCCCTCGATGGACAGGAGGAGTGCAAACAGAACAGCAAAGCCAAACAGATGAGCATAGGAAGGAAGAAATTTAATATGGACCCTAAGAAAGGAATCGAATATCTGTACGAGAATGGTTTATTACAAAGGACAGCGGAGGACGTGGCACAGTTCCTTCACAAGGGCGAGGGTTTGAGTAAGACGGCTATAGGGGACTATCTGGGGGAGAGATCAGACTTCAACGAGGCTGTGCTCAGAGCTTTCGTGGAACTTCACGATTTCACGGACCTCATACTAGTTCAGGCTTTGAGACAATTCCTATGGTCTTTCCGTCTACCGGGCGAGGCTCAGAAGATAGACCGTATGATGGAGTCGTTCGCCCAGCGCTACTGTCAGCTCAACCCTGACATATTCACCAACGCCGACACGTGCTACGTGCTCAGCTTCGCCATTATAATGCTGAACACGTCGCTACACAACCCCAGCGTGAAGGATAAACCATCGCCCGAACAGTTCGTCGCCATGAACAGGGGCATCAATAACGGAGGGGATCTACCGCAGGAACTGCTCTTGTCTCTATACGAGTCTATAAAGACGGAGCCGTTCAAGATACCAGAGGACGACGGGAACGATCTGATGCATACCTTCTTCAACCCGGACAAGGAGGGGTGGCTTTGGAAACAGGGCGGAAGGTATAAATCATGGAAGAGGCGATGGTTCATATTGAACGACAACTGCTTGTACTACTTCGAGTACACCACTGACAAGGAGCCGCGGGGGATAATACCGCTGGAGAACATATCAGTCCGTGCAGCGAGCGACCGTCAGCGTCCTCACTGCCTGGAGCTGTACGCGAGTGGTGGCGCGGATCTCATCAAGGCTTGTAAGACTGACTCCGAAGGGAAAGTTGTGGAAGGGAAACATACAGTATACCGCATGTCAGCGGCCACGGCTGAGGAACGCGACGAATGGATAGAATGCCTCAGACGGTCCATCAGTCACAACCCGTTCTACGACATGCTGGCACAGAGGAAGAAAAAGGCACAACACAACCTTCACTCAGGATCACACTAG

Protein sequence:

>DPOGS203250-PA
MISEFENLSLGGNNAASNHGDPFTHTELTPEQQKTLIDIRRRKTELLLEIQVVVTVPKTVAHAALFSRVRSLAGSVWRAMCLHFRLLCGALWWPVLMRCARAARSYDDDYDQAVPVAAEEERRGSVSNWFSSLRRGGRRKREDSAVPTVTVGYGSLGRRKDGGQARGKTRSAWDLTTVTRLQLKDELGEVVAELEALDGQEECKQNSKAKQMSIGRKKFNMDPKKGIEYLYENGLLQRTAEDVAQFLHKGEGLSKTAIGDYLGERSDFNEAVLRAFVELHDFTDLILVQALRQFLWSFRLPGEAQKIDRMMESFAQRYCQLNPDIFTNADTCYVLSFAIIMLNTSLHNPSVKDKPSPEQFVAMNRGINNGGDLPQELLLSLYESIKTEPFKIPEDDGNDLMHTFFNPDKEGWLWKQGGRYKSWKRRWFILNDNCLYYFEYTTDKEPRGIIPLENISVRAASDRQRPHCLELYASGGADLIKACKTDSEGKVVEGKHTVYRMSAATAEERDEWIECLRRSISHNPFYDMLAQRKKKAQHNLHSGSH-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: