MonarchBase - Protein-coding gene

DPOGS214494
Transcript	DPOGS214494-TA	4635 bp
Protein	DPOGS214494-PA	1544 aa
Genomic position	DPSCF300122 + 276215-294922
RNAseq coverage	228x (Rank: top 44%)

Annotation
*Heliconius*	HMEL013930	1e-173	73.25%
*Bombyx*	BGIBMGA013394-TA	0.0	77.61%
*Drosophila*	CG8683-PB	0.0	46.44%
EBI UniRef50	UniRef50_E2BVY3	0.0	52.78%	Protein MON2-like protein n=10 Tax=Formicidae RepID=E2BVY3_HARSA
NCBI RefSeq	XP_393240.3	0.0	51.45%	PREDICTED: similar to MON2 homolog [Apis mellifera]
NCBI nr blastp	gi\|242005433	0.0	48.81%	guanine nucleotide-exchange, putative [Pediculus humanus corporis]
NCBI nr blastx	gi\|242005433	0.0	48.64%	guanine nucleotide-exchange, putative [Pediculus humanus corporis]

Group
Gene Ontology	GO:0005488	1.8e-13	binding
KEGG pathway	sbi:SORBI_02g036510	5e-22
	K13462 (MIN7)	maps->	Plant-pathogen interaction
InterPro domain	[780-1341] IPR016024	1.8e-13	Armadillo-type fold
	[874-951] IPR015403	5.2e-10	Domain of unknown function DUF1981, SEC7 associated
Orthology group	MCL13346		Single-copy universal gene

Nucleotide sequence:

>DPOGS214494-TA
ATGGCTTTTGTCAGTGCTGTTACCGGCGATGACTCCACGAAGAAATTCATGGATGTCTTACAAAATGATTTCAAAACTCTCAGCTTAGAAACCAAGAAAAAATATCCTCAGATAAGAGAGGCTTGTGATGAAGCCATAGAAAAACTAGCTTTGGCATCAAATAATCCACAAGCCTCGCTGTATGGTGTTGTGAACCAAATCCTGTATCCATTAGTCCAAGGATGTGAATCAAAAGACGTCAAGATTATTAAGTTCTGTCTCGGAACTATTCAGCGATTGATAGCCCAACAGGGAATAGATGCAAAAGGTGCTCGGCACATAGTGGACTGTCTGTACAACCTCGGCCATTCGGGAATGTTGGAATTAAAGTTACTACAAACAGCCGCATTATTGATGACAACCTCCGATCTAGTTCACGGAGACACCTTGGCCAGGACTATGGTTCTCTGTATACGAATGGTGTCTACTACTGAGACTCGGGATATCAGTACAAGTCACGCGGCTGTGGCCACAGTACGACAGCTTGTAGCACTTGTCTTTGAAAGAGCTTTAGCGGAAGCTAACGGAACGTTAAAAGTAAATCCAGCGGATGTGAGAATACAAGCAAACAGCAAAGCGCCTAAAGAGTTGAAACCGTGTGCTGTTGATGCATATCTTATATTACAAGATATAATACAATTGATAAACGGTGACGCTGCTAACTGGCTTGTGGGAATATCAGATGTACCAAAGACCTTCGGATTAGAGCTCCTTGATACAGTATTGACAGATTTTTCTGATGTTTTCTTTAAGATTTCAGAATTCCGTTTCCTGTTGAAGGAGCATGTGTGCGCATTAATTATAAGATTGTTCTCGCCTAATGTTAAGTACCGGGCTGCCTTCCCGTCTCCCCACATCCCGGGCGGCGGCGCGGCCCCGGGGGCGGAGCGGCCTCATTTTCCGGTGACCATGCGACTGCTGCGGCTCGTGTCGGTCATCGTACATAAGTATCACGACGTACTGATGACCGAGTGCGAGATCTTCTTATCCCTGAGCATCAAGTTCCTTGATCCTGATAAGCCGCTATGGCAGAGGGCGCTGGCGCTGGAGGTTCTACATCGGATGACCGTACAGCCTGATCTACTGAAAGCGTTTTGCGAATGCTACGACATGAAGCCGCACGCGACCAATATATTTCAAGACATAGTGAACGCTCTCGGAGCGTATGTGCAGAGTCTGTTCGTGGCGTCCCAGGTCAATACTTCAGCCGGCTCATCGAGTATCCCTCAACAGGCTGGTTTCTACTGGAAGGGAGTCTGGTTACCGCTGTGTGTGACCTTCGAACCGGGCGTGGCGAAATCTGTATATATAGAGATGTTGGACAGGACGGAGGCGCCCAGCATCCAGGAAGGCTACGGCATCTCGGTCGCTTACGCCTGCCTCGTCGAGATAATACGCTCCATAGCTATCACCATCGAGGGAGAGGAGTACTTTAGACTTCAAGAACTCTACGACGATACACAGAACGACGACGAGAAAGAGGTTAATTCGAATAGGACGACTAATAATAATATGAAAGATAGTAATAGTAAAGCGGACACCAAGGAGTTAATAAACAACGGTCATTCTACCGCGGACCAAAACTCTAACGTGATGAAAATACAACCAGACGACGAGGACAGGGAGAGACAGCTGAAACTACAGCTGATCAAGTCATCGTGGTGTGGTCTAGTGTGGGGACTGTCGGTGCTAGCGGAGGCCAGCATCGGGGAGTTGGAGCACGTGCTGCGAGCCGTGCAGACCCTGGCTAGAGTTAGTGGGAAGATGGGCGTGACCAACGCGCGTGACGCATGCGTGGGCGCATTGTGTCGGTGTGCGTTGCCCGCGCAGTACTGTGTCCCTGTCCTGGGCGCTCTGGCCGCCCTGGCGTGTCCCTGGCCCGGGGCCCGACCCCCAGCCCCCGCCCCGGACCTAAGACACCACGTGGTGTGGGTCGGCACCCCGCTTCCGTGCTCGCAGCCGACAGGTCAGCAGCAGTCGTTTGTGATGGTGACGTCACGCCACGTGTCCGCCCTGAGAGCACTGTTGACGGCTGCCGCTCGGGACGGAGACGCCCTGCAGCACGCCTGGCTGCCGGTGCTGACCACGTTGCAGCATCTGGTGTGGATCCTGGGTCTGAAGCCGTCTACCGGCGGCAGTATGAAGGCGAGTCGGGCGAGCGCTGACGCCAACGCTGTCATGAGCACGTCCGCGGTCATGGCCGACCTGCCGGGTCAGCAAGTCCCCGTGGCGGAGTCGCTGGGTGTGATGAGCGCGTTGTCGGCCATGTTGTCACGTGTTTTCGAAGCGTCCAAGAACTTGGATGACGTGGCCCTTCATCATCTGATCGACGCGTTATGCAAGCTGTCCAACGAGGCGATGGAGTTGGCTTATTCTAATAGGGAGCCGTCCCTCTTCGCTGTGGCCAAATTGTTGGAGACGGGTCTAGCCAACATGCACCGCATAGAGGTCATGTGGAGACCCATCACGAATCATCTCCTGGAGGTCTGCCAGCACCCTCACATCAGGATGCGGGAGTGGGGGGTGGAGGCCATCACCTACCTGGTGCAAGCGGCCTTCCAATACCATCACAATCATCCTGAACTCGTCACTGAGGCCCGTGAGCGTCTGGTGCTAGAACCTCTGGGAGAGCTGTGCTCCGTTCGTCACTGTGACGTAAGAGCTAGACAGCTGGAGTGTGCTGCGAGACTGCTCCACTCCAGAGGCGACCAGCTGGGAGCCGCCTGGCCGCTCATGATGGAGATCATATCGGCTATCGGCGACCATCATAGTGAGCAACTGGTGCGCTCAGCGTTCCAATGCGCCCAGCTGGTGGCGGGTGACCTCCTGGGATGTGCAGGTCCCAGGTGTCTCCGACGAGTGCTGGCCGCTGCGGCCGCCTTCGCCAGACAGACCAAAGAATTGAATATCAGTCTCACAGCTGTAGGACTGATGTGGAACATCTCGGACTACTTGTACCACAACCGCGACAAGCTGTCAGCGGCGCTGGTCAACGAGTCGGTGCCGGATGTCCAACCCGACCTTCCGCCTCTGGATCGACTGTGGATGTGTCTCTACATACGACTCAGTGAGCTGTGCACGGAGGCCCGGGCCCCGGTCCGTCGCGCCGCCAGCCAGACCCTGTTCAGCTGTATCGGTGCTCACGGGTCCCTGCTGGGCCGGCCCGCCTGGCGATCACTCCTGGCCGTGCTGTTCCCCATGTTGGACCAGGTCCGGAGGCACTCGGACGTGGCCAGTTCGGAAAAGGTGGACACGGGGGAAGTGTTGACGTTGTCCGGGGTGTCCCGCGTGTTCCACTCCAGGTTCCAGCTGTTAATGACTGTTGGTGACTTTATCCGCTCGTGGGTCGCTCTACTAGACTACATCACAGATTTCGCGCTCAGACGAAGTCACGAGGTGTCGGTGGCTGCTCTCAAGTCGTTCCAGGAGGTGGTGTCGGCTGCAGGTCGAGCGGAGGGCGAGGTCCCGCGCCGCGTGTGGTCGGCCGCCTGGAACGCCTGGACGGCCATCGCCACGGGGCTCGCGACTCCGCCTGGGTGTGTGGACGACAAGCCCGCGGAGCTGTTCTCACCGTCGCTGAACTTCCTCACCACCCTGTCACAACGATATCCTACACGTCCCCAGGAAGCGTTGGTCCGTCACGAGTTACTGCCAGCTATGTTTGGTGCCCTGACGTGTCTCGCGGCCGCCGCCTCCGAGCAGCCCTCCGCGGCCGTGCGCTGCCTGGCCGCGGCCGCCAACCTGTACCGAGCGGCGCCCGCTCCCAGCGCGCACCAACTGCCTACACTCATGAAGGCGCTACACTCGGCTGTCCGCCTGTGTCCGGAACGACGTCGCAACGAGCGAGACAGAGAGGGAGGGGACGAGCCCGCGCACACCACCGCCCTCTTGTTACAGGTGCTAGCGACGGGGCTGCCTCTAGCGCGAGAGCATCCAGACGATTACAGCGAGTTCTGGGAGATGCTGCCCGAAGTACTGGAGACATTCATGTTCGAACCGCCAGTGGGTGGTAGCGCTCAGGCTTGTGAGGTGGTGGGTGTGATCCGAGATGAAGTGCTGCGAGGGATCCCGCGACCTCCTCAGCGACCGGCGACAAGACTGCTGGCGCTCGTGAGGGCTGGTTCCATGCATCACACCAGACCTCACACTGTACTCACTAGAGATCAGAACGAGCAAGAGTTGAAGGAGAGAGAGGAGTTTGCTAGAACATGTTTCGAGACTCTGCTACAGTTCTCTATGCTGGAGGACATGGACACACTCACCACCGCTGAAAACGACAGCGATCCCCTGGCGATAATGCCTCTACTGGACCGCTTCCAGGAAGTTATAGCGAAGTACAGTAGAGACGAGGAGAGTACGGAACCTATACCCAGACAACAAGTGTCCGAGGTGTCGTTCGTCCTGCGGGCGGTGGCGTCTCTAGCCGGTGCTATGTTGAGGGCGCCGCGAGGGAGAGTCGACGAGGCGGCCTGGGAGAAACTTATCGGCGTGTATCCGTCACTCGTCCGTCTGTCAGGCGGGGCGCGGGCGGGGGCGGCGGGGGCAGCCCTGAGGGAAGCCCTGATGCAGTTCGGAGCGCTACTGGCGCCGCCCTAG

Protein sequence:

>DPOGS214494-PA
MAFVSAVTGDDSTKKFMDVLQNDFKTLSLETKKKYPQIREACDEAIEKLALASNNPQASLYGVVNQILYPLVQGCESKDVKIIKFCLGTIQRLIAQQGIDAKGARHIVDCLYNLGHSGMLELKLLQTAALLMTTSDLVHGDTLARTMVLCIRMVSTTETRDISTSHAAVATVRQLVALVFERALAEANGTLKVNPADVRIQANSKAPKELKPCAVDAYLILQDIIQLINGDAANWLVGISDVPKTFGLELLDTVLTDFSDVFFKISEFRFLLKEHVCALIIRLFSPNVKYRAAFPSPHIPGGGAAPGAERPHFPVTMRLLRLVSVIVHKYHDVLMTECEIFLSLSIKFLDPDKPLWQRALALEVLHRMTVQPDLLKAFCECYDMKPHATNIFQDIVNALGAYVQSLFVASQVNTSAGSSSIPQQAGFYWKGVWLPLCVTFEPGVAKSVYIEMLDRTEAPSIQEGYGISVAYACLVEIIRSIAITIEGEEYFRLQELYDDTQNDDEKEVNSNRTTNNNMKDSNSKADTKELINNGHSTADQNSNVMKIQPDDEDRERQLKLQLIKSSWCGLVWGLSVLAEASIGELEHVLRAVQTLARVSGKMGVTNARDACVGALCRCALPAQYCVPVLGALAALACPWPGARPPAPAPDLRHHVVWVGTPLPCSQPTGQQQSFVMVTSRHVSALRALLTAAARDGDALQHAWLPVLTTLQHLVWILGLKPSTGGSMKASRASADANAVMSTSAVMADLPGQQVPVAESLGVMSALSAMLSRVFEASKNLDDVALHHLIDALCKLSNEAMELAYSNREPSLFAVAKLLETGLANMHRIEVMWRPITNHLLEVCQHPHIRMREWGVEAITYLVQAAFQYHHNHPELVTEARERLVLEPLGELCSVRHCDVRARQLECAARLLHSRGDQLGAAWPLMMEIISAIGDHHSEQLVRSAFQCAQLVAGDLLGCAGPRCLRRVLAAAAAFARQTKELNISLTAVGLMWNISDYLYHNRDKLSAALVNESVPDVQPDLPPLDRLWMCLYIRLSELCTEARAPVRRAASQTLFSCIGAHGSLLGRPAWRSLLAVLFPMLDQVRRHSDVASSEKVDTGEVLTLSGVSRVFHSRFQLLMTVGDFIRSWVALLDYITDFALRRSHEVSVAALKSFQEVVSAAGRAEGEVPRRVWSAAWNAWTAIATGLATPPGCVDDKPAELFSPSLNFLTTLSQRYPTRPQEALVRHELLPAMFGALTCLAAAASEQPSAAVRCLAAAANLYRAAPAPSAHQLPTLMKALHSAVRLCPERRRNERDREGGDEPAHTTALLLQVLATGLPLAREHPDDYSEFWEMLPEVLETFMFEPPVGGSAQACEVVGVIRDEVLRGIPRPPQRPATRLLALVRAGSMHHTRPHTVLTRDQNEQELKEREEFARTCFETLLQFSMLEDMDTLTTAENDSDPLAIMPLLDRFQEVIAKYSRDEESTEPIPRQQVSEVSFVLRAVASLAGAMLRAPRGRVDEAAWEKLIGVYPSLVRLSGGARAGAAGAALREALMQFGALLAPP-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: