MonarchBase - Protein-coding gene

DPOGS208188
Transcript	DPOGS208188-TA	3204 bp
Protein	DPOGS208188-PA	1067 aa
Genomic position	DPSCF300207 + 254189-274386
RNAseq coverage	888x (Rank: top 14%)

Annotation
*Heliconius*	HMEL015712	0.0	57.67%
*Bombyx*	BGIBMGA010124-TA	0.0	63.29%
*Drosophila*	Sema-5c-PA	1e-179	37.09%
EBI UniRef50	UniRef50_F4W964	0.0	39.94%	Semaphorin-5B n=6 Tax=Myrmicinae RepID=F4W964_ACREC
NCBI RefSeq	XP_394067.2	0.0	39.15%	PREDICTED: similar to Sema-5c CG5661-PA [Apis mellifera]
NCBI nr blastp	gi\|328783402	0.0	39.41%	PREDICTED: semaphorin-5A [Apis mellifera]
NCBI nr blastx	gi\|328783402	0.0	39.41%	PREDICTED: semaphorin-5A [Apis mellifera]

Group
Gene Ontology	GO:0005515	1.1e-110	protein binding
	GO:0016020	1.8e-10	membrane
	GO:0007275	1.8e-10	multicellular organismal development
	GO:0004872	1.8e-10	receptor activity
KEGG pathway	ame:410589	0.0
	K06841 (SEMA5)	maps->	Axon guidance
InterPro domain	[40-473] IPR015943	1.1e-110	WD40/YVTN repeat-like-containing domain
	[24-473] IPR001627	1.9e-106	Semaphorin/CD100 antigen
	[629-690] IPR000884	1.1e-14	Thrombospondin, type 1 repeat
	[474-528] IPR016201	1.8e-10	Plexin-like fold
	[474-521] IPR003659	2.7e-06	Plexin/semaphorin/integrin
	[143-173] IPR013103	2.9e-06	Reverse transcriptase, RNA-dependent DNA polymerase
Orthology group	MCL11412		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS208188-TA
ATGAGTGTAATATACAAAGTGACAGCGATCATCTTGCTTGGAGCTCTCAGCAAGGGGGAGTTACCGGAAGACGAATTTAGGATAATTAATAGACAAGACCTGCTGGCGTCTGATAGCGATGTCTTTGAAGATAACACCAGCAAATCATTTTCACAGCTGTTGTTCGATGTAGCGAGAGACCAAGTTATAGTGGGTGCTAGAGACACGTTATACCGTTTGTCGCTACGCGGTCTCAGGGAACTTGAGCGTGCGAATTGGCCCGCACCAGAGGGTAAGACGAAATTGTGTCAAGACAAGGGTCAGACTGAAGACAGTTGCCGCAATTACATCAAAGTATTGCTCTCTTACGGGCACAAGCTGTTCGCGTGCGGCACAAACGCTTTCAGTCCGATGTGCAGTTGGAGGGAGGTGTGGGCTTATTCCGGTGATAAAAAAATTGTAAACCTAAATAAAGCATTATATGGTCTTAAAAATTCACCCAAGTGTTGGAACACCAAATTTAATTCTGTAATTAGTAGAGAGAGGAAGGGTGGCGCCACTGTGCCTTTGAGTCGTGGCGCTTCGCCTCGTGAGACTGGTATGTTGAGAACAACCCAGTATGACCTGAACTGGCTCAACGAACCGCAGTTCGTGGGCAGTTTTGAAGACGACTACTTCGTATACTTCGTTTTTAGAGAAGTCGCAGTGGAATATCTTAATTGTGGAAAGACAATATACTCTCGTATAGCGCGTGTATGTAAAAATGACTCGGGCGGCCATCTTGTTATGAAAGACAATTGGAGCACCTTCCTCAAGGCACGTCTCAAGTGTCCCGTGCCAGGGGACGTGCCGTTCTACTACGATGAGGTCCAGAGCGTTGAATATTTGGCCCAAGAGAAAATTCTTGTAGCGGTCTTTACTACACCCACAAACAGCATAGCCGGTAGTGCCGTGTGTATATACAACATGTCAGACATACAGATGTCCTTCGAGGGTCAGTATAAGGTTCAAAACTCACCGACCTCTACTTGGGAACCCCTGACACCAACGAGAGAAGCCAGGGAACACTTTAGATGCAACCCTGATCCCAGACCCCATCACAGTATGGAGTACCACAAGTATCATTTAATGTACGAGGCCATACAGCCGATATCGGGCGAGCCGGTGTACAAAGCCATACTAGAAAGATTCACCCACGTCACAGTAGATGTTGTCACGACAAAAAATATCGCCAAGCAATTGGTCGTGTTCGTTGCAACCGAGAACAGTGATGTGCTGAAACTGGCGATACTGCCGCGGTACGAGGGCGCCTGCCTGGTCGAGATATGGAAACTCAAGGACTCTAGAGGCGGATACAACATACAGAACATGCAGTTCGTGAAAGATACGATGTCGCTGTACATCGGCAGCGACACGGGCGTGCTGCGTCTATCGAGCGAGCGCTGCAGCCGCTACAGGAGTCGGGCGGGGTGTGTGGGGGCCGCGGACCCGCACTGCGGCTGGGACGACGGCCGGGAACAGTGTGTGAAGAGTTCACAACACTTGAGAGGAGCTTCCTTTGTGCAGTCCACAGCCAGCTGTCCCGCTGATAACAGTCAAGTGGATGGCGGCTGGTCGTCGTGGTCGGAGTGGGAGCCGTGCATGCAGGATGAGTCCACGCACGTTGTGTACGGAGACGACAAACCCGACATGTGCATGTGTCGCACCAGGAGTTGTGACAACCCTAGACCCGCCAACGGGGGGCAACCCTGTCAAGGTACTTATCCGCTCATTTTTATCGATATTGTGACTGCTCATTTTTATCGATATTCAGATTGCACTATCATCAAACTCAAACATCATCAACCATTGAACGATGAATATAAAACTAGATTTCTATGTAGGCTTCGGTTCGTTAATCCGGCCCTCGCTTCGATAGACGGGTCGTGGTCCCCTTGGGGCCCGTGGTCGGCATGCACCGGCGCAGGTTGTGGTGTGGGCGGGGGGACTCGCGAGCGACGCCGGGTCTGTGGGAGCCCCGCCCCTCGACACGGGGGAGCCGATTGCGAGGGGCCTCGCTTTGAAAGACAGTCTTGTGACCTACGACCATGCGAGGTCAGAAAGGCGACCGCTTGGACCCCGTGGGTGCAAATACCAAGCAACACTTCTGACGGTAGTTACACCGAGAAGAGATTTAAGTTCCTATGTAAGGCGCCCGCACCGGAACAAATCAGGTTATCTCTCGCCCGTGAGGAGGAACGCTATTGTAATCCTCGTGGGGTATGTACTAGTACACCTCCTGAGGAGGATCCGTCGTTTGACGGCTGGGGGCCCTGGGAGGCCTGGGGGGCCTGCTCCGCTGTCTGCGGCGGGGGCCAGCAGCAACGGACACGTCACTGCCGAAGGCCCCCCTGTACGGGGACCGCGGATATGCTGAGGCCATGCAATACGCATGCTTGTCTTGGCGAATGGTCATGCTGGAGTGAGTGGAGCGAGTGTAGCGGTGGATGTGACTCCACCGGCCACCGAACCCGCACCCGTATGTGCGTGTCGCCGCAGGGCTGTGTCGACGCCGGGGCCGCCCTGGAGAGACGCGCCTGTGTCAACACATGCACCGAATCAGAGAGTGGTTGGGGGGCCTGGGGGGCCTGGAGTGAGTGCGAGGGCGGTGAGAGGGTGAGGCGGCGCAGTTGTGAGTCGGGGGCCTGCGTGGGGGCCCAGCTGCAGGCGGCCAAGTGTGGAGACGATGATATGGATAATGAGTTATATGCGATGCCGGCATACAGTCAGAATGTTGAGAGCGCTTCCTTTGTAACAATGTCCAGCGAACCTCTCGGTGTTGGGGGCATTGTTGGCTGTGTCGTCGGAGCTTTTGTTATGGGTTGTCTATTATGTCTGGGGGTGGTGGTGGCGTGTTACCGTCGTCCGTGGAGGTCGGCAGCGCGCGTGCCGTCCAGTCCGCATTACATCACCGCTAAACAGAACAGCTATGTCACAGTGCCGCTTAAAGATGTGCCGCGTAAAGCTAAGCGCCAGCCATCATTCTCGGGTCTTGGCAACAGTAGTGGCATCCTCGTTAAAAGCAATAACTTGTCTAACGCCAACCACAACAACACTATGGCCACCCCCAAACTATATCCCAAGGCCATCGCCAATGAGTACGACTCAATGGGAACATTGCGGAGACATTCCAACCAACCGAACAACAAAACTAATATTGATATTGAAGAGGATAAGTTCTATTGA

Protein sequence:

>DPOGS208188-PA
MSVIYKVTAIILLGALSKGELPEDEFRIINRQDLLASDSDVFEDNTSKSFSQLLFDVARDQVIVGARDTLYRLSLRGLRELERANWPAPEGKTKLCQDKGQTEDSCRNYIKVLLSYGHKLFACGTNAFSPMCSWREVWAYSGDKKIVNLNKALYGLKNSPKCWNTKFNSVISRERKGGATVPLSRGASPRETGMLRTTQYDLNWLNEPQFVGSFEDDYFVYFVFREVAVEYLNCGKTIYSRIARVCKNDSGGHLVMKDNWSTFLKARLKCPVPGDVPFYYDEVQSVEYLAQEKILVAVFTTPTNSIAGSAVCIYNMSDIQMSFEGQYKVQNSPTSTWEPLTPTREAREHFRCNPDPRPHHSMEYHKYHLMYEAIQPISGEPVYKAILERFTHVTVDVVTTKNIAKQLVVFVATENSDVLKLAILPRYEGACLVEIWKLKDSRGGYNIQNMQFVKDTMSLYIGSDTGVLRLSSERCSRYRSRAGCVGAADPHCGWDDGREQCVKSSQHLRGASFVQSTASCPADNSQVDGGWSSWSEWEPCMQDESTHVVYGDDKPDMCMCRTRSCDNPRPANGGQPCQGTYPLIFIDIVTAHFYRYSDCTIIKLKHHQPLNDEYKTRFLCRLRFVNPALASIDGSWSPWGPWSACTGAGCGVGGGTRERRRVCGSPAPRHGGADCEGPRFERQSCDLRPCEVRKATAWTPWVQIPSNTSDGSYTEKRFKFLCKAPAPEQIRLSLAREEERYCNPRGVCTSTPPEEDPSFDGWGPWEAWGACSAVCGGGQQQRTRHCRRPPCTGTADMLRPCNTHACLGEWSCWSEWSECSGGCDSTGHRTRTRMCVSPQGCVDAGAALERRACVNTCTESESGWGAWGAWSECEGGERVRRRSCESGACVGAQLQAAKCGDDDMDNELYAMPAYSQNVESASFVTMSSEPLGVGGIVGCVVGAFVMGCLLCLGVVVACYRRPWRSAARVPSSPHYITAKQNSYVTVPLKDVPRKAKRQPSFSGLGNSSGILVKSNNLSNANHNNTMATPKLYPKAIANEYDSMGTLRRHSNQPNNKTNIDIEEDKFY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: