MonarchBase - Protein-coding gene

DPOGS211941
Transcript	DPOGS211941-TA	2868 bp
Protein	DPOGS211941-PA	955 aa
Genomic position	DPSCF300011 + 758044-771335
RNAseq coverage	141x (Rank: top 55%)

Annotation
*Heliconius*	HMEL005164	74.46%
*Bombyx*	BGIBMGA000890-TA	77.88%
*Drosophila*	snz-PA	42.11%
EBI UniRef50	UniRef50_E2AR00	50.74%	Sorting nexin-25 n=7 Tax=Formicidae RepID=E2AR00_CAMFO
NCBI RefSeq	XP_972788.1	50.39%	PREDICTED: similar to CG1514 CG1514-PA [Tribolium castaneum]
NCBI nr blastp	gi\|307199298	51.54%	Sorting nexin-25 [Harpegnathos saltator]
NCBI nr blastx	gi\|307199298	51.33%	Sorting nexin-25 [Harpegnathos saltator]

Group
Gene Ontology	GO:0004871	4.3e-16	signal transducer activity
	GO:0005515	5.5e-11	protein binding
	GO:0007154	5.5e-11	cell communication
	GO:0035091	5.5e-11	phosphatidylinositol binding
KEGG pathway
InterPro domain	[99-261] IPR003114	1.6e-31	Phox-associated domain
	[373-503] IPR016137	2e-20	Regulator of G protein signalling superfamily
	[824-929] IPR013937	5.6e-20	Sorting nexin, C-terminal
	[384-499] IPR000342	4.3e-16	Regulator of G protein signalling
	[97-264] IPR013996	1.3e-11	PX-associated, sorting nexin 13
	[649-735] IPR001683	5.5e-11	Phox homologous domain
Orthology group	MCL13046		Single-copy universal gene

Nucleotide sequence:

>DPOGS211941-TA
ATGACTAAATTTCTTCTTTATTTTCTTGTCCCCATATGCATATCATCTGTATATTATTTTTCTTTTCTTTGGAATTTTATGTACTTATCCATTCTTAGTGTTTGTCTCATAACTTGTGTTTTTGTGCTTACACTTTGTGGTCATCTCTCTTTGTCGTCTCCCCATCAAACTTCCACGTTATTGCTCGATAATATAGAGAAAGAAGCTCGACAATTGGAAACTGCAATACGGGATGATCAAAATAATTGGGTGTATGTCACGAAAAAGCCTCATCTGCCGGTTATTTTCGGTAGAACAGTTGACAGTCAACTCCAACTGCTAATAGATTATTTCATAAGGGACTTTGTAACTCAATGGTTGAAGGAGCTCTCACACAAACCAGAACCAGTCATTGACAAATTCAAAGAGCACATATGGACGGCAGTGCAGAACTTGTATGACAGACTGTTGAAAGTTGACGCTGAGAAGCTATTAGCCAATGACATGGTCACAAAAATCACACAACATTTTGAACGGATAAGGATCGCTAGAAGCTGTGCATTGGAACTAAATCAACCTCCAGTATTTGCTCTCGCCCCTCACCTGATGTCGAGCGACATGGAATTACACTACTTGAGGCAGATCAGCGAGTTCCTCGTAATGTTTCTGATGCCCAGATGCTACTCGCTCTCCCCCGTCAGTTATCTCATTAGGGAAATATTAGTGTGTAAAATTCTTCAGCCAGCCATAAATCTAGTCACGGAGCCAGATTACATAAACCAGAAGATAATACAGTATCTGGAGGCGCAGAAGGAGGTCGACGCGATGCATGTCAGAACCCACGAGTACGCCAAGACGTTCGAGGACTACATACGGCTCATAAACAGCTGTAATAATGTAGACACACTGAAGAGATTGCGTTACGACATAGTGACCCAAATCATGCAGGCCACCACTCTACAGAACGTGAAGCGGGCTAAAGGCATCGACATAGACGTTATCGAGAAAGGAGGGAACCACAATATAAGCAGACAGCAAGTGAGCGACGCCAGGAAGCTGAAGAGATACATAGACCAGCTCACCATCGCCAAGGACGAGTGCGAAAAGGCTCTAAGGAGGTTGGGGTGGGACGGAGCATTCCCAGCAGTAGAATCTGATAGTAAGGCGATGCCTCTCCACAAGGTCATATCGAGCGTGACAGGTCGCAAGTATCTGTCCATGTTCCTGGAGACTCTCTGCTCTCAAGGGCTGGTCGGTTACTGGGCGGCCGTGGACGAGCTTCGACACAGTCCGAGGAGTAACTGGCATCAGCTCGGTGCTGAGATCTTCTATACATACATCAGATCGCCCAGCGCTGAAGTTAAAGTTGACAAGGAAACCAGAAAGAGAATGGAAGGGTTTCTTCTTGGCGATAAAGGTCCGGAAGTGTTTTACGAGGTCCAAGATATAGTGGTCGATACCATACAAGACAAATATTATCATTCGTTTCTCCTAAGCGACCAGTACAAAGCTTTGGTCGCGGAACTGGCCACCGAGGAGGCGAGCGATCCAGGTTTATGCTCTGAGAGGTCTCCGATAGACGAGCGGCAGGGTTCTCGCGAGTCGTCTTCCGAAGTGAACGCCTTGACGGAACATTCCACGTACGCCAGGCGGAAGCTGGACCAGCTGCAAGAGAGACACAACAACAAAACACAGGCGTTGGCCGCCTTGCGGGCGTCGCTGAAGCCGGAGTCTCCGGCGCTGGCGATGCTGGCGGAGGAGGTGGAGCGGTTGGCCGCGGAGCAGATGAGGCTGGAGGCGCACCTGGCCAGGACCGACACCTGGGCCGAGAACCTGGGCCTGTGGCGCGCCACCGTACATAGTGCTGAGATGGTGGAGGAGTCTCGTCCCCAGTTCGTGGTGGTGGTACACGCGCTGCAGCCCGAGGAGGAGCGCGGCCCGCGGCCCGAGCAGAGGGCGGCCGGGTGGGTGCTGCTCAGGAGCGCTCACGACTTCCAGGAGCTGCACAGGAAACTGAGACCGATGTGTTCAGAATTAAAAAACTTAGAACTACCGTCGAATTCATTCAAATTCATGTTCGGGAAGAACGATAAGAACTCGCTCGAAAAAGCGAAAATGTTGATACAAAAATATTTAGAATTTGTTTTAGAAGACGACAGACTGAACCAAAGCGAAGCTCTGTACACCTTCCTGAACCCCAGCTCCGAGTATCTCAAGCAATGTGATCTGCCAAAGAAGAATAAGTTCTCATTCTCAACGCTATTTAAAAGCACGAGCAGCGACACGACCAACAGATCGTCCCAGGAGAAGGAGGGGCCGAGTCTGTCAGACGAGGACGAGATGTCCCTGTACCTGGACGGGAACGGGGAGGCGCTGAAACAGGGCGGCACCGTGAGAGGAGTGGGGCCGCTGGTGGAGGAGCGCGACAGTATCGCGGAGCCGCTGTACGCGCTGTTGAGCGAGGTGTTCGACATGAGGGGCGTGTTCCGCTGGCTGAGGAGGACCCTCGTCACCTTCGTTCAGATCACGTACGGCAGGACCATCAACAGACAGATCAAGGAGACGATCTCCTGGCTGTTCTCTGAGCAGATGCTGCACTACTACACCGGCCTGGTGCTGAAGTCCTGGTGGCCGGGGGGCGTCCTCACACACAGCAACACCAACAGGAACATACGGGACAAGGAGCACTCCCGCACGCTGGCGTTGCACCAGCTGACGGAGTTTGTCGTGGGCGGCGTGTCGTCGCTGGTGGGCGCGCACGCCGCCGCCCACGGGGCCAGCAAGCTGTTCCACACGCTGCAGCACACCACGCACAACAAACAGCTGTTCTACGAAATCTTCGAGTTGGTCCTCTTAGAAGTGTTCCCAGAACTGAAGCGTTATCAATGA

Protein sequence:

>DPOGS211941-PA
MTKFLLYFLVPICISSVYYFSFLWNFMYLSILSVCLITCVFVLTLCGHLSLSSPHQTSTLLLDNIEKEARQLETAIRDDQNNWVYVTKKPHLPVIFGRTVDSQLQLLIDYFIRDFVTQWLKELSHKPEPVIDKFKEHIWTAVQNLYDRLLKVDAEKLLANDMVTKITQHFERIRIARSCALELNQPPVFALAPHLMSSDMELHYLRQISEFLVMFLMPRCYSLSPVSYLIREILVCKILQPAINLVTEPDYINQKIIQYLEAQKEVDAMHVRTHEYAKTFEDYIRLINSCNNVDTLKRLRYDIVTQIMQATTLQNVKRAKGIDIDVIEKGGNHNISRQQVSDARKLKRYIDQLTIAKDECEKALRRLGWDGAFPAVESDSKAMPLHKVISSVTGRKYLSMFLETLCSQGLVGYWAAVDELRHSPRSNWHQLGAEIFYTYIRSPSAEVKVDKETRKRMEGFLLGDKGPEVFYEVQDIVVDTIQDKYYHSFLLSDQYKALVAELATEEASDPGLCSERSPIDERQGSRESSSEVNALTEHSTYARRKLDQLQERHNNKTQALAALRASLKPESPALAMLAEEVERLAAEQMRLEAHLARTDTWAENLGLWRATVHSAEMVEESRPQFVVVVHALQPEEERGPRPEQRAAGWVLLRSAHDFQELHRKLRPMCSELKNLELPSNSFKFMFGKNDKNSLEKAKMLIQKYLEFVLEDDRLNQSEALYTFLNPSSEYLKQCDLPKKNKFSFSTLFKSTSSDTTNRSSQEKEGPSLSDEDEMSLYLDGNGEALKQGGTVRGVGPLVEERDSIAEPLYALLSEVFDMRGVFRWLRRTLVTFVQITYGRTINRQIKETISWLFSEQMLHYYTGLVLKSWWPGGVLTHSNTNRNIRDKEHSRTLALHQLTEFVVGGVSSLVGAHAAAHGASKLFHTLQHTTHNKQLFYEIFELVLLEVFPELKRYQ-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: