MonarchBase - Protein-coding gene

DPOGS214383
Transcript	DPOGS214383-TA	1419 bp
Protein	DPOGS214383-PA	472 aa
Genomic position	DPSCF300020 + 1055197-1060421
RNAseq coverage	592x (Rank: top 21%)

Annotation
*Heliconius*	HMEL004656	0.0	79.08%
*Bombyx*	BGIBMGA004010-TA	0.0	75.28%
*Drosophila*	CG2774-PA	2e-120	49.07%
EBI UniRef50	UniRef50_B4KJL4	2e-118	50.12%	GI17151 n=5 Tax=Diptera RepID=B4KJL4_DROMO
NCBI RefSeq	XP_966953.1	7e-141	51.84%	PREDICTED: similar to sorting nexin isoform 1 [Tribolium castaneum]
NCBI nr blastp	gi\|91087199	1e-139	51.84%	PREDICTED: similar to sorting nexin isoform 1 [Tribolium castaneum]
NCBI nr blastx	gi\|91087199	2e-133	51.75%	PREDICTED: similar to sorting nexin isoform 1 [Tribolium castaneum]

Group
Gene Ontology	GO:0005515	8.8e-29	protein binding
	GO:0007154	8.8e-29	cell communication
	GO:0035091	8.8e-29	phosphatidylinositol binding
KEGG pathway
InterPro domain	[312-438] IPR015404	2.3e-36	Vps5 C-terminal
	[74-209] IPR001683	8.8e-29	Phox homologous domain
Orthology group	MCL13447		Single-copy universal gene

Nucleotide sequence:

>DPOGS214383-TA
ATGTCGGCGGAGACCGATGCACCGTTCAATAATGTGGAAATAAGTAACGAGAACCGGGAAGAGGAAGATCTATTCGCCTCGGCGGTACAGGAGGTCAGTCTAGATCCTGAAATTAATGGTACCCAAGATGGATTAGAAAAGTCAACAATAGATGACATTTCGGTTTCATCACCCGCTACTATTGGCAGTTCTATTATGGAGGAAATAGCAACAGAACGTGCTAACAATATTATAATAACAATAACCGAGCCTCAAAAGATTGGTGAAGGGATGAGCTCATATGTAGCCTACCGTGTCATCACCAAAACAAACATGCCAATCTTTAGCAAATTAGATTTTGCGGTTCTAAGGCGATTCTCCGATTTTCTAGGACTTCATGAGAAATTGACCGAGAAATACTTGCGCTCTGGTAGAATTATACCTCCAGCACCAGAAAAAAGTATCATGGGAACAACAAAGTTGAAGATGTCATCGACTCCGTCTACAGAGAGTGCTAATGGCTCACCGTCGGTTCAATCACAGTTTGTGGAACGAAGACGAGCTGCCCTGGAGAGGTTCCTGAACAGAGTAGCCCAACATCCTGTACTGTGTATTGATCCCGATTTCAGAGAGTTTTTGGAGTCTGACACTGAACTACCAAAGGCCACGAGTACCTCGGCGCTTAGTGGAGCTGGTATGCTGCGACTCTTCAATAAAGTTGGAGAAACAGTCAACAAGATCACATACAGGATGGACGAGTCCGATCCTTGGTTCGAAGAGCGCGTGGCTCGTATAGAGTCTCTGGAAAGCGGTCTACGGCGTCTGTGTGGGGCCTGTGAGGCGCTCGCTACTGAGAGACGTGAACTGGCGGGGCGAGCTCATGAGGCGGCTCGGGCCATCGCCGGATATATATACATATATTTTTTTAATATTAAAATAAACTTTGAAATTGAAGAGAATGAACAAGCCAACACAGACTTCTATGTTCTGACCGAACACATTAAAGATTATCTCGGATTAATTGGTGCTATCAAAGACGTGTTCCATGAAAGAGTTAAGGTATTCCAACACTGGCAACACTCACAAATGCAGCTAACGAAGCGGAGGGAAAACAAAGCGAAAGCGGAACTGGCCAACCGTCCGGAGAAAATCGAACAGGCCGCTAATGAAATTATTGAGTGGGAGTCGAAAGTGGAACGCGGCCAGCAGGAGTTTGATACAATGTCGAGGGTCATCAAGAAGGAACTGGAACGCTTTGAAGAGATCCGCCTCGACCAGCTCAGAGACACGCTGCTGCGGTATCTTGATGAGCATATGAAACACCAGGCACAGCTTAATCTTCATCTACAGGTAACTAAGAGCGATGCTAGCCAGTTCCATTATGCCACCGCTATTCGGTACTGGGACGCTTTCCTTCCTGAGGCCCGCGCCATCAAATGA

Protein sequence:

>DPOGS214383-PA
MSAETDAPFNNVEISNENREEEDLFASAVQEVSLDPEINGTQDGLEKSTIDDISVSSPATIGSSIMEEIATERANNIIITITEPQKIGEGMSSYVAYRVITKTNMPIFSKLDFAVLRRFSDFLGLHEKLTEKYLRSGRIIPPAPEKSIMGTTKLKMSSTPSTESANGSPSVQSQFVERRRAALERFLNRVAQHPVLCIDPDFREFLESDTELPKATSTSALSGAGMLRLFNKVGETVNKITYRMDESDPWFEERVARIESLESGLRRLCGACEALATERRELAGRAHEAARAIAGYIYIYFFNIKINFEIEENEQANTDFYVLTEHIKDYLGLIGAIKDVFHERVKVFQHWQHSQMQLTKRRENKAKAELANRPEKIEQAANEIIEWESKVERGQQEFDTMSRVIKKELERFEEIRLDQLRDTLLRYLDEHMKHQAQLNLHLQVTKSDASQFHYATAIRYWDAFLPEARAIK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: