MonarchBase - Protein-coding gene

DPOGS201345
Transcript	DPOGS201345-TA	1101 bp
Protein	DPOGS201345-PA	366 aa
Genomic position	DPSCF300176 + 738116-747266
RNAseq coverage	767x (Rank: top 17%)

Annotation
*Heliconius*	HMEL012390	3e-118	61.43%
*Bombyx*	BGIBMGA003129-TA	2e-106	83.10%
*Drosophila*	CG5958-PA	1e-69	53.77%
EBI UniRef50	UniRef50_Q9VM12	2e-67	53.77%	CG5958 n=40 Tax=Neoptera RepID=Q9VM12_DROME
NCBI RefSeq	XP_001606183.1	2e-84	67.44%	PREDICTED: similar to CRALBP [Nasonia vitripennis]
NCBI nr blastp	gi\|156554809	5e-83	67.44%	PREDICTED: clavesin-1-like [Nasonia vitripennis]
NCBI nr blastx	gi\|156554809	2e-81	67.44%	PREDICTED: clavesin-1-like [Nasonia vitripennis]

Group
Gene Ontology	GO:0006810	1.7e-12	transport
	GO:0005622	1.7e-12	intracellular
	GO:0005215	1.7e-12	transporter activity
KEGG pathway
InterPro domain	[174-359] IPR001251	7.6e-52	Cellular retinaldehyde-binding/triple function, C-terminal
	[181-205] IPR001071	1.7e-12	Cellular retinaldehyde binding/alpha-tocopherol transport
	[5-77] IPR011074	5.7e-11	Phosphatidylinositol transfer protein-like, N-terminal
Orthology group	MCL12859		Insect specific

Nucleotide sequence:

>DPOGS201345-TA
ATGAGCAGCCCTAGCGATTTTAGAATTGAAAGAAATGTCGAGCTATCAGAGGAGACGAAGGAGATCGCTGAACGTGAACTCCGGGAGACTCCTGAGCGTGTTCGGGAAGCTTTGGAAAGACTGAGAGAACTGTTGAAAGAGAACAAAGACATTTATTTCGGAGATGAAGACGAGATATTGACAATATTTCTCCGACCTTGCAAATGGTACCCCGAGAGCGCTCTGGCTTTGGGGACATTTCCTGCTGTCAGATATAACCATGTCCAAAGGTCAGTTAGGATGGGAACCATTGGACATGCAGTTATCATTGTCATAACAAAGGAACCTTTGGACGAAGCTTCTAACGACAACCAGTCAGACATAAACGGCGTGATTTTGGATCCTGATCCAGATATAATACCAACGTACACAAATTGGATGTTAATAAAACAAGTAATAGCGTTACGAGATCCAATGCGTCGGGCTGCTGATTTTAAGCGCGACAACGCGAGCTTGTTGGACGGTTTACTGCCAGAACACGAGAAGGAGGCTTTCCTGGAGCACAAAGTAGTAAACGTCATGAAGGGTCGTGATGATAAAGGAAGAAGAGTGCTCATTGTCAACGTTGGAGGTAGCTGGAACCCCAAAAAGGTGACGGCGGATCAACTGTTCAGGTTATTCTATTTAATTCACGAAGCTGCCATGTTGGAACCGGAGTCCCAAGTCCGAGGAACAGTCGTCATTATGGACTTCCACAAAATGGGCATGAGTCAGACGATGGGTCTAACGCCGGCGTTTTCTAAACGTCTGCTCACTTTCATCCAGGACGCGTTGCCTCTTAGATTGAAGGAGGTGCACTTCGTTAAAGAGCCCATGATCTTCAACATGGTTTGGAAGCTGTTCAAGCCTTTGATCAGGGAAAAGTTGAAGGGCAGGATCTTCTTCCACGGCAGCAACATGTCATCTCTACATAAGCATTTGGCTCCGAGTCATTTGCCCGCGGACTACGACGGTGTCCTGGGCCCCATAGACTACTCGGGCGCCGACTGGTACCCCGTCGTCAACGAGGTGCTCCCGCACATACAGAACTGGAACTCGTACGGTTATGTCAAGAAGGAATGA

Protein sequence:

>DPOGS201345-PA
MSSPSDFRIERNVELSEETKEIAERELRETPERVREALERLRELLKENKDIYFGDEDEILTIFLRPCKWYPESALALGTFPAVRYNHVQRSVRMGTIGHAVIIVITKEPLDEASNDNQSDINGVILDPDPDIIPTYTNWMLIKQVIALRDPMRRAADFKRDNASLLDGLLPEHEKEAFLEHKVVNVMKGRDDKGRRVLIVNVGGSWNPKKVTADQLFRLFYLIHEAAMLEPESQVRGTVVIMDFHKMGMSQTMGLTPAFSKRLLTFIQDALPLRLKEVHFVKEPMIFNMVWKLFKPLIREKLKGRIFFHGSNMSSLHKHLAPSHLPADYDGVLGPIDYSGADWYPVVNEVLPHIQNWNSYGYVKKE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: