MonarchBase - Protein-coding gene

DPOGS203614
Transcript	DPOGS203614-TA	1599 bp
Protein	DPOGS203614-PA	532 aa
Genomic position	DPSCF300063 + 159143-168316
RNAseq coverage	633x (Rank: top 20%)

Annotation
*Heliconius*	HMEL017327	0.0	77.22%
*Bombyx*	BGIBMGA007281-TA	0.0	77.80%
*Drosophila*	l(2)01810-PA	2e-138	50.65%
EBI UniRef50	UniRef50_B2DBK3	0.0	89.37%	Similar to CG5304-PA n=3 Tax=Papilionoidea RepID=B2DBK3_9NEOP
NCBI RefSeq	XP_001809051.1	1e-141	52.39%	PREDICTED: similar to sodium-dependent phosphate transporter [Tribolium castaneum]
NCBI nr blastp	gi\|183979298	0.0	89.37%	similar to CG5304-PA [Papilio xuthus]
NCBI nr blastx	gi\|183979298	0.0	89.71%	similar to CG5304-PA [Papilio xuthus]

Group
Gene Ontology	GO:0055085	6.5e-54	transmembrane transport
	GO:0016021	6.5e-54	integral to membrane
KEGG pathway
InterPro domain	[1-483] IPR016196	3.9e-80	Major facilitator superfamily domain, general substrate transporter
	[49-447] IPR011701	6.5e-54	Major facilitator superfamily
Orthology group	MCL10166		Insect specific

Nucleotide sequence:

>DPOGS203614-TA
ATGACTGACCTAAATCAAATACAAGCCCACAACTTACTTGGCTTAAAGAACCAGCCAAGAAAACCGAAGGACACAGCTTTTACGAGAGCTTTGCGATCATGTTGTGTCATACCCCAAAGGTACATTCTAGGAGTTATGGGACTTTTGGGCGTGTGCAATGCGTATACAATGAGAGTCTGTTTGAACTTGGCAATTACACAAATGGTCAATAAGACCAAAAGTGGCACAGAACATTTTGATCCCGACGCATGTCCAAGTGATATTGAAGATTCTAATTCCACAAATATTCTACGACCATACGCGACCTTTGATTGGGATGAAAAAACTCAAGGTTTAATTCTAAGTGGATTTTACTACGGGTATGCAGCGACTCAAGTACCTGGTGGATATTTAGCTGAGAAGTTTGGAGGAAAATGGACATTAGGAATTGGTTTACTTAGTACCGCTTTATTTACTTTTCTAACACCAATAGTTATCAGAGCTGGAGGGGCGACATGGCTCTTTATACTGCGGGTCTTGCAAGGAATGGGGGAAGGTCCGACGATGCCAGCTTTAATGATAATGTTAGCGAGATGGGTGCCACCGCATGAACGTTCGTTTCAAGGGGCCTTAGTATTTGGCGGTGCACAAATAGGAAATATATTTGGCTCTTTCATGTCTGGTATTTTGTTAGCTGATGGAAGAGATTGGGCATATGTATTCTATTTCTTCGGTGGCTTCGGCCTTGTGTGGTTTACTTTGTGGAGTTTGCTTTGCTATAGCACACCAAATACTCATCCTTACATATCAAAGAAAGAACTTAACTATCTCAACAAGAATGTTACAACTGCGGAGAGTATTACAGCAAAGGATCCAGTGCCTTGGAAGGCGATCCTGAGATCTGCTCCTGTATGGGCCCTTGTATGGGCTGCTGTCGGACACGATTGGGGTTATTACACTATGGTGACAGACTTGCCGAAATACTCACACGATGTGCTTAAATTTAACATTGCGACGACTGGAACTCTGACTGCCTTACCTTATATAGCTATGTGGTTATGTTCCTTTCTGTTTGGATTTGTGTGCGACCTCTGCATCAAGAAAGGGTGGCATACTATTAAGACGGGTAGAATTATTCACACTACCATAGCGGCCACTGGACCTGCAATATGTATTATCTTGGCTTCTTACGCTGGATGTGACAGAACTGCTGCTATGGTGTACTTCATCTTGTCTATGGCTCTTATGGGAGGTTTTTACAGTGGTATGAAGGTAAACGCATTGGATCTGGCACCGAATTATGCAGGTTCGCTGACATCGCTAGTAAACACAACTTCTACATTCGCTGGTATTGTGACACCATACCTTATTGGGTTATTGACACCTGATTCAACATTAGCCCAATGGCGGATAGCGTTCTGGGTGTGTTTTGCTGTGTTAGTTGGTACAAACGTAGTGTACTGCATTTGGGCTGACGGTGAACAGCAGTGGTGGGATGATGTAAGGAAACTCGGTTACCCAGCGGATTGGAAGCACGGATCCTTAATACCTGATGGAAATCCCGAACAACCAGAGACTGTGAGATTATCGAGCAACAAAACATCGGATGATGTATATTAG

Protein sequence:

>DPOGS203614-PA
MTDLNQIQAHNLLGLKNQPRKPKDTAFTRALRSCCVIPQRYILGVMGLLGVCNAYTMRVCLNLAITQMVNKTKSGTEHFDPDACPSDIEDSNSTNILRPYATFDWDEKTQGLILSGFYYGYAATQVPGGYLAEKFGGKWTLGIGLLSTALFTFLTPIVIRAGGATWLFILRVLQGMGEGPTMPALMIMLARWVPPHERSFQGALVFGGAQIGNIFGSFMSGILLADGRDWAYVFYFFGGFGLVWFTLWSLLCYSTPNTHPYISKKELNYLNKNVTTAESITAKDPVPWKAILRSAPVWALVWAAVGHDWGYYTMVTDLPKYSHDVLKFNIATTGTLTALPYIAMWLCSFLFGFVCDLCIKKGWHTIKTGRIIHTTIAATGPAICIILASYAGCDRTAAMVYFILSMALMGGFYSGMKVNALDLAPNYAGSLTSLVNTTSTFAGIVTPYLIGLLTPDSTLAQWRIAFWVCFAVLVGTNVVYCIWADGEQQWWDDVRKLGYPADWKHGSLIPDGNPEQPETVRLSSNKTSDDVY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: