MonarchBase - Protein-coding gene

DPOGS210149
Transcript	DPOGS210149-TA	1833 bp
Protein	DPOGS210149-PA	610 aa
Genomic position	DPSCF300465 - 36061-52250
RNAseq coverage	277x (Rank: top 39%)

Annotation
*Heliconius*	HMEL007475	7e-157	53.14%
*Bombyx*	BGIBMGA010161-TA	5e-148	50.83%
*Drosophila*	CG4797-PB	4e-51	27.60%
EBI UniRef50	UniRef50_Q7PX65	2e-108	40.43%	AGAP001236-PA n=1 Tax=Anopheles gambiae RepID=Q7PX65_ANOGA
NCBI RefSeq	XP_321919.4	4e-109	40.43%	AGAP001236-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|347965559	7e-108	40.43%	AGAP001236-PA [Anopheles gambiae str. PEST]
NCBI nr blastx	gi\|347965559	2e-107	41.33%	AGAP001236-PA [Anopheles gambiae str. PEST]

Group
Gene Ontology	GO:0055085	4.2e-46	transmembrane transport
	GO:0016021	4.2e-46	integral to membrane
	GO:0022857	4.2e-46	transmembrane transporter activity
KEGG pathway
InterPro domain	[100-574] IPR016196	4.4e-52	Major facilitator superfamily domain, general substrate transporter
	[144-575] IPR005828	4.2e-46	General substrate transporter
Orthology group	MCL19581		Insect specific

Nucleotide sequence:

>DPOGS210149-TA
ATGGAGAAAGGAATAGCGTCTGTCAGCAGAGCGAGGGTGGTTTTGTCTCAGGTTGTAGCATGTTCCGCATTAAACGTGCTGTTGGTTGGTCTTGGAATGTCGATGAGTTTTGTGACCATGGTGCTGCCAGAAGTCCTCGACGCTAAAGAAGGATTGTCAATCAATAAGAATCAGGCTTCGTGGTTTGCCATTCTGGTCGCTCCACGATCTATCTCTTCTTATCCCAAATTGTGGTGGCTCAATATCAGTTCCATAAAATATAACACGTCTCATGACCGATTGATAGATTTGGCATTTGAACTTAAGGCGCGTCCGTGGGTTGTAGCATGTTCAGCATTAAACGTGCTGTTGGTTGGTCTTGGAATGTCGATGAGTTTTGTGACCATGGTGCTGCCAGAAGTCCTCGACGCTAAAGAAGGATTGTCAATCAATAAGAACCAGGCTTCGTGGTTTGGAAGTATGGCATTTCTATGTCAGCCTTTGGGGAGTATATTTTCTGGTCCACTATTGGATTACTTCGGGAGAAAGAAAGCTCTATTCCTCGTCAATATACCGCATCTATTTGCATGGTTGATGATGTATTTCGCGTGGGACGTCCCTAGCCTGTTTCTGGCCAATGCTTTTCTAGGCATCGGCATCGGCATTATGGAAGCACCGTCTATTACTTACGTTGGCGAAGTCAGTGATGCCTCTCTGCGTGGGACGCTTACAACTTTGACAAACGGTTTCACATCAGCTGGTATGTTCATGGCTTACCTCCTGGGAACAGTTGTGTCATGGCGCGAAGCAGCACTCGTTTCGCTCACTGTACCTCTTGCTACCATGTTATTAGTCCTTTTTGTCCCTGAAACTCCTATTTGGTTACTATCAAAAGGCAGGCAAAAAGAAGCACTGGTTTCGCTCTGTCGTCTTCGGGGTTGGGTTGAACCGGAGGATGTTAAAGAGGAATTTAACCAGTTAGTGGAATATAGTAACAACATAAGCAGATGTGTTCTGTGCACCAAAGTACAAGAGCTGGATAGTAAAATCTGTAAACATTCATCTTATAACTTTATGAAGAGATACATTCTTAGACTGAAGCATTTACTTTTTGTGAAAGAGACTATGAGACCGTTCGGATTAGTCATGGCGTATTTCTTTTTTTACACCATGAGTGGTCTCTTGCCTGTTAGACCTAACATGGTGAACGTGTGCAAGGCTCTGGGTATGAAATTTGACTCCAAAGCAATTGTGGTCAGCGTCGCATTGGTATATATTGTGATGAATATCGTATCAGCTGTCGTAGTTAAGATATTTGGGAAGCGTAAATTGATCTTATCATCACTCTTCGCTTCAGCTTGTAGCAGTCTTGCTTTGAGTATATATGCGGGAGTTGTGCTGCCGGTTAGCGTATTTTCATACGAACCGAGTACATTTCCAAGTCAAACGGAAATTATTCCTGTTATACTATTTATGTCGCTAGTGTGTTTCACCAGCTTAGGTATACCATGGATCCTACTCTCCGAAGTCTTTCCTTTCAGGAGTCGTGGTATGGCTACGGGTTTGGCTGCCGCTTTAAGCTACCTCATTTTCTTCGCAGCAGCAAAATCCAATTACAACATTGAGGAAAATTTCCACATGAGCGGCTCCTTTATGACTTATGCCATACTGGGTTTTATGGGCACGGTATATTTGTACTTCTTCCTTCCGGAAACTGAGCGAAAAACGTTAGCTGAGATTGAAGCGTTCTATAACGGGAAGTCGAAAATATTTGCAAATGATTTCGTTATAAACGCTTTCAGAAAAACAAAAATTGAGACGAACGGAGCCGACAAACCGATGCTAGACTGCTGA

Protein sequence:

>DPOGS210149-PA
MEKGIASVSRARVVLSQVVACSALNVLLVGLGMSMSFVTMVLPEVLDAKEGLSINKNQASWFAILVAPRSISSYPKLWWLNISSIKYNTSHDRLIDLAFELKARPWVVACSALNVLLVGLGMSMSFVTMVLPEVLDAKEGLSINKNQASWFGSMAFLCQPLGSIFSGPLLDYFGRKKALFLVNIPHLFAWLMMYFAWDVPSLFLANAFLGIGIGIMEAPSITYVGEVSDASLRGTLTTLTNGFTSAGMFMAYLLGTVVSWREAALVSLTVPLATMLLVLFVPETPIWLLSKGRQKEALVSLCRLRGWVEPEDVKEEFNQLVEYSNNISRCVLCTKVQELDSKICKHSSYNFMKRYILRLKHLLFVKETMRPFGLVMAYFFFYTMSGLLPVRPNMVNVCKALGMKFDSKAIVVSVALVYIVMNIVSAVVVKIFGKRKLILSSLFASACSSLALSIYAGVVLPVSVFSYEPSTFPSQTEIIPVILFMSLVCFTSLGIPWILLSEVFPFRSRGMATGLAAALSYLIFFAAAKSNYNIEENFHMSGSFMTYAILGFMGTVYLYFFLPETERKTLAEIEAFYNGKSKIFANDFVINAFRKTKIETNGADKPMLDC-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: