MonarchBase - Protein-coding gene

DPOGS201101
Transcript	DPOGS201101-TA	1461 bp
Protein	DPOGS201101-PA	486 aa
Genomic position	DPSCF300137 - 455721-466995
RNAseq coverage	40x (Rank: top 72%)

Annotation
*Heliconius*	HMEL005319	4e-165	59.78%
*Bombyx*	BGIBMGA013656-TA	2e-149	55.90%
*Drosophila*	CG10960-PB	2e-46	27.93%
EBI UniRef50	UniRef50_E2BLV7	1e-54	29.82%	Solute carrier family 2, facilitated glucose transporter member 8 n=7 Tax=Formicidae RepID=E2BLV7_HARSA
NCBI RefSeq	XP_396250.2	2e-57	30.98%	PREDICTED: similar to CG1213-PA, isoform A isoform 1, partial [Apis mellifera]
NCBI nr blastp	gi\|380024226	1e-56	30.77%	PREDICTED: facilitated trehalose transporter Tret1-like [Apis florea]
NCBI nr blastx	gi\|350403986	1e-59	31.48%	PREDICTED: facilitated trehalose transporter Tret1-like [Bombus impatiens]

Group
Gene Ontology	GO:0055085	1.1e-60	transmembrane transport
	GO:0016021	1.1e-60	integral to membrane
	GO:0022857	1.1e-60	transmembrane transporter activity
KEGG pathway
InterPro domain	[55-458] IPR005828	1.1e-60	General substrate transporter
	[9-466] IPR016196	1.3e-51	Major facilitator superfamily domain, general substrate transporter
Orthology group	MCL19868		Lepidoptera specific

Nucleotide sequence:

>DPOGS201101-TA
ATGTTACAAAGAAAATATTTTCAAGATGGAGGACAAATAAATCAAATAATTTGTGCGCTCTTGATAAATTTGCCCGTACTATCTTATGGATGTAGCGTTGGGTGGATGTCCCCTATGACACTTCTTCTGCAGTCAAAAGATTCACCCAGAGGGACCCCTTTAACCGATTTAGAGGTGTCATGGATGGCATCAGTTCCATACTTGGTTTGCATCCCATGTGATCTTCTCATGGCTGTCATAACAGATAAGTGGGGGAGGAAAACAGCTTTGATACTTATATCGATATCATCAGCGATAAGTTGGATTCTTCTTCTCTCGTCCTTCAACATTTGGGTCTTGATTCTGGGCCGAGCGCTAGTTGGGATCAGTATGGCAGGTTCCTACGTTACGTGCCCTATTTACACCAAGGAAATAAGTGATGACAACATCCGAGGCGCCTTGGGATGCTTGGTTATTCTTTTCCAAACAACCGGCAACCTCTTTTTGTATATTATAGGGGATATTTTAAGTTATAACTCTATACTCTGGATATGTCTAGCTATTCCTGGGATACATATACTGTTGTTCATACTAATGCCTGATTCCCCTTCCTACCTGCTCAAGAAAGGAAGAATTGAGGATACCACCAGAGCCTTATCATGGCTGAGATGTAGACCAGCTGGTGATCCCAAAATCGAACAAGAACTAGATTTGATCAGGGCTGAACAGGACAAAGATGAATCCAAGAATTTTTTACTGAAGGATATATATCAAGACAAAATTCTGTTCAGGGCTTTTATAATAGCCATGGTGACGACACTGTCCAGAGAAGCTTGTGGTGCGGTGCCAGTTCTCAACTTCGCAGGGGAAATCTTCAGTCTAGCATCCAGTGACAATAATCTACGTCTCAGTCCAAATCAACAAGCCATGCTGTTGGGGGGTGTTCAAGTACTCGGTTCAGCGTTGGCTTCCAGTTTGGTCGAGAAATCTGGGCGAAAGCCGCTGCTCTTCACAACGTCCCTTCTATCTGGTATCAGTATGTGCACACTGGCGTCTTGGTTCCTTCTCCGTGATAATGGTATCCTAGCACCTTCCTGGTTGCCACTGGTTACGCTGTGTGTTTGCATCTTCTGCGATTCCTCCGGTCTACAACCCATGTCCGTGGTCATAACGGGAGAAATATTCTCTTTCAGATACCGTGGAACGATATTAGCAATAACGATGGCATGTGCGTCATTATTTGACTTTGTGCAACTGTTATTTTTCAAGTCTCTAGCCAATGCTGTTGGGATTCACGTCTCATTTTACTTTTTTGGTATTCTTTGTCTCCTGATGGCTCTATACGTGATATTGGCGATACCAGAAACAAGAGCCAGAAGTCTAGAAGATATTTACAAAGATCTCGTAAAGAAGAAAGATTTGAAGGGGATTGTTAATGAAAGATATGTTGAAACAAGAGACAGAGAAGTGTCACGAATTTGA

Protein sequence:

>DPOGS201101-PA
MLQRKYFQDGGQINQIICALLINLPVLSYGCSVGWMSPMTLLLQSKDSPRGTPLTDLEVSWMASVPYLVCIPCDLLMAVITDKWGRKTALILISISSAISWILLLSSFNIWVLILGRALVGISMAGSYVTCPIYTKEISDDNIRGALGCLVILFQTTGNLFLYIIGDILSYNSILWICLAIPGIHILLFILMPDSPSYLLKKGRIEDTTRALSWLRCRPAGDPKIEQELDLIRAEQDKDESKNFLLKDIYQDKILFRAFIIAMVTTLSREACGAVPVLNFAGEIFSLASSDNNLRLSPNQQAMLLGGVQVLGSALASSLVEKSGRKPLLFTTSLLSGISMCTLASWFLLRDNGILAPSWLPLVTLCVCIFCDSSGLQPMSVVITGEIFSFRYRGTILAITMACASLFDFVQLLFFKSLANAVGIHVSFYFFGILCLLMALYVILAIPETRARSLEDIYKDLVKKKDLKGIVNERYVETRDREVSRI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: