MonarchBase - Protein-coding gene

DPOGS209942
Transcript	DPOGS209942-TA	2061 bp
Protein	DPOGS209942-PA	686 aa
Genomic position	DPSCF300148 - 400955-404893
RNAseq coverage	149x (Rank: top 53%)

Annotation
*Heliconius*	HMEL009995	90.62%
*Bombyx*	BGIBMGA011261-TA	82.64%
*Drosophila*	CG12858-PA	56.34%
EBI UniRef50	UniRef50_D6WA60	68.01%	Putative uncharacterized protein n=2 Tax=Endopterygota RepID=D6WA60_TRICA
NCBI RefSeq	XP_001950245.1	63.66%	PREDICTED: similar to AGAP003204-PA [Acyrthosiphon pisum]
NCBI nr blastp	gi\|270001609	68.01%	hypothetical protein TcasGA2_TC000461 [Tribolium castaneum]
NCBI nr blastx	gi\|270001609	67.80%	hypothetical protein TcasGA2_TC000461 [Tribolium castaneum]

Group
Gene Ontology	GO:0055085	2.1e-13	transmembrane transport
	GO:0016021	2.1e-13	integral to membrane
KEGG pathway
InterPro domain	[1-583] IPR016196	4.9e-48	Major facilitator superfamily domain, general substrate transporter
	[407-575] IPR011701	2.1e-13	Major facilitator superfamily
Orthology group	MCL13025		Single-copy universal gene

Nucleotide sequence:

>DPOGS209942-TA
ATGCAGCACCCGCAGCAGCCGCCGCTGGCCGCGCGGCCCCTCGTCAACCCCGACGAGACTGGAGAAGTCGACACCTCCAGATACCCCGAACCTAAAGAGGCTACTCACAAAGTCCGAGGGCGAAGCGATGTCCTGGAGCTCATCTGTGGGCCGGGGACCGTCGACCCCGAGCTCCTCACCGTCAAGACTTTCTACTTCTTCTTCTACTCTGCTTTCGGATCACTATTCCCTTTAATGGGAGTTTACTTCAAACAGATGGGAATGAACGCTGGCCAGTGTGGGCTACTTATCGGTACTAGACCTTTCGTAGAATTTTTATCGGCACCATTTTGGGGTGGACTGGCAGATAGATGGCAGAAGGGAAGAATATTATTACTAGCGTCTCTAACCGCCTGGATAGTGTTCACACTGCCGCTGAGCTGGGTCCAGCCGACAGCCGTGTCTTGCGTACAACCTGTCAACAGCACCGTTTACCGTCTGGTCTCGCCGCGGTACGACGAGGACTGGCCCACGCCCACTAGACACTTCCGCGGTCCGGCTCTGGGTCGCGAGGGATCGCCGCTTCCTGTGACGGATGCAGAGAACTACAATCCGGATACCAACTACAACTGGGTGACGCCACTGCACTCCTACATCGTATACAGTACCCCGGACATACAAAAGACATTTTTCTTATTGTTGCTGCTCGTTGTAATCGGAGAGTTCTTCAGCGCGCCCGCTATTACTTTAGCGGATTCTGCGGTTATAACATTACTCGGCGAAGATGCTGACAGATACGGTCACCAGCGCATGTTCGGTTCCTTGGGCTGGGGCTTAGCCATGTTCTTCGTGGGTATCGCGCTGGACCACAGCACTGCCTTCAGCTCTCACCCTTGTGGCGGTCCTCAGCGCTACGAGAAGAATTACACGATCTGCTTCGCTACATTCTCGGTCCTGATGGGTGCCGCACTAATTACTGCCACCCAGATTAATTTTAAATACGAGGAAATTAACGTTGAAACCCCCTTGGAGCCACCTCCGCCCGCGGAACCTTCTCACGAGGAACGCATGCAGCAGCAACTGGCGGAACAGCTGCAACTTCCTGGACTGGACACCAGCGCGCCGGCGCCCCGGCAGCCGCCTCTCGAACACGCTAAGGTGTTCGCTCAGACCACTCGCGAGATGCCGGAGTGGGTGACGGTACTACGGCAATTTCAGAACGTGAAAGCTGCGTCCTTCCTGTTAGTCGCCTGGTTCATGGGCTTCGGGATTGGACTGATCTTCACATTCCTTTTCTGGCACTTACAGGATATCGGCGGCTCACCGACGCTTTTTGGTGTCGCTTCCGTCATCAACCACATCTCCGAGATCTTCGCCTACTTCTTCAGTTTCAAGCTTATCACTCAAATGGGACATGTTAAAGTATTATGCTTGGGTCTCGCCGGGAACGTGGTGCGCTTTCTATACATCTCTTGGCTGACGCGACCCTGGTGGGTGCTTCCTTTCGAGTTTGTCCAGGGTGTCACCCACGCCGCCGTGTGGGCGGCCTGCTGCTCCTATATAGCTCACGGCTCGCCACCCAACCTTCGTTCATCCGCACAAGGAGTGCTCCAGGGCCTGCACCACGGCCTGGGGCGAGGTTGCGGCGCGGTGCTAGGAGGCATCGCGGTAGCCAAATGGGGAACGACTCGCACCTTCGCCGGCTACGGTCTGTTGTGTGGTGTGGCGCTCGCAGCATTCGCCTTTGTGAACTTCCGCGATGGCGGCATGGGCCCGACGATTCCTGGCGACTCCGCGGCGGACGAAGAAGCTCGTGCAGTGGCGGAGGCGGGCGTGCTAGCTCCTCACGGTGTCCCTTCTAATCCGCTCCCTCGAGCCCTATCGTCCACTCGCCTGGCAGACTTGGCCAACCACGACAACTACGGCGCCACACAGAGTTACGCCGGAGCGGACAGCCTCGGCGTGCCGGGAGCCGCGCCGCCCCCGCAGCCCGGTCCCGGCCCCGGCCCCGGCCCGTCCGGCCCCGGCCCGCGACCGGCCAACCCCCTTCTGGCCGAGTCCGCCGGGGCCGCTTACCGATAG

Protein sequence:

>DPOGS209942-PA
MQHPQQPPLAARPLVNPDETGEVDTSRYPEPKEATHKVRGRSDVLELICGPGTVDPELLTVKTFYFFFYSAFGSLFPLMGVYFKQMGMNAGQCGLLIGTRPFVEFLSAPFWGGLADRWQKGRILLLASLTAWIVFTLPLSWVQPTAVSCVQPVNSTVYRLVSPRYDEDWPTPTRHFRGPALGREGSPLPVTDAENYNPDTNYNWVTPLHSYIVYSTPDIQKTFFLLLLLVVIGEFFSAPAITLADSAVITLLGEDADRYGHQRMFGSLGWGLAMFFVGIALDHSTAFSSHPCGGPQRYEKNYTICFATFSVLMGAALITATQINFKYEEINVETPLEPPPPAEPSHEERMQQQLAEQLQLPGLDTSAPAPRQPPLEHAKVFAQTTREMPEWVTVLRQFQNVKAASFLLVAWFMGFGIGLIFTFLFWHLQDIGGSPTLFGVASVINHISEIFAYFFSFKLITQMGHVKVLCLGLAGNVVRFLYISWLTRPWWVLPFEFVQGVTHAAVWAACCSYIAHGSPPNLRSSAQGVLQGLHHGLGRGCGAVLGGIAVAKWGTTRTFAGYGLLCGVALAAFAFVNFRDGGMGPTIPGDSAADEEARAVAEAGVLAPHGVPSNPLPRALSSTRLADLANHDNYGATQSYAGADSLGVPGAAPPPQPGPGPGPGPSGPGPRPANPLLAESAGAAYR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: