MonarchBase - Protein-coding gene

DPOGS204403
Transcript	DPOGS204403-TA	1668 bp
Protein	DPOGS204403-PA	555 aa
Genomic position	DPSCF300002 - 1033507-1047069
RNAseq coverage	494x (Rank: top 25%)

Annotation
*Heliconius*	HMEL015681	0.0	97.57%
*Bombyx*	BGIBMGA003178-TA	1e-98	42.07%
*Drosophila*	CG9413-PB	0.0	70.31%
EBI UniRef50	UniRef50_P82251	4e-144	55.14%	B(0,+)-type amino acid transporter 1 n=30 Tax=Chordata RepID=BAT1_HUMAN
NCBI RefSeq	XP_972107.2	0.0	74.72%	PREDICTED: similar to AGAP001870-PA [Tribolium castaneum]
NCBI nr blastp	gi\|270001710	0.0	74.16%	hypothetical protein TcasGA2_TC000583 [Tribolium castaneum]
NCBI nr blastx	gi\|270001710	0.0	75.86%	hypothetical protein TcasGA2_TC000583 [Tribolium castaneum]

Group
Gene Ontology	GO:0016020	1.8e-288	membrane
	GO:0003333	1.8e-288	amino acid transmembrane transport
	GO:0015171	1.8e-288	amino acid transmembrane transporter activity
	GO:0006810	1.6e-23	transport
	GO:0055085	1.6e-23	transmembrane transport
KEGG pathway
InterPro domain	[79-550] IPR002293	1.8e-288	Amino acid/polyamine transporter I
	[107-490] IPR004841	1.6e-23	Amino acid permease domain
Orthology group	MCL14910		Single-copy universal gene

Nucleotide sequence:

>DPOGS204403-TA
ATGAGCGATGCGATGCGCGAAAAGCTCGCGAGACTACTTCGCGGCTCTATCGCTGCGCAGACGCATACAGTCACCACGGACAAATTTCAAAACGGCACCACTCATCCTGTACTGCTTTATTCTGATGAAGGGAGCGCACGCGAAGGCGGATTGGTATGGCGCGGGTGTTCCGGGGACTGCGACGCGGAAGATGGCTCGGCGGGAACGCTCGCCGATGGCAACGCCAACCCAGGAGACAAGTTGGAGGGGTCGGACGCAGCTCCGGACGACCCTGTTCACCTCAAGAGACGGGTGGGACTCTTCAGTGGGGTGGCTCTAATCGTCGGTACTATGATCGGTTCTGGAATATTCGTGTCGCCCTCTGGGCTTTTGGAGCGTACAGGCTCAGTGGGCATAAGCTTCATTATATGGATGGCGTGTGGGCTGCTCTCGCTGCTTGGAGCGCTCGCGTACGCGGAGTTAGGAACGATGAACACCTCCTCTGGAGCTGAGTACGCATACTTCATGGACGCTTTCGGTGGACCACCGGCGTTCCTCTTCTCTTGGGTGTCAACGCTGGTGCTGAAGCCGTCTCAGATGGCCATAATCTGTTTGAGCTTCGCAAAATATGCGGTGGAGCCCTTCGTGTCAGAGTGCGAACCGCCTGACGCTCTCGTCAAACTTGTGGCACTTATATCTATTGTGATGATTCTTGCCGTCAACTGCTACAGTGTCAATCTAGCGACGAACGTCCAAAATATTTTTACGGCTGCGAAACTGGTCGCCATCGCGATAATCGTCTGTGGAGGAGCTTACAAACTCATTTTAGGTAATACGCGACATTTACAGGAGCCCAACTTCGCAAGTAGCACCGCGACGCTTGGCAACATCGCCACGGCCTTCTACACCGGGCTGTGGGCCTACGATGGATGGAATAACCTTAATTATGTTACAGAGGAAATTAAAAATCCTTCCAAGAACCTGCCTCTGAGCATAATAATTGGCATTCCGCTGGTGACGCTGTGCTACGCCTTGGTGAACGTGTCGTACTTGGCGGTGATGTCCGTGAGTGAGATGGCGGACAGTGAAGCGGTCGCTGTGACCTTCGGGAACAGACTGTTGGGCCCCATGGCGTGGCTCATGCCGCTGGCTGTTACTATATCAACTTTCGGCTCGGCGAATGGGACTCTATTTGTTGCGGGAAGGTTGTGCTTCGCAGCATCTCGGGAGGGACATTTATTGGATATACTTTCGTATGTCCATGTACGTCGGTTTACACCCGCCCCGGGACTTATATTCCATTCTCTGATAGCGGTGGCGATGGTGCTGTACGGAACCATAGATTCGTTAATTGATTTCTTCTCGTTCACTGCCTGGATATTCTACGGTGGGGCCATGCTGGCGTTGATTGTGATGAGATACACCAAGCCTCACGCGCCTAGACCATACAAGGTGCCGATTATAATTCCCTACATAGTCCTGATCGTGTCCGCGTACTTGGTGGTCGCTCCGATCATAGACAACCCTCAGTGGGAGTACTTGTACGCGGGAGCTTTCATCCTCGCCGGCCTGCTGGTCTACCTGCCGTTCGTCAAGTGGGGATACTCTCTTCCCTTCATGGATAAAATTACAGTGTTTCTTCAGATGGTTCTAGAAGTGGTGCCAACGTCGACGACTTTTGAATATTGA

Protein sequence:

>DPOGS204403-PA
MSDAMREKLARLLRGSIAAQTHTVTTDKFQNGTTHPVLLYSDEGSAREGGLVWRGCSGDCDAEDGSAGTLADGNANPGDKLEGSDAAPDDPVHLKRRVGLFSGVALIVGTMIGSGIFVSPSGLLERTGSVGISFIIWMACGLLSLLGALAYAELGTMNTSSGAEYAYFMDAFGGPPAFLFSWVSTLVLKPSQMAIICLSFAKYAVEPFVSECEPPDALVKLVALISIVMILAVNCYSVNLATNVQNIFTAAKLVAIAIIVCGGAYKLILGNTRHLQEPNFASSTATLGNIATAFYTGLWAYDGWNNLNYVTEEIKNPSKNLPLSIIIGIPLVTLCYALVNVSYLAVMSVSEMADSEAVAVTFGNRLLGPMAWLMPLAVTISTFGSANGTLFVAGRLCFAASREGHLLDILSYVHVRRFTPAPGLIFHSLIAVAMVLYGTIDSLIDFFSFTAWIFYGGAMLALIVMRYTKPHAPRPYKVPIIIPYIVLIVSAYLVVAPIIDNPQWEYLYAGAFILAGLLVYLPFVKWGYSLPFMDKITVFLQMVLEVVPTSTTFEY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: