MonarchBase - Protein-coding gene

DPOGS206040
Transcript	DPOGS206040-TA	1431 bp
Protein	DPOGS206040-PA	476 aa
Genomic position	DPSCF300028 - 1341970-1346175
RNAseq coverage	743x (Rank: top 17%)

Annotation
*Heliconius*	HMEL006630	3e-133	82.78%
*Bombyx*	BGIBMGA000714-TA	0.0	71.10%
*Drosophila*	path-PC	4e-140	57.11%
EBI UniRef50	UniRef50_E2A7X2	2e-145	58.09%	Proton-coupled amino acid transporter 4 n=9 Tax=Endopterygota RepID=E2A7X2_CAMFO
NCBI RefSeq	XP_001687875.1	2e-153	58.12%	AGAP007633-PD [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|322799786	8e-158	58.75%	hypothetical protein SINV_05703 [Solenopsis invicta]
NCBI nr blastx	gi\|322799786	3e-157	58.46%	hypothetical protein SINV_05703 [Solenopsis invicta]

Group
KEGG pathway
InterPro domain	[56-464] IPR013057	1.9e-66	Amino acid transporter, transmembrane
Orthology group	MCL15535		Insect specific

Nucleotide sequence:

>DPOGS206040-TA
ATGCAGGAGTCAAATGGGAACGTGGCTCCTCCCCAGGAGTTGGAGACGTTCCTTCCACAAGACGAGAAGAAAGACAAGGTTGAGAAAAAATATAACCTAACTAAAGAAAAAGATGTCGAAGAGGGTGATTACGATCCGTTTGCAGAAAGAAAATTGGACAATCCGACCTCCAATATGGACACACTGACTCACTTACTGAAGGCGTCTTTGGGTACTGGTATTCTAGCTATGCCAAAAGCCTTTCAGTGTTCAGGGCTTTTGGCGGGAATTTTCTTCACGATTTTGGTCGCTGTAGTATGCACTCACTGCGCATACGTCCTTATAAAATGCGCACACGTACTTTACTACAAGACGAAAAAACCAACAATGAGCTTTCCGGAAGTTGCGGAGGCGGCCCTGGATAACGGTCCCCAATGGGGAAGAAGATGGGCATATACTTTTAGGATCTTCATCTTGGTCAGTCTGTTCATAACGTACTTCGGTACGTGTTCGGTGTACGCGGTTATAATTGCTGAAAATATTAAAAAGGTAGTTCATTTCTATTGGGAAAGCACCCAAGAAAACTTCGGGATACGAATATTTATCCTCCTAATTCTCCCACTGCTAATCTTTATGGCATGGATCAAGAATCTGAAATATTTGGCGCCGGTCTCAATGATAGCAAATTTATTTATGGCGGTGGGCCTCGGGATAACGTTTTATTTCCTCGTCGGCACCGAGTCCTTGGATTTCGGGAAAGTTGCAGCAGTGAAACATCCCAGCGAATGGCCGCAATTTTTCTCCCTCACAATCTTTGCCATGGAAGCAATCGGTGTCGTGATGCCTTTAGAAAATTCGATGAAAACTCCGCGCTCTATGCTTGGATTCTGCGGGGTTCTGAACAAGGGGATGTCTGGTGTGACCTTGGTGTACATTCTTCTTGGATTCCTTGGTTACCTCCGCTACGGAGAGCTGGTACAAGATTCGATCACGCTCAACTTGGAACCGCACCCCGACGATCCTAAGATCTATGAAGTTCTCGCCCAAACCGTAAAAATTTCCATCGCCATCGCCGTGTACTGCACATTTGGGCTCCAATTCTTCGTCTGCATCGAAATCATGTGGAACTGCATGAAGGACAAGTTCACTCAGCGGCCGGACCTCGCGGACTACGTGATGCGCACCATCCTAGTCACAGTGTGCGTTCTCCTGGCCGTGGCCGTGCCCACCATAGGTCCGTTCATGGGCGTCATCGGCGCGTTCTGCTTTTCTATCCTCGGCCTCATCGCTCCCGCTTTCATAGAAATCATAACCTTCTGGGACATCGGTTTCGGTCCTTACAAATATCTCATATGGAAAAATTTACTCGTACTAATCTTCGGCCTGTTCGCTCTCATTTTCGGCACCATAGATGCGTTCAAAAGCATAATATCCGTGTACAGCGCACACTAG

Protein sequence:

>DPOGS206040-PA
MQESNGNVAPPQELETFLPQDEKKDKVEKKYNLTKEKDVEEGDYDPFAERKLDNPTSNMDTLTHLLKASLGTGILAMPKAFQCSGLLAGIFFTILVAVVCTHCAYVLIKCAHVLYYKTKKPTMSFPEVAEAALDNGPQWGRRWAYTFRIFILVSLFITYFGTCSVYAVIIAENIKKVVHFYWESTQENFGIRIFILLILPLLIFMAWIKNLKYLAPVSMIANLFMAVGLGITFYFLVGTESLDFGKVAAVKHPSEWPQFFSLTIFAMEAIGVVMPLENSMKTPRSMLGFCGVLNKGMSGVTLVYILLGFLGYLRYGELVQDSITLNLEPHPDDPKIYEVLAQTVKISIAIAVYCTFGLQFFVCIEIMWNCMKDKFTQRPDLADYVMRTILVTVCVLLAVAVPTIGPFMGVIGAFCFSILGLIAPAFIEIITFWDIGFGPYKYLIWKNLLVLIFGLFALIFGTIDAFKSIISVYSAH-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: