MonarchBase - Protein-coding gene

DPOGS201196
Transcript	DPOGS201196-TA	3024 bp
Protein	DPOGS201196-PA	1007 aa
Genomic position	DPSCF300262 + 206478-214139
RNAseq coverage	148x (Rank: top 54%)

Annotation
*Heliconius*	HMEL004740	0.0	64.13%
*Bombyx*	BGIBMGA014240-TA	0.0	53.57%
*Drosophila*	slif-PC	2e-144	46.23%
EBI UniRef50	UniRef50_UPI000224675F	2e-147	45.81%	UPI000224675F related cluster n=4 Tax=unknown RepID=UPI000224675F
NCBI RefSeq	XP_002095861.1	7e-144	45.74%	GE22647 [Drosophila yakuba]
NCBI nr blastp	gi\|345481398	6e-147	45.81%	PREDICTED: hypothetical protein LOC100119236 [Nasonia vitripennis]
NCBI nr blastx	gi\|270012932	1e-144	35.09%	hypothetical protein TcasGA2_TC001941 [Tribolium castaneum]

Group
Gene Ontology	GO:0016020	6.3e-195	membrane
	GO:0003333	6.3e-195	amino acid transmembrane transport
	GO:0015171	6.3e-195	amino acid transmembrane transporter activity
	GO:0006810	3.1e-29	transport
	GO:0055085	3.1e-29	transmembrane transport
KEGG pathway
InterPro domain	[12-545] IPR015606	6.3e-195	Cationic amino acid transporter
	[12-545] IPR002293	6.3e-195	Amino acid/polyamine transporter I
	[40-424] IPR004841	3.1e-29	Amino acid permease domain
Orthology group	MCL26183		Lepidoptera specific

Nucleotide sequence:

>DPOGS201196-TA
ATGGCAGTCAAGTGGCGTGATCTGCTCTGCACGCTGAAACGAAGGCGAGTCTTCGAACCCGATCAGCTCGACGTGGGCAATCTGAGACGATGTCTGTCAGTATGGGATCTGACGGCGCTGGGTGTGGGGAGCTCGCTGGGAGTGGGTGTGTACGTGCTGGTGGGATCCGTTGCGCTTCACCTGGCCGGACCCTCCATAGTGCTTTCATTCCTCATTGCAGCTGTAGCAGCTGTTGTGGCTGCAATGTGTTACGCGGAGCTGGGGTCGCGGGTTCCGAAAGCTGGGTCTGCATACATATACACATATGTGACTGTTGGAGAGATAGTGGCCTTCATTATTGGTTGGAACATGATCCTGGAACTGGTCTTTGGGACGGCGAGTGTCGCCCGGGGTCTCAGCATGTACGTGGACTCGGTCACCAACAAGACCATGTCCTCGTGGATGGAGTCGCTCGTTCCGATTCACTCTGATTACTTCTCCTCCTACTTTGATATCTTTTCATTCTTCGTGGTCGTATTTTTGGGGGTGCTTCTGGCTGTTGGTGTGCGCGAGTCAACATTTGTGAACAATTTGTTGACAGCTGTCAATATACTCGTCATAGTGTTCATCATATGCGCAGGCGCATTCAAAGCGGACTTCAGTAACTGGAATATCCCACCGAGCGAGGTGCCGTCAGGTCGTGGTGTGGGAGGATTCTTCCCTTACGGCATCTGGGGCACGTTAAGAGGGGCCGCCCTATGCTTTTATGGATTCGTCGGATTTGATAGCATTAGCTCTACCGGAGAGGAGGTGCGAGATCCTCGTCGTGCTCTACCAATATCAATAATGGCCACGCAAGTGATAGTGTTCCTGGCCTACGCGGGCGTGTCCATCGTCGTCACTATGATGATGCCTTATTACCTACAGGAGACGGTAGCCTCAGTGGCAACGTCATTCGCCTACGTGGGCTGGGACTGGGCGCGGTGGTTCGTCACAATCGGCGCAGTGATCGGCATATCAGCCAGTCTGTACGGCTCGATGTTTCCTCTCCCTCGTCTGCTGTACTCGATGGCATCAGACGGTCTTCTGTTCCACTGGCTATCCAAAGTGACTTCAAAGAGGAAATCACCAACCGTCGCCACTATACTGTCCACGGTGGTTATTGCTATACTAGCGGCTTTATTGGAGTTGAATGATTTGATTTTGATGATGTGTGTTGGGACACTTTTGTCTTACACGATCGTCGCTTCCTGCGTTATTCTATTGAGGTACCGTTCGAACACATCATCGCACGAATTGACGGCTAAGCATGTTGTTGGTAACGGTCGTAGGTTACCGACGCGGACGACATCAACTATTGTTGTTACATTACTGCTATTGTTCATTTGTGCGTGTGTGTCGTCTGCGGTGGTCGTGACCCACGTGTCGGAGCCTCTGGTCGGCGCCTGTACCATTCACGCGGCGGGTCTACTACTGATTGTTGCCATGGCGCTGCAGCCGCAGAATGACGAGGACTTAACCTTTCAGTGTCCCCTCGTCCCCATGATTCCTTGCATCAGTATATACGTCAACATACATCTGATGATTCTCATAAAACTTCAGACCTGGATACGTGTTTTGTGCTGGATAGCAATCGGTATACCAGTTTATATATTCTGTGTCTGTTGTTATAAGCAAAAAGTGGAAAATTACACAGAAAACAATACAAACTCGACACAAGCGAACGGTAAGGCACCGGTTCAGATATTCGTTGTGTCACCCACACCTCCCGCTACTATCGGACGTAGTAACCAAGGAGGCGGGTACGATCACGATGACGACATCCGAGTGGACTTGAAACAAAATATTATACACATTAAAGAACCGGTTATAATGGAAGAGATAATAGTTCAACATGCTTACATCGGGGACAATGAAGAAAAGGAAGCCAAGATTATAGATTTGCTGGACCAGGTGTTACAGGCTGAAGAGGATTCTTATGAAGAGATAATAAGTTTGAAAGAACATAAGGAAGAACCTCAAGAAGAAGTTAAAACTCCAGAAATTAAAACGCACAGAAAATCGTTGAGTGAATTATCTGACGCTGGGTCAGATGTATCTAACCAAGTGCTATCTAAATACGATGTGATTGCTCAAGTTCATAGAGAAGATTTGCAAAAACTCACAGAAGAAGAAGAAGAGAAAAGCGATAAAGAAACCGAAAGTAGCGATAATGAAATTCTCGAGAACGAAGATCTTAATTGCAATGGTAGCGATACGACCTCTAGGACAGACGAATCTGGTTATTCGGATACACTCGATAAAACAGTTCTCGGTGAATCCACAGAAGATTTAAAAGAAGCAGAGGAAATACCAAACATACCAGTCCCACCGCCTTTAGACGAAAACTTCTTCGCTAGTCCAACATTTAAAAAATCATACACGATATCTGTTAGACCACCGAAAAGACAAGTCGAACAAGAAGAAAACAAGCCCAGGGAGAGTGTTGATTCGAATCATTCCTACGACGACGCACCGATGGTATTTGGAAGCGATAAGCAAATGAATTTCATGTCCAAATTAGAAAACATCTTTCAAAGTAAAATGGCGAATGACAATGAAGAAGACCCCCATAGAAAAAGATCAAATTCTACCGGTAATGTAGTGGATAGTCCGAATTCACAGCCAGTCCGACCGGTAATGTTGCTTGATTTGAAAAAAGAAATTGTTTCAAGAGATGTGGCTCAGAATTTACGTCATGTTGATGCAGAAGAGAAAAAAGAATCTTCTGAGGACGAGGAAGAAGATGTCAGTATGAGCCGCGAAGATCTAAAATCCAAGTTAGAAAATATATTTGCAGTGGGTGGACCGCAATTAATTAAAAGTAGATTAATGAAATCCAATCCTCCTACACCTGAAGAGGCTTACCATACCGACGCATCAAGTACAGAGAGTATACCTAAAGTGCCTAAAAAGGAAAAGAATGACACATTAAAAAGACAAAAGACCAAATTTGGGGAAGTTCTGAATTCTTTACGGATGATGAACAATGATGATAAAGTCTAG

Protein sequence:

>DPOGS201196-PA
MAVKWRDLLCTLKRRRVFEPDQLDVGNLRRCLSVWDLTALGVGSSLGVGVYVLVGSVALHLAGPSIVLSFLIAAVAAVVAAMCYAELGSRVPKAGSAYIYTYVTVGEIVAFIIGWNMILELVFGTASVARGLSMYVDSVTNKTMSSWMESLVPIHSDYFSSYFDIFSFFVVVFLGVLLAVGVRESTFVNNLLTAVNILVIVFIICAGAFKADFSNWNIPPSEVPSGRGVGGFFPYGIWGTLRGAALCFYGFVGFDSISSTGEEVRDPRRALPISIMATQVIVFLAYAGVSIVVTMMMPYYLQETVASVATSFAYVGWDWARWFVTIGAVIGISASLYGSMFPLPRLLYSMASDGLLFHWLSKVTSKRKSPTVATILSTVVIAILAALLELNDLILMMCVGTLLSYTIVASCVILLRYRSNTSSHELTAKHVVGNGRRLPTRTTSTIVVTLLLLFICACVSSAVVVTHVSEPLVGACTIHAAGLLLIVAMALQPQNDEDLTFQCPLVPMIPCISIYVNIHLMILIKLQTWIRVLCWIAIGIPVYIFCVCCYKQKVENYTENNTNSTQANGKAPVQIFVVSPTPPATIGRSNQGGGYDHDDDIRVDLKQNIIHIKEPVIMEEIIVQHAYIGDNEEKEAKIIDLLDQVLQAEEDSYEEIISLKEHKEEPQEEVKTPEIKTHRKSLSELSDAGSDVSNQVLSKYDVIAQVHREDLQKLTEEEEEKSDKETESSDNEILENEDLNCNGSDTTSRTDESGYSDTLDKTVLGESTEDLKEAEEIPNIPVPPPLDENFFASPTFKKSYTISVRPPKRQVEQEENKPRESVDSNHSYDDAPMVFGSDKQMNFMSKLENIFQSKMANDNEEDPHRKRSNSTGNVVDSPNSQPVRPVMLLDLKKEIVSRDVAQNLRHVDAEEKKESSEDEEEDVSMSREDLKSKLENIFAVGGPQLIKSRLMKSNPPTPEEAYHTDASSTESIPKVPKKEKNDTLKRQKTKFGEVLNSLRMMNNDDKV-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: