MonarchBase - Protein-coding gene

DPOGS214141
Transcript	DPOGS214141-TA	1926 bp
Protein	DPOGS214141-PA	641 aa
Genomic position	DPSCF300014 - 1203384-1214327
RNAseq coverage	2542x (Rank: top 5%)

Annotation
*Heliconius*	HMEL012832	0.0	75.89%
*Bombyx*	BGIBMGA006189-TA	0.0	77.21%
*Drosophila*	CG30194-PD	7e-161	44.29%
EBI UniRef50	UniRef50_UPI0002247602	0.0	54.62%	UPI0002247602 related cluster n=2 Tax=unknown RepID=UPI0002247602
NCBI RefSeq	XP_001603871.1	0.0	54.15%	PREDICTED: similar to ENSANGP00000012858 [Nasonia vitripennis]
NCBI nr blastp	gi\|345493603	0.0	54.62%	PREDICTED: long-chain fatty acid transport protein 4-like isoform 2 [Nasonia vitripennis]
NCBI nr blastx	gi\|345493603	0.0	54.62%	PREDICTED: long-chain fatty acid transport protein 4-like isoform 2 [Nasonia vitripennis]

Group
Gene Ontology	GO:0008152	2.6e-66	metabolic process
	GO:0003824	2.6e-66	catalytic activity
KEGG pathway	nvi:100120211	0.0
	K08745 (SLC27A1_4, FATP1, FATP4)	maps->	PPAR signaling pathway
InterPro domain	[107-538] IPR000873	2.6e-66	AMP-dependent synthetase/ligase
Orthology group	MCL10110		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS214141-TA
ATGGACGCACTTTTGGCAGCCCTCGTTGCCCTTATGGCATTAGCCGCCGCGATGGCCGCCGTGCTAAGCACGCTTTCTAAAGCGGCGATTTTCGCGATCCTTGCGATTGCTCCCTGCGTATATCGATACAGAAAAAGGATTTATGTCATTGTGAAAACTTTGCCCAGGGATGCCAAATTCTTGTGGCGGTATGCAAACGCTATGGTGCGGTCGAAGCGCTGGGGACGTAACAACAGCACGGTGGCGGAACTGTTTACCAAAAGGGCCCTAAAGACGCCGGACGCTCCATGTTTCATCATGGTCGAAGGACGGACTTGGACTTTTCGAGAGATAGCAGAAAATTCAAACCAAGTGTCTCGGGTGATGCAGGAACATCTAGGTTTAAAACGTGGTGATGTCGTGTGTGTGTTTATGCCCAACTGCGTTGAGTATGTTTACACGTGGCTGGGTATGGCGAAGCTCGGCGCCGTGTCCGCGCTTATCAACAGCAACCTTCGCCATCGTCCGCTGCTGCATTGTATCCAAGTGGCTAAAGCCAAGGCGATCGTATTCTCAGATTCGCTGGCTGGAGCTATATCGGAGTTGGGGGATCAGCTGCCTCCTGAGCTGAAGCTATTTCAGCTGTACGGCAAGTGCCCCCCTGGGGTTATTGACCTTCGGGCTGAGATGGATAAACAGGTTCCAGAATATCCTATAGTGACAGACAAGCCTCGATACAGAGATACGCTTCTGTATATTTACACGTCAGGCACGACCGGTATGCCAAAGGCGGCGGTATTGCCAAACTCTAAGTATCTGCTGATAGTAGTGGCGACGGTCCACATGCTCGGCCTCCGCTCGTCCGACCGCCTGTACAACCCTCTGCCGCTGTACCACCTGGCTGGCGGGCTGGTGGGGACCTGCGCCGCGCTCGTGGACGGCATCCCCACCGTACTGCGGTCCAAATTCTCCGCTACCCACTACTGGACAGACTGCATCAAGTATGATTGTACGGTGTCTCAGTACATAGGCGAGATGTGTCGTTACCTGCTGTGTGCTCCGTCCAGACCCACGGACACTCAACACCGCGTCCGCATCATGGTAGGGAACGGCATGAGGCCGGCCATCTGGCAGCAGATCGTTGACAGGTTCAAAGTACCTCAGATAAATGAAATATACGGCGCGACGGAGGGAAATGCAAACATAATCAACGTGGACAATACAGTGGGCGCTGTGGGCTTCCTGCCCAAGTTGGTGCCCACGTGGTTACACCCCATAGCACTGGTCCGAGCTGATGATGACGGGGACCTGATCCGCGGCCCGGACGGATTGTGCATCAGATGCCAACCCAACGAGCCCGGTATGTTCATCGGCCTCATCGCTCAGGGCAACGCGTCCAGGGAGTACTACGGATACGTTGAAAAGAGCGACAGTAACAAGAAGCTGGTCCGCGACGTGTTCTGTAAGGGAGACGCGGCTTTCGTCAGCGGAGATATTCTGGTGGCGGACGAGCTCGGGTACCTGTACTTCAGAGACAGGACCGGGGACACTTACAAGTGGAAGGGGGAGAACGTCGCCACGGCCGAGGTGGAAGACGCGGTGAGGGCGGCCATCGGACAGAGAGATGTCGTCGTCTACGGAGTCTCGATCCCTCAAACGGAAGGCCGCGCTGGTATGGCCGCTGTGAGTGCAGCCAGCGTAGACGGACGGTCGCTGGCGGTAGCGCTCGACCACGCGCTACCATCATACGCGAGACCGCTGTTCCTCAGACTCATGAAGGACATAGAGATCACCAGTACGTTCAAGTTAAAGAAGCGGCAGTATCAGAAGGAAGGTTTCGACCCGGACGTGATCCAGGACCCGCTGTTCTTCCGCTCCGGGGACGACTTCGTCCCTCTGACGTCACAACTGTTCGACGACATCTGCAACGGACGAGTCAAACTATAA

Protein sequence:

>DPOGS214141-PA
MDALLAALVALMALAAAMAAVLSTLSKAAIFAILAIAPCVYRYRKRIYVIVKTLPRDAKFLWRYANAMVRSKRWGRNNSTVAELFTKRALKTPDAPCFIMVEGRTWTFREIAENSNQVSRVMQEHLGLKRGDVVCVFMPNCVEYVYTWLGMAKLGAVSALINSNLRHRPLLHCIQVAKAKAIVFSDSLAGAISELGDQLPPELKLFQLYGKCPPGVIDLRAEMDKQVPEYPIVTDKPRYRDTLLYIYTSGTTGMPKAAVLPNSKYLLIVVATVHMLGLRSSDRLYNPLPLYHLAGGLVGTCAALVDGIPTVLRSKFSATHYWTDCIKYDCTVSQYIGEMCRYLLCAPSRPTDTQHRVRIMVGNGMRPAIWQQIVDRFKVPQINEIYGATEGNANIINVDNTVGAVGFLPKLVPTWLHPIALVRADDDGDLIRGPDGLCIRCQPNEPGMFIGLIAQGNASREYYGYVEKSDSNKKLVRDVFCKGDAAFVSGDILVADELGYLYFRDRTGDTYKWKGENVATAEVEDAVRAAIGQRDVVVYGVSIPQTEGRAGMAAVSAASVDGRSLAVALDHALPSYARPLFLRLMKDIEITSTFKLKKRQYQKEGFDPDVIQDPLFFRSGDDFVPLTSQLFDDICNGRVKL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: