MonarchBase - Protein-coding gene

DPOGS210042
Transcript	DPOGS210042-TA	1902 bp
Protein	DPOGS210042-PA	633 aa
Genomic position	DPSCF300017 - 1253946-1260104
RNAseq coverage	359x (Rank: top 33%)

Annotation
*Heliconius*	HMEL005909	0.0	82.53%
*Bombyx*	BGIBMGA000472-TA	0.0	74.14%
*Drosophila*	CG11069-PA	6e-154	47.57%
EBI UniRef50	UniRef50_E0W1F2	7e-176	49.85%	ATP-binding cassette transporter, putative n=8 Tax=Pancrustacea RepID=E0W1F2_PEDHC
NCBI RefSeq	XP_968555.1	0.0	57.25%	PREDICTED: similar to AGAP002051-PA [Tribolium castaneum]
NCBI nr blastp	gi\|91091098	0.0	57.25%	PREDICTED: similar to AGAP002051-PA [Tribolium castaneum]
NCBI nr blastx	gi\|91091098	0.0	57.25%	PREDICTED: similar to AGAP002051-PA [Tribolium castaneum]

Group
Gene Ontology	GO:0005524	4.1e-07	ATP binding
	GO:0016887	4.1e-07	ATPase activity
KEGG pathway	dpo:Dpse_GA10739	1e-151
	K05683 (ABCG5)	maps->	ABC transporters
InterPro domain	[64-176] IPR003439	4.1e-07	ABC transporter-like
Orthology group	MCL11616		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS210042-TA
ATGATTGGAAGTGACTACACATTGGAATTATGCAACGTCTTCCACTCTGGACAAGTGGAGCCAGGGAGCTTCTTCCAGCGCCTGACGGGCAGCGTCAAGACGGGTGTCATACTAAAAGACGTTTCCTTCATCACGCACAGTGGGGAAGTCACAGCCATACTCGGCTCCAAAGGTAGCGGTAAACGCGCTCTCCTGGATGTCATAAGCCGCAGGGTTCCTTCCAAAGGCCACGTCCTGCTGGAAGGTCTGCCGCTGGAAAAAGAACAGTTTATGAACACCTGCGCGCTGGTACGACACTCTACTAAACTGATGCCCGGCCTCACAGTTCAACAGACGTTATCATTGTCTCTGACTAAAATATCTGGATACTTGAAGGCTTCGAAGGTTAAGCAAGTAATGGCCGACTTAGCACTATCGCAGGTAGCAAACAAATGCGTAACGAGTCTAACTAAGAGCGAGTACAGGCGGCTTGTGATCGGGGTGCAACTCATAAGAGATCCGATTATTTTACTATTGGACGAACCGACTTGGGACTTGGATCCACTCAACACATACCTAGTGATATCCATACTGTCCAACGCTGCCAAGAAATACGGCACAACTATCATACTCACCATGGAGAAACCGAGATCTGATGTCTTCCCTTTCCTTGACAGGGTAGTTTACCTGTGTCTGGGTGACGCGGTGTACGCGGGACCCACTCGCGCTCTACTGGACTATTTCACCGGCATCGGTTTCCCGTGCCCGCAGCTTGAGAACCCACTTATGTATTACCTATGTCTGTCGACGGTTGACCGACGTTCTCGGGAACGGTTTATAGAATCGAACCATCAAATCGCAGCCCTGGTGGAGAAATTCAAAACCGAGGGTGTTCCTCACGAACATGGAAGGAGCAACCCTAACAAAATACAGATGAGCTATGGAAAGCCGAGCGGCGTGCGAGTTATATGGATGCTATATTTACGCACGCTCGCTTCAATATTCAATTTAAGGAAACACGGCATCAAGCAAATGTCCATGAGACTCCTGACATTGCCGATTTACTTTTTCATTCTTTGGATCTTCTACAACGACGCTAAGGACTATCAACGTGCTTTCATAACAAAAAGTGGCCTCATTTTCAACGCTATGACCGGCACATACTTCATCAGTATATTGAACACGATATGTTTGTTCGGTCCGTACCGGTCTCGTTACTACTGTGAAAGCGAAGCGGGCGTGTACTCCGGGGCGAGCGCCCTATTAGCCTGGTCACTAGTTTCCTTACCAGCCTCGCTACTAACAAGTCTCGCTGCAGCCGCCATAGTCTACCCGATACTGGGAGACATATCTGAGGGTGTGGCCTTCCTGCAGTTCGCTTTGATCCTGTGGTCGTGCTACATCTACGCTGAACAACAAACCATTGCTATCATGATGTTCGTTAAGAACGGACTCGTCACCGCCCTAATCAATATATACATCACCTGCGTCTACGTCATGCTCGCGAGTGGAGTGTTGAGATCTTACAAAGGCTACGAGGACTGGATGTTCTACCTGACATACTTGACACACACCCGGTACGCTTCAATATTCCTACACAGGAGTGTCTTCAAGCAACCCACGTTCAACATACTTCCGTACAGTGAGAATGAGAACTGCACGTCCATAACAAATCTCATACAGACATCATCCAACATGAACGCAAACTCCAACGCCAACTGTCGCTATCCCAGCGGTAAAGCCTTCTTAACAGAACGCTTCACGTACAAGAACTTCGCCGGCGACATCTATCAGAGCGGTGACTTTAATATGGAATTCAATTTAGGTATTTCCTTCGCATTCTCGTTGGGAATTATTATCCTTAACAAATTTCTATACTTAATACCGCTGCCGGGATATATTGTGGATAAATTTAGGGAATAG

Protein sequence:

>DPOGS210042-PA
MIGSDYTLELCNVFHSGQVEPGSFFQRLTGSVKTGVILKDVSFITHSGEVTAILGSKGSGKRALLDVISRRVPSKGHVLLEGLPLEKEQFMNTCALVRHSTKLMPGLTVQQTLSLSLTKISGYLKASKVKQVMADLALSQVANKCVTSLTKSEYRRLVIGVQLIRDPIILLLDEPTWDLDPLNTYLVISILSNAAKKYGTTIILTMEKPRSDVFPFLDRVVYLCLGDAVYAGPTRALLDYFTGIGFPCPQLENPLMYYLCLSTVDRRSRERFIESNHQIAALVEKFKTEGVPHEHGRSNPNKIQMSYGKPSGVRVIWMLYLRTLASIFNLRKHGIKQMSMRLLTLPIYFFILWIFYNDAKDYQRAFITKSGLIFNAMTGTYFISILNTICLFGPYRSRYYCESEAGVYSGASALLAWSLVSLPASLLTSLAAAAIVYPILGDISEGVAFLQFALILWSCYIYAEQQTIAIMMFVKNGLVTALINIYITCVYVMLASGVLRSYKGYEDWMFYLTYLTHTRYASIFLHRSVFKQPTFNILPYSENENCTSITNLIQTSSNMNANSNANCRYPSGKAFLTERFTYKNFAGDIYQSGDFNMEFNLGISFAFSLGIIILNKFLYLIPLPGYIVDKFRE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: