MonarchBase - Protein-coding gene

DPOGS212301
Transcript	DPOGS212301-TA	2787 bp
Protein	DPOGS212301-PA	928 aa
Genomic position	DPSCF300491 + 17240-29058
RNAseq coverage	598x (Rank: top 21%)

Annotation
*Heliconius*	HMEL017587	0.0	85.26%
*Bombyx*	BGIBMGA005473-TA	0.0	79.49%
*Drosophila*	Hmt-1-PA	7e-176	65.49%
EBI UniRef50	UniRef50_F4W5V6	2e-167	61.46%	ATP-binding cassette sub-family B member 6, mitochondrial n=1 Tax=Acromyrmex echinatior RepID=F4W5V6_ACREC
NCBI RefSeq	XP_307900.4	0.0	71.82%	AGAP002278-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|380021186	0.0	58.04%	PREDICTED: LOW QUALITY PROTEIN: ATP-binding cassette sub-family B member 6, mitochondrial-like [Apis florea]
NCBI nr blastx	gi\|380021186	0.0	58.04%	PREDICTED: LOW QUALITY PROTEIN: ATP-binding cassette sub-family B member 6, mitochondrial-like [Apis florea]

Group
Gene Ontology	GO:0006810	3.6e-41	transport
	GO:0055085	3.6e-41	transmembrane transport
	GO:0005524	3.6e-41	ATP binding
	GO:0042626	3.6e-41	ATPase activity, coupled to transmembrane movement of substances
	GO:0016021	3.6e-41	integral to membrane
	GO:0016887	1.4e-19	ATPase activity
	GO:0000166	4.1e-18	nucleotide binding
	GO:0017111	4.1e-18	nucleoside-triphosphatase activity
KEGG pathway	dme:Dmel_CG4225	6e-174
	K05663 (ABC.ATM)	maps->	ABC transporters
InterPro domain	[200-468] IPR011527	3.6e-41	ABC transporter, transmembrane domain, type 1
	[243-465] IPR001140	9.8e-24	ABC transporter, transmembrane domain
	[685-810] IPR003439	1.4e-19	ABC transporter-like
	[670-856] IPR003593	4.1e-18	ATPase, AAA+ type, core
Orthology group	MCL13549		Single-copy universal gene

Nucleotide sequence:

>DPOGS212301-TA
ATGGAGTACTGTCCGCCGAATATAACTTTAGAAGAGATCTGGATAGATCATGGAATTTCACAATGTTTTATGGAGACTGTAACTGCCACTCTAATTGGAGGATTTCTTCTGGTTTTCGGTATAACACAAATTGTCATGTATAAAAGATATGCTACAGAAATAACCGATGTCAGATCTTCAAAGCTGTTTGTAGTACAATTGTTCTTCACACTTTTTGTGCCAGTTTTGGCTATAATTCGTTTTCTGTTACAAGCTTTTGTATTTAAAGGAGGACATATCTATGGATACATGATAACATTACTTGTGATATTCCCACTGTCGGCGTATTTAGCTGTGATTGAAAGACGGTTCCTTTTACCGTCAGTGTTACCGAGGGGCCATGGTTTTGTATTGCTTGTATTTTGGGCAATGATATTTATATCAGAGAATTTATCATTTTTAAATTTGAATAAGGATGGATGGTGGTGGCATTTGAAAGATCTCCAAGATCGCCTCGAAATGGCCCTGTTTGTTGGTCGGTATGTCTCATGTATGTTAATGTTCATCCTCGGGATGAAAGCACCAGGTATTATGCATCCATTTGAATATCTCGACTCTGATGACGATAATCGTAGAAACATACCACCTAGGAATGACAGCGGTTCAACATTCCGAAATGTATTCGGCAAAATGCGTACCCTGCTGCCGTTCATGTGGCCCAGCAAGAGCGTTTGTCTGCAGATATACGTGTTCATATGTGTGCTAGCTCTGCTCGCTGGAAGGGTCATCAACCTTTACGTACCTATATATAACAAGAAAATAGTTGACAGTCTTTCAATACCGCCGCTTCACTTCCGATGGGATCTGGTGGTTTTGTACGTTTTCTTCAAGTTTCTCCAAGGAGGCGGCACTGGCGGTATGGGACTCTTGAACAACCTGAGATCCTTTCTCTGGATACGAGTCCAACAGTATACGACGAGAGAGCTACAGTTGAAGTTGTTTCGGCACCTACACGATTTACCTCTCAAGTGGCATTTATCGCGGAAGACGGGCGAGGTGTTGAGGGTTATGGACAGAGGCACGGACTCCATAGACAATCTCCTGTCCTACATACTATTTTCCATAACACCCACCATCATAGACATCTTAGTCGCCGTGGTGTACTTCGTGACAGCCTTCAACGCGTGGTTCGGACTCATCGTCTTCGCCACCATGGTTCTGTATATAATCGCAACAATAGCTGTAACAGAATGGCGTACGAAGTTCCAGCGTAGAATGAATCAAGCTGACAACGAGCAGAAAGCACGCTCAGTGGATTCGCTTCTCAATTTCGAAACAGTCAAATATTATGGCGCTGAGACTTATGAGGTTTACTCATACAAGGACGCCATCTTGAATTACCAGGTACACCAGATCTTACTATATAATTCAGAATTTCAAATTCAGAAACGTTTTCTACTCGCAACAATAGCTGTAACAGAATGGCGTACGAAGTTCCAGCGTAGAATGAATCAAGCTGACAACGAGCAGAAGGCACGCTCAGTGGATTCGCTTCTCAATTTCGAAACAGTCAAATATTATGGCGCTGAGACTTATGAGGTTTACTCATACAAGGACGCCATCTTGAATTACCAGAAAGAAGAATTCAAGTCTCTGTTAACACTGAGCATGTTGAATACTATGCAGAACATCATTATATGTGTGGGTCTACTGACGGGTTCTCTCCTGGCGATATCCATGGTGGTTAGAACCTACCAGCTAACCGTCGGTGACTATGTACTGTTTGCGTCATATATTGTCCAACTATACGTGCCTTTGAACTGGTTTGGGACCTATTACAGGGCTATCCAAAAGAACTTTGTTGATATGGAGAATATGTTCGATCTTCTCCGCGTGGACTCTGACGTGAAGGACGTGCCGGGCGCACCGGATTTACTCATCAGGAGGGGGGGCATCGAGTTCAAGCACGTGTCGTTCGGCTACGGACCGGAGAGATTGGTCTTGAATGATATCAGTTTCAAAGTGGCACCGGGATCCACCGTCGCCTTGGTTGGTCCAAGCGGAGCCGGTAAGTCGACCGTGATGCGTCTCCTGTTCCGTTTCTACGACGTTAATGGCGGCGCTGTCCTTGTCGACGGACAGGACGTGGCGACCGTGACTCAGGCCTCCCTGAGGGCCGCCATTGGTGTCGTGCCACAAGATACCGTGCTCTTTAACAACACTGTCAGATACAACATACAGTACGGCCGTCTGACAGCATCTTCCTCGGACATCATCGCGGCGGCGAAGAATGCGGACATCCACGACAGAATACTCACTTTCCCCGACGCTTACGACACTCAGGTAGGAGAGAGGGGTCTCCGTTTGAGCGGCGGAGAGAAGCAAAGGATAGCCATCGCTAGAACACTACTGAAGGACCCCGCTATAGTACTGTTGGACGAGGCGACCTCCGCGCTAGACACTAACACCGAAAGAAACATACAATCCGCCTTAGCCCGGGTATGCGCCAACAGAACGACGTTGATAATAGCCCATAGACTATCCACTATAATACACGCGGACGAAATTCTTGTACTTAAAGACGGGGAGATTGTCGAAAGGGGAAACCACGAGGCATTATTAGCATTGGAGGGTGTATACGCTTCGATGTGGCACCAACAGCTCGAGAGTAGAAATAGCAATGGCAACGGTAATGGGAACAACGAAACTAACGCTGAAGGAAACAACAACAACAACAACAGACCGAGCCAACAACAGAACGGCTCCAGCGTGTTTCCACAAGGCCACGGGCATGGCCATGGCCATTAA

Protein sequence:

>DPOGS212301-PA
MEYCPPNITLEEIWIDHGISQCFMETVTATLIGGFLLVFGITQIVMYKRYATEITDVRSSKLFVVQLFFTLFVPVLAIIRFLLQAFVFKGGHIYGYMITLLVIFPLSAYLAVIERRFLLPSVLPRGHGFVLLVFWAMIFISENLSFLNLNKDGWWWHLKDLQDRLEMALFVGRYVSCMLMFILGMKAPGIMHPFEYLDSDDDNRRNIPPRNDSGSTFRNVFGKMRTLLPFMWPSKSVCLQIYVFICVLALLAGRVINLYVPIYNKKIVDSLSIPPLHFRWDLVVLYVFFKFLQGGGTGGMGLLNNLRSFLWIRVQQYTTRELQLKLFRHLHDLPLKWHLSRKTGEVLRVMDRGTDSIDNLLSYILFSITPTIIDILVAVVYFVTAFNAWFGLIVFATMVLYIIATIAVTEWRTKFQRRMNQADNEQKARSVDSLLNFETVKYYGAETYEVYSYKDAILNYQVHQILLYNSEFQIQKRFLLATIAVTEWRTKFQRRMNQADNEQKARSVDSLLNFETVKYYGAETYEVYSYKDAILNYQKEEFKSLLTLSMLNTMQNIIICVGLLTGSLLAISMVVRTYQLTVGDYVLFASYIVQLYVPLNWFGTYYRAIQKNFVDMENMFDLLRVDSDVKDVPGAPDLLIRRGGIEFKHVSFGYGPERLVLNDISFKVAPGSTVALVGPSGAGKSTVMRLLFRFYDVNGGAVLVDGQDVATVTQASLRAAIGVVPQDTVLFNNTVRYNIQYGRLTASSSDIIAAAKNADIHDRILTFPDAYDTQVGERGLRLSGGEKQRIAIARTLLKDPAIVLLDEATSALDTNTERNIQSALARVCANRTTLIIAHRLSTIIHADEILVLKDGEIVERGNHEALLALEGVYASMWHQQLESRNSNGNGNGNNETNAEGNNNNNNRPSQQQNGSSVFPQGHGHGHGH-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: