Monarch geneset OGS2.0

DPOGS200261
TranscriptDPOGS200261-TA5160 bp
ProteinDPOGS200261-PA1719 aa
Genomic positionDPSCF300026 - 1103169-1117848
RNAseq coverage162x (Rank: top 52%)
Annotation
HeliconiusHMEL0053820.041.34% 
BombyxBGIBMGA007217-TA0.059.31% 
DrosophilaCG1718-PB0.037.20% 
EBI UniRef50UniRef50_Q7PZY90.039.02%AGAP012155-PA n=9 Tax=Culicidae RepID=Q7PZY9_ANOGA
NCBI RefSeqXP_001851807.10.038.53%ATP-binding cassette sub-family A member 7 [Culex quinquefasciatus]
NCBI nr blastpgi|1700482800.038.53%ATP-binding cassette sub-family A member 7 [Culex quinquefasciatus]
NCBI nr blastxgi|1583004620.038.82%AGAP012155-PA [Anopheles gambiae str. PEST]
Group
Gene OntologyGO:00055245.3e-19ATP binding
GO:00168875.3e-19ATPase activity
GO:00001663.3e-06nucleotide binding
GO:00171113.3e-06nucleoside-triphosphatase activity
KEGG pathwaygga:4163860.0 
 K05643 (ABCA3)maps-> ABC transporters
InterPro domain[594-714] IPR0034395.3e-19ABC transporter-like
[579-768] IPR0035933.3e-06ATPase, AAA+ type, core
Orthology groupMCL10087 Patchy
Genotypes for resequenced monarchs and outgroup Danaus species

Nucleotide sequence:

>DPOGS200261-TA
ATGTGGAAGAACTTTCTTCAGCAATGGCGACATCGAATTCAAACTGTAGTGGAAATGCTCTTACCGGTAGCAACAATGGCACTAATCCTCATACTTAGGCATCAGATTGAACCGATTCGTCAGGATACAGTAGTTTATCCACCAGTACCTGCATATTCTTTAAAATTTTCTACAACAGTTTTAGCTGGATTAAATATAAGCAAACTTTCAGTAGCTTATTCTCCAGAGAGTCCAGTTTTAGAAACCGTTATACAAAATGCTCTAGTTAATTTATTTACTCCAAATATAAAAGACCTCATACAAATTATAAAAGACAATTGGGGTGAAGGTGGTTTACCATCACCGATACCGCCTAACGTAATTAATAATCCAGCTATCATCGGAGATATTGTAAAGTTGCTTATACGAATACAACCTTATAATAATAGTAGAGCACTCGAAACGGTTTACAGCGAAGAGAAAGCTATTCGTGAAGTCATAGCTGCGGTACAATTTGATAACGACCTTCTCGGATTGGACGACTCCAGGAAAGTTCCGTTTAATATGACATATTTTTTACGTTTTCCCGAAAAACCACGTCAGTATTCGTTATTTGGAATTGGTGGAAACAGTTGGCGTACCGACGAAATTTTCCCATTTTTTGAGGTACCAGGTCCGAGGTTTCCTTTTTCTTGGGAAGGTGGCAATGATCCAGGTTATGTCAATGAGTTATTTATTGGTTTTCAACACGCGATATCTATGGAATTAGTGGAGCTTATGACAGGGCAAAGTTTAAAAGACTTCACAGTGCATATAAACCGTTACCCACACCCGCCTTATGTTCAAGATTTGGCAGTGGAAGCATTGATGTATATATTCCCGATGTTCATAATGCTTAGCTTCAGTTACACCGCCGTCAATATTATTCGAACAATAACCATCGAAAAGGAACTACAGCTAAAGGAAACTATGAAAATTATGGGTTTGCCGACGTGGTTGCATTGGATGGCATGGTTCTGGAAACAATTCATCTATTTGTTCGTAACAGGCTTGCTAATTACTGTAATTCTAAAGGTAAATTGGTTCACAAACGAGCAGGGCTTCAGTGGTTATTCTGTATTTACTAAAACACCATGGACTGTAATATTGTTATTCATAATGTTGTATTTATCTTGTACGATATTCTTCTGTTTCATGATAAGCAGTTTCTTCTCTAAAGGTAGCGTTTCAGCGCTGTTTGGGGGAGTTATATGGTTTATTACCTTTATTCCTGCTTTTCTACTGGGGATGGATGTACAAGTCTCTCTTCCTGTACAGGCTATTACTTGTCTGAGTATTAATTCCGCTATGTCATATGGTTTTCAACTAATATTAGGAGCAGAGGGTAGTCAAGGTATGCATTGGGGAGAGTTTTTCGCGACGCATTCCATTGAAACAGATCGTCTTTTATTCGGACATGTATGTCTGATCCTGTTGTTGGATTGTTTTCTGTATATGCTGCTGGCCCTGTACTTCGAGCAGGTGCTCCCAGGACCTTGTGGAACCGCACGGCCATGGTACTTCCCGTTCCAGAAATCCTTCTGGTTCCCATCGAAACAAATTAATCATAATTATGAAGCTTACAATAATCCTGAATATAACATTGCTATTAAGGAAAAAGATCCTACAAATCTTAAAGTAGGAGTAAAAATGGCGAATCTTACGAAAATGTATGGAAGAAATTTAGTTGTTGACAATTTATGTCTGAACATATATGACGACCAAATCACGGTGCTGTTGGGACATAACGGTGCAGGAAAGTCTACAACGATATCAATGTTGACGGGTAACGTGGAGGTAACACGTGGCAATGTGTGGGTTGCTGGATACGACATGACGACACAGACGCAGCTCGGACGCGCTCACATTGGACTATGTCCGCAGCACAATGTCCTCTTCAACGAGTTGACTGTTCGCGAGCACCTTGAATTCTTCGCACGCCTTAAAGGCTACAGCGGTCAACAGCTTGACGATGATATCGATAAGCTTATTGATAGCCTGGAAATGCAGGAAAAGAAAAATTATCTCGCGGAGGGTTTGTCTGGTGGTCAGAAGCGTCGGTTGTGTGTTGGCATAGCGTTATGTGGAGGTGCGCGGGTGGTGCTGCTTGATGAACCTACTTCCGGCATGGATCCTTCCTCGCGACGAGCGCTCTGGGAACTGTTGCAGAGGGAGAAGAAGAATCGGTCTATGATTTTGACGACGCACTTCATGGACGAGGCAGACTTTCTTGGTGACAGAGTAGCAATCATGTCGAGTGGCAGGCTTCAATGTGTTGGTTCTCCATACTTCCTAAAGCAACATTATGGAGTCGGTTATACTCTGGTCATAGTTAAAAATAAAGACTTCCAATTAGACCTCTGCACATCCCTAATTGGGAAGTACATACCAGGCACTATAGTCAAACAAGACCGGGGAAAGGAAGTGACGTACAGTCTCCCTAACAATTATTCACATCTATTTGAAGAGATGCTGAACGATCTAGAGAAGAACTATGAAAATATTAATTATAAGAATTACGGTTTAATAGCAACCACTTTGGAAGACGTATTTATGTCAGTCGGATCTGACGTAGAGGTAAACTCTGAATCCGACGACACAACCATCACAGCCACTGCATCCGAATGTACTGACAACGATCAAAATGATCTTGCATTAGATCAACTACATAGAAGTGATGAAAGTGAAACCGGCGCTAGACTACTTTGGTTGCACGTTAGTGGTATTTGGTTGAAATTGTTCTGGGTATCGACTCGTTCCTGGGGCATGCTGCTATTGCAAATTTTGGTGCCTATTATTAATATTAACGCAAGTTTGGCAATATTAGAATATTTATTTGCTAATCGAGCCACGGTTATTCCGCGTGCGCTATCTCTCTCACAAGGATATCTTTCGACGGAAACTTTATTAGGTTTTAATGGCACCGAATCATCCTCTTTAGGGGCTCGGGCTGTGCGAGGCTATGAACTATTATATAACACATCAAACGTAGAGAGCATGAGACTCACTGTGCTTGATAAAACTGGAGTCGATGAGTACTATTTAAATCAGACTGAAGATCCGGTCGTCATGGCGGCCATACGTAATCAATTTTTGTTGGGAGCCACGTTTGCGGACAAAGCAGCGGTTGCGTGGTTTAGTAATTTTGGTTACCATGATGTAGCCACCTCTCTGGCAAATGTACACTCGGCTATACTGAAAGGAATTAACCCATCCGCCATTCTGAACGTCTTCAACTATCCGCTACAAGCCACTTATAGAGATAGAAGCGACCTCCAAATGATGATGTCCTTGCTGTCAATGCAAGTGGCCTCAAGTGTCGGTAACAGTTTAGCCATCCTCAGCGCAGCATTCGTCATGTTTTACATCAAGGAGCGAGTGACCCGCGCCAAGCTCCAACAGAGCGCTGCTGGTGTACGTCCAGCTGTAATGTGGGGTGCAGCAGCTGTGTTTGACTGGCTTTGGTTCGTGGTACTGTGTCTGCCGATAATTATATCCTGCGCAGCATTCGCAGTTTTAGGACTTTCTACTGCTAAAGAGCTTGGTTACTTGTTTCTATGTCTGATGGTGTATGGCGCGGCCATGTTGCCTCTCCACTATCTCTTCTCGCTGCTCTTCAACGGACCGGCAATTGGATTTGTTATTTTATTCTTTGTTAACGTTCTTTTTGGACTCTTGGGTGCACAAATAGTTGAAGCGTTAAGGTCTATAGCTACCAGTACGAAGCTTGCAGCGACTGCATTGGACTATGTTTTGCAGTTTTTCCCTCTATATAGCCTTGTTACAGCCACTAGGTTGATGAACCAATTAGGATTAAAGACTTTCACGTGTTTGGAAGCTTGTGCAAATCTGTTAGAAACTGTCATTGGGAACACCACTAGCTGTAACATGGAATTCCTTTGTACACAGTTCCCGGACACGTGTTGTGTTAGCGAAAGCTTGTTCGAGTGGGAGGATCCTGGAATTTTGCGCTACATAATATGCATGATCGTAACCTGTGTCCTCATGTGGACTCTGTTGATGGTTTTGGAACATAATTTGATACAAAGGTTGTTGACTAAACGCCGCAGTCCACCTCCGTCTTCTGACCCAGTAGACGAGGATGTTTTGGAAGAGGCTCAACACGCTCGGCGCGCGGACCTCGCTAACGGGCTCGTGGCACGTGGACTGACCAAGTACTACGGGAACCATCTCGCCGTGGACAACATATCATTTACTGTCAACGAAGCCGAGATTTTCGGATTGCTCGGAGTGAACGGTGCGGGTAAGACGACGACGTTCAAGATGCTTATGGGAGACGAGTCTATATCCAGCGGCGACGCTTTCATCAGCGGTTACTCAGTCAGAAATAATATCACTGAAGTTCACCAAAATATCGGTTACTGCCCTCAATTCGACGCTGTGTTTGATGAATTGACCGGACGGGAAACAATTCACTTGTTCTCGCGATTTCGGGGGCTGAAATACGCTAACTCCCCCGTGAGGGCAGAGATAATCGCTAATGCACTTGGTTTTACCAAACATTTAGATAAAAGGGTGAAGCAGTATTCCGGCGGGAACAAGCGCAAGCTGAGCACAGGAGTGGCGCTGTTGGGAAGGACGGGGCTGGTGTTTGTCGACGAGCCCACCACGGGAGTGGACCCTGCCGCTAAGCGGACCGTCTGGCGAGCCCTGAGAGACGCTAAGAAGGCGGGTCGAGCCTTCGTGCTCACGTCACACAGTATGGAGGAGTGCGAGGCGTTGTGTGACCGTCTCACTATCATGGTCAATGGTCGATTCAGATGCTTAGGATCACCGCAGCATCTTAAAAATAAGTTCTCTGAAGGGTTCACATTGACTATAAAGGTACTAGGACGAACTAATGAGGACTCCCCAAGAACTTCAATCAAAAGCGAAAGCAGTACCCAGGCCGTGAAACAATACGTTTCTGATAATTTCAACAACGCAAAATTAATGGAGGAATATCAAGGTCTATTAACGTACTACCTACCTGATAGAAGCGTGCCCTGGTCAAAGATGTTCGGTATTATGGAACAAGCGAAAAGAGAGCTCGACGTCGAGGACTACAGCATCATGCAGACCACATTAGAACAGATATTCCTACAATTCACTAAATACCAAAATGAAGCTAGAGAAACGTAA

Protein sequence:

>DPOGS200261-PA
MWKNFLQQWRHRIQTVVEMLLPVATMALILILRHQIEPIRQDTVVYPPVPAYSLKFSTTVLAGLNISKLSVAYSPESPVLETVIQNALVNLFTPNIKDLIQIIKDNWGEGGLPSPIPPNVINNPAIIGDIVKLLIRIQPYNNSRALETVYSEEKAIREVIAAVQFDNDLLGLDDSRKVPFNMTYFLRFPEKPRQYSLFGIGGNSWRTDEIFPFFEVPGPRFPFSWEGGNDPGYVNELFIGFQHAISMELVELMTGQSLKDFTVHINRYPHPPYVQDLAVEALMYIFPMFIMLSFSYTAVNIIRTITIEKELQLKETMKIMGLPTWLHWMAWFWKQFIYLFVTGLLITVILKVNWFTNEQGFSGYSVFTKTPWTVILLFIMLYLSCTIFFCFMISSFFSKGSVSALFGGVIWFITFIPAFLLGMDVQVSLPVQAITCLSINSAMSYGFQLILGAEGSQGMHWGEFFATHSIETDRLLFGHVCLILLLDCFLYMLLALYFEQVLPGPCGTARPWYFPFQKSFWFPSKQINHNYEAYNNPEYNIAIKEKDPTNLKVGVKMANLTKMYGRNLVVDNLCLNIYDDQITVLLGHNGAGKSTTISMLTGNVEVTRGNVWVAGYDMTTQTQLGRAHIGLCPQHNVLFNELTVREHLEFFARLKGYSGQQLDDDIDKLIDSLEMQEKKNYLAEGLSGGQKRRLCVGIALCGGARVVLLDEPTSGMDPSSRRALWELLQREKKNRSMILTTHFMDEADFLGDRVAIMSSGRLQCVGSPYFLKQHYGVGYTLVIVKNKDFQLDLCTSLIGKYIPGTIVKQDRGKEVTYSLPNNYSHLFEEMLNDLEKNYENINYKNYGLIATTLEDVFMSVGSDVEVNSESDDTTITATASECTDNDQNDLALDQLHRSDESETGARLLWLHVSGIWLKLFWVSTRSWGMLLLQILVPIININASLAILEYLFANRATVIPRALSLSQGYLSTETLLGFNGTESSSLGARAVRGYELLYNTSNVESMRLTVLDKTGVDEYYLNQTEDPVVMAAIRNQFLLGATFADKAAVAWFSNFGYHDVATSLANVHSAILKGINPSAILNVFNYPLQATYRDRSDLQMMMSLLSMQVASSVGNSLAILSAAFVMFYIKERVTRAKLQQSAAGVRPAVMWGAAAVFDWLWFVVLCLPIIISCAAFAVLGLSTAKELGYLFLCLMVYGAAMLPLHYLFSLLFNGPAIGFVILFFVNVLFGLLGAQIVEALRSIATSTKLAATALDYVLQFFPLYSLVTATRLMNQLGLKTFTCLEACANLLETVIGNTTSCNMEFLCTQFPDTCCVSESLFEWEDPGILRYIICMIVTCVLMWTLLMVLEHNLIQRLLTKRRSPPPSSDPVDEDVLEEAQHARRADLANGLVARGLTKYYGNHLAVDNISFTVNEAEIFGLLGVNGAGKTTTFKMLMGDESISSGDAFISGYSVRNNITEVHQNIGYCPQFDAVFDELTGRETIHLFSRFRGLKYANSPVRAEIIANALGFTKHLDKRVKQYSGGNKRKLSTGVALLGRTGLVFVDEPTTGVDPAAKRTVWRALRDAKKAGRAFVLTSHSMEECEALCDRLTIMVNGRFRCLGSPQHLKNKFSEGFTLTIKVLGRTNEDSPRTSIKSESSTQAVKQYVSDNFNNAKLMEEYQGLLTYYLPDRSVPWSKMFGIMEQAKRELDVEDYSIMQTTLEQIFLQFTKYQNEARET-