MonarchBase - Protein-coding gene

DPOGS200379
Transcript	DPOGS200379-TA	2559 bp
Protein	DPOGS200379-PA	852 aa
Genomic position	DPSCF300026 + 1090740-1100432
RNAseq coverage	400x (Rank: top 30%)

Annotation
*Heliconius*	HMEL005382	0.0	82.59%
*Bombyx*	BGIBMGA007218-TA	1e-120	50.98%
*Drosophila*	CG1718-PB	1e-142	34.82%
EBI UniRef50	UniRef50_Q7PZY9	2e-154	41.55%	AGAP012155-PA n=9 Tax=Culicidae RepID=Q7PZY9_ANOGA
NCBI RefSeq	XP_001653234.1	2e-165	39.39%	ATP-binding cassette sub-family A member 3, putative [Aedes aegypti]
NCBI nr blastp	gi\|312372904	2e-164	39.11%	hypothetical protein AND_19498 [Anopheles darlingi]
NCBI nr blastx	gi\|158300460	1e-163	39.10%	AGAP012156-PA [Anopheles gambiae str. PEST]

Group
Gene Ontology	GO:0005524	5.6e-13	ATP binding
	GO:0016887	5.6e-13	ATPase activity
	GO:0000166	3.6e-05	nucleotide binding
	GO:0017111	3.6e-05	nucleoside-triphosphatase activity
KEGG pathway	mdo:100013281	1e-124
	K05643 (ABCA3)	maps->	ABC transporters
InterPro domain	[574-694] IPR003439	5.6e-13	ABC transporter-like
Orthology group	MCL10087		Patchy

Nucleotide sequence:

>DPOGS200379-TA
ATGAGGAATAAATTAGCTTCTTTCATACAAATAATAACACCGATAATAAATATATCAATATCCGTGTGGATAGCTCGTTCTTGGAAATTCATGTCCCAATTACCACCATTGGAACTCAGTTTGGAGAGTGGCTTTAGAAAAACTGTCACTTTAGTATCAGAAGGGACGAACTTAACTGATAACAGCATAGAAAGGAGAGCGATGATGGCTTATAAGGACTATTTCAAAAGCAGTTCAGATCCGACAATGTTATTGACTGATATCGGAAGATTGGATTTATCCAAGTTCTATTTGAAATTGCTTCAAGCGGATTTGCCAAGGGTTCGTTATGAGAACTTAGTTGGGGCTACGTTCGCACCTCAACGTATAACAGCGTGGTTCAGTAACTATGGTTACCACGACTCGGCTATATCACTCGCCATGGCCAATAATGCCATCATGGGAGCTCTATCACCAGGGAGCTCCTTAAAATTTATCAACCATCCCCTGCCCTACTCCATCGAAAATTTGCGTAATGTAATTTCGAAGCATCTATCTGGAGGTCAGAAGCGTCGTTTGTCAGTGGGGGCGGCGATGTGTGGCTCATCTAGAGTGGTACTATTAGATGAACCAACATCCGGTCTAGATCCAGCCGCTAGACGATCGCTATGGGACCTACTGCAGAGGGAAAAGAAAGGTCATATAAAATGTCTCATACCGACCTCGTTCCAGGTCCGCGTGATGGCGAGCGGCAGCAGTATGGGCTTCCAGTTCGCATTTAATATTGGATTCTGTATGGCTTTTGTTACATCTTTTTTGGTTCTCTTCGCTATTAAGGAACGTGTAAGTGGCGCGAAGCTCCTCCAGCGGGTGTCGGGAGTACGTCCCGCAATAATGTGGACAACCGCCCTCATATGGGATTGGTTCTGGCTGTTCATAGTGTTCATAGCGATCATAGTCACACTTGGACTCTTCCAGGAGAACACACTAGCGACACCGGCTGAATTAGGGAGGGTGATGTTGGTGCTGATTATATTCGCCTTTGCAATGATCCCGTTGCACTATTTAGCGTCTTTTTATTTCGAAGCATCAGCGACTGGTTTCTCAAAAATGTGCTTCATCAATATATTTTCAGGTTGTATGCCTTTCTTAATAACGGAAGTGCTGAGGTTACCGGAAGTCGGTAATCCGTACTACGCCCATATATTTGACTGGGTCTTCTCGCCTTTACCCATATACTGTATCAGTAGGAGCTTCAGGGATATGAGCGTGTCTGCGTTCTCTCTGCTGGCGTGTGACGCTCTCTGCGCCCAGCTCCCCGGTGTGAACTGTACCCGGTTCACGGTCTGCACGAAACTCAACGTCTCGGTTTGTTGTATGGAGGACGATCCCTTCCTGAGATGGAGTGAACCAGGCATCGGTCGTTATCTCTTCACGATGACTCTAGTCGGACTAATCTCGTTCACGATACTACTTATAAAAGAATACGAAATATTGAATAAGGTATTCTATTCCGAGAGCAAGCACGGCCTACCTGCTTTAGTAGCTGATGAAGACAGCGATGTTGCTAACGAAAGACAAACCGTGAGGGCGTTCACTAGAAACGAATTGACGCAGCACAGTCTCGTGTGTAGAGACTTAACTAAGTACTATAAGGACTTCCTGGCGGTCAACAGACTTAGTTTCGCGGTACATAAGGGTGAATGCTTCGGCCTTTTGGGGATTAACGGCGCGGGGAAGACCAGCACGTTCAGAATGCTTACCGGAGACTCCAGGCTGAGTTGTGGAGACGCTTACGTACACGGACTGTCGCTCAAGACGCGTATACAGGATGTTCACCGACACATCGGATATTGTCCGCAATTCGACGCGTTGTTGGAGAATCTAACAGCACGAGAAACTTTAAAGATATTCTGTCTCCTGCGTGGAATACCTGTTAAAGTTGGATCCGCGAGGGCCATACAGTTGGCAGAAATGTTGGGATTCTTCAGACATTACGATAAAAAGGTTCACGAATGTAGTGGTGGCACTAAAAGGAAAATTAGTACAGCACTAGCACTCCTTGGGGATTCACCTCTAGTGTTCCTTGACGAACCAACCACAGGCATGGATCCTGCCTCAAAGCGTTTAGTGTGGCGCTGTGTTAGCGAGGCAGCGGCCGGAGGAAGAAGCGTGGTCCTTACGTCGCACAGTATGGAAGAATGTGAGGCGCTGTGTTCGCGTTTAACGGTCATGGTAAATGGCCAACTGTACTGCCTCGGACCTCTTCAGCATCTCAAGAATAAATTCTCACAAGGTTACACACTTATCGTGAAATGTTCTTCCGGCGCAGACAGAGATGCCACTGTAGCGAAAATAAACCAATACGTCACGGACAACTTTCGGGACGCTAAACTTATTGAGACGTACCTGGGCATAAGTACTTATTATCTGAACGACCAAGACCTTCCGTGGTGGAGAGTTTTTCATCTCATGGAAGAAGCCAGAAGCCAGTTCCCCATAGAAGACTATTCTGTATCTCAGACCACGCTGGAGCAAGTGTTCCTTCGCTTCACCAGGAATCAGGGTCGAGGGGATTAG

Protein sequence:

>DPOGS200379-PA
MRNKLASFIQIITPIINISISVWIARSWKFMSQLPPLELSLESGFRKTVTLVSEGTNLTDNSIERRAMMAYKDYFKSSSDPTMLLTDIGRLDLSKFYLKLLQADLPRVRYENLVGATFAPQRITAWFSNYGYHDSAISLAMANNAIMGALSPGSSLKFINHPLPYSIENLRNVISKHLSGGQKRRLSVGAAMCGSSRVVLLDEPTSGLDPAARRSLWDLLQREKKGHIKCLIPTSFQVRVMASGSSMGFQFAFNIGFCMAFVTSFLVLFAIKERVSGAKLLQRVSGVRPAIMWTTALIWDWFWLFIVFIAIIVTLGLFQENTLATPAELGRVMLVLIIFAFAMIPLHYLASFYFEASATGFSKMCFINIFSGCMPFLITEVLRLPEVGNPYYAHIFDWVFSPLPIYCISRSFRDMSVSAFSLLACDALCAQLPGVNCTRFTVCTKLNVSVCCMEDDPFLRWSEPGIGRYLFTMTLVGLISFTILLIKEYEILNKVFYSESKHGLPALVADEDSDVANERQTVRAFTRNELTQHSLVCRDLTKYYKDFLAVNRLSFAVHKGECFGLLGINGAGKTSTFRMLTGDSRLSCGDAYVHGLSLKTRIQDVHRHIGYCPQFDALLENLTARETLKIFCLLRGIPVKVGSARAIQLAEMLGFFRHYDKKVHECSGGTKRKISTALALLGDSPLVFLDEPTTGMDPASKRLVWRCVSEAAAGGRSVVLTSHSMEECEALCSRLTVMVNGQLYCLGPLQHLKNKFSQGYTLIVKCSSGADRDATVAKINQYVTDNFRDAKLIETYLGISTYYLNDQDLPWWRVFHLMEEARSQFPIEDYSVSQTTLEQVFLRFTRNQGRGD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: