MonarchBase - Protein-coding gene

DPOGS213917
Transcript	DPOGS213917-TA	3015 bp
Protein	DPOGS213917-PA	1004 aa
Genomic position	DPSCF300218 + 107420-138474
RNAseq coverage	423x (Rank: top 29%)

Annotation
*Heliconius*	HMEL006071	78.22%
*Bombyx*	BGIBMGA004625-TA	67.03%
*Drosophila*	ClC-a-PD	58.06%
EBI UniRef50	UniRef50_B0WA14	54.55%	Chloride channel protein 2 n=1 Tax=Culex quinquefasciatus RepID=B0WA14_CULQU
NCBI RefSeq	XP_001604692.1	57.45%	PREDICTED: similar to chloride channel protein 2 [Nasonia vitripennis]
NCBI nr blastp	gi\|332017823	57.53%	Chloride channel protein 2 [Acromyrmex echinatior]
NCBI nr blastx	gi\|347968770	56.89%	AGAP002891-PE [Anopheles gambiae str. PEST]

Group
Gene Ontology	GO:0055085	4.1e-112	transmembrane transport
	GO:0005216	4.1e-112	ion channel activity
	GO:0016020	2e-70	membrane
	GO:0006821	2e-70	chloride transport
	GO:0005247	2e-70	voltage-gated chloride channel activity
KEGG pathway
InterPro domain	[109-970] IPR001807	0	Chloride channel, voltage gated
	[168-642] IPR014743	4.1e-112	Chloride channel, core
Orthology group	MCL10733		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS213917-TA
ATGAAGTTTAAAAAACAGACCCTAGTGTCGGGGGATACGTCGGAGGAGGAGATCGGGCACAGCTATTTGGGAACTCTGGGTCCGTCGGTACATATAGCGTCTATGGTGGCTACGTTGCTGTCTAAACTGGTAACCACCTTCCAAGGGATATATAGTAACGAATCTCGGACAAGCGAGATGTTGGCTGCTGCTTGTGCTGTAGGAGTTGCTTCCTGCTTTGCTGCCCCTGTGGGAGGTGTGTTGTTTTCCATCGAAGTAACGACGACTTACTTCGCGGTGAGGAACTACTGGCGAGGATTCTTCGCTGCCTGCTGCAGTGCTATTATGTATGGTCGCTATCAACGCGATTTAAGCGAAGCGGCCAGAGAAGAAGCAAGAAGACTAAGGAGATTGCGGAAGAAAAGACGAAAAGATGATAAGTTACGGCAAAAAGAATTGGAAGCCTCAGGAAAACATCGCCCCAGAGGAAGGTTCTTTAAAGTATTAGGCTACATTTGGCGGAATACCTTCGCACGTCTCGGCGAGGACTGGGTCTTCCTTGCGCTGCTGGGCATCATAATGGCTGTACTAAACTTTGCCATGGACAAGGGCATTGCAGTATGCAATAATGCTCGTATGTGGATGTATAAAGACCTGGCCACATCCACCTTCAGTCAGTATGTGGCGTGGGTCTCTCTGCCTGTTTGTCTAATCCTCTTCGCTGCCGGCTTCGTCCATATTGTCGCCGCTCAGAGTATTGGTTCTGGCATACCAGAGATGAAGACGATTCTAAGAGGAGTCCACCTCAAGGAATACTTGACGTTCAGAGCTATGGTCTCTAAAGTTATCGGTCTGACAGCCACCCTTGGATCTGGTTTACCATTGGGTAAAGAGGGTCCGTCGGTACATATAGCGTCTATGGTGGCTACGTTGCTGTCTAAACTGGTAACCACCTTCCAAGGGATATATAGTAACGAATCTCGGACAAGCGAGATGTTGGCTGCTGCTTGTGCTGTAGGAGTTGCTTCCTGCTTTGCTGCCCCTGTGGGAGGTGTGTTGTTTTCCATCGAAGTAACGACGACTTACTTCGCGGTGAGGAACTACTGGCGAGGATTCTTCGCTGCCTGCTGCAGTGCTATTGTACATAGAGATAAAAATGATTATAATAAAAGAACTATAGGTTTTAGAACTTCCAGCACTCAGATAATAGAAATATACTCGATTTTAATTAGCTACTTTATCGTCTGCGGGCTGATGGCAGCCCTGTGGGTGTTCCTCCACCGCCAGTACGTGCTCTTCATGAGAAACACCAAGGTCCTCAGTAACTTCCTACAGAAAAACCGCTTCATCTACCCTGGAGTGATGACCTTGGTTGTGATGTCCGTTCTGTTTCCTCCCGGGATTGGGAAGTATATGGCGGCTGACCTTGGAAACCAGGAACAGGTTTTGTCTCTGTTTTCGAACTTCACGTGGTCCGATGCGTTGACAGCGGAGCAGGCGGCGCTGGTCGATCACTGGCGGACCGAGGACGTTGGACACTTCGCTGTACTCGTTATTTACTTCTTCAGCATTTTCTTCCTCAGTATGGTTTCCTGCACACTTCCGGTTCCTGCTGGTATATTCGTGCCAGCGTTCAAGATGGGCGCCGCCCTAGGCCGGTTCACTGGAGAAGTGATGCACTACTTCTGCCCCCTTGGCGTCGCTTACGGTGGACACATACAGAAGATATTGCCTGGTGGTTACGCGACAGTAGGTGCCGCTGCGTTCACCGGGGCCGTAACTCACACCGTTTCTACGATCGTTATATGTATTGAGATGACAGGACAGGTGACTCACCTGCTGCCTATCATGGCGGCGGTGCTGTCCGCTAACGCGACAGCGGCTCTGCTGCAGCCCTCGTGCTTCGACAGCATCATCCTCATCAAGAAGCTGCCTTACCTGCCCGATCTGCTCTCGTCAGCGAGTCGTATGTACGATATATGCGTGGAAGACTTCATGGTGAGAGACGTCAAGTACATCTGGAACAGGATGACCTTCCAGCAGTTGAAGGATTTGCTTAAAGAAAATAAGTCTATCAAGAGTTTCCCACTGGTATCCTCCCCATCCTCTCCCGTGCTCCTCGGGTCCATCCATCGCTGGGAGCTGGTGCGCCTGATCGAGCAGCGTGCTGGACGAGCCAGACGGCTCCAGGTTGCAGCTTTATGGAGACGAGAGGCTGAAGCTAGAAGAAGGCCCTCCCGCTTTGAAGTCACCGCAGCCTCGCTTACTGATACCAGCAAGGCAGGGCTCGTACCACCACCCGGCCAGCTGTTCCGCCCTAAGTCTATCTTGAAGAAGACCAATTCGTTCACTCTAACTCGTGGTCTAAGTTCACCTTCGACCCCCTCGACCCCGCAGCCTAATGTGTACACCACTGTAACCGGCGCGGAGACCAGGATCCGCGCGGCGTTCGAGGCTATTTTCAAGCGGTCAACTTTGCTGCCGGACGTGGAGGGTGGACTCGGAGACCACGGCCTGCCCAGAAGTCCGTCCATCAACAAGAAAGTACAATTGCCCCGCGAGCGTGTATGTGACATGTCCCCCGAGGATCAACGAGCCTGGGAGATGATGGAGATGTCCCGGGAGATAGACTTCGATAGAATGCTGACCATCGTCCGGCATAGAGATATGACGGCGGAGGAGTCCGATCATGACGATGAAGACGACTCGCTGTACGTGTGTCACATCGACCCAGCGCCCTTCCAACTGGTTGAGAGGACCTCGCTTCTTAAGGTCCACTCTCTCTTCTCTACTCTCGGCGTGAGTCGCGCATACGTCACCGCTATAGGAAGACTCATCGGTGTTGTAGCGCTTAAAGAGCTTCGGAAGGCCATAGAGGATGTGAATTCCGGTACATTGACCCCCACCAGCCACACCGCTGCGGCGACGTCGCTTCCGGTCCCTCGACCTCCGACTGTCCTGGTCCAACCGCCCCGGGAGCCCGCTCCTCCCTCCGACAAAGACACCGACAAACTGACAGTTGCGAGCGATAAATGA

Protein sequence:

>DPOGS213917-PA
MKFKKQTLVSGDTSEEEIGHSYLGTLGPSVHIASMVATLLSKLVTTFQGIYSNESRTSEMLAAACAVGVASCFAAPVGGVLFSIEVTTTYFAVRNYWRGFFAACCSAIMYGRYQRDLSEAAREEARRLRRLRKKRRKDDKLRQKELEASGKHRPRGRFFKVLGYIWRNTFARLGEDWVFLALLGIIMAVLNFAMDKGIAVCNNARMWMYKDLATSTFSQYVAWVSLPVCLILFAAGFVHIVAAQSIGSGIPEMKTILRGVHLKEYLTFRAMVSKVIGLTATLGSGLPLGKEGPSVHIASMVATLLSKLVTTFQGIYSNESRTSEMLAAACAVGVASCFAAPVGGVLFSIEVTTTYFAVRNYWRGFFAACCSAIVHRDKNDYNKRTIGFRTSSTQIIEIYSILISYFIVCGLMAALWVFLHRQYVLFMRNTKVLSNFLQKNRFIYPGVMTLVVMSVLFPPGIGKYMAADLGNQEQVLSLFSNFTWSDALTAEQAALVDHWRTEDVGHFAVLVIYFFSIFFLSMVSCTLPVPAGIFVPAFKMGAALGRFTGEVMHYFCPLGVAYGGHIQKILPGGYATVGAAAFTGAVTHTVSTIVICIEMTGQVTHLLPIMAAVLSANATAALLQPSCFDSIILIKKLPYLPDLLSSASRMYDICVEDFMVRDVKYIWNRMTFQQLKDLLKENKSIKSFPLVSSPSSPVLLGSIHRWELVRLIEQRAGRARRLQVAALWRREAEARRRPSRFEVTAASLTDTSKAGLVPPPGQLFRPKSILKKTNSFTLTRGLSSPSTPSTPQPNVYTTVTGAETRIRAAFEAIFKRSTLLPDVEGGLGDHGLPRSPSINKKVQLPRERVCDMSPEDQRAWEMMEMSREIDFDRMLTIVRHRDMTAEESDHDDEDDSLYVCHIDPAPFQLVERTSLLKVHSLFSTLGVSRAYVTAIGRLIGVVALKELRKAIEDVNSGTLTPTSHTAAATSLPVPRPPTVLVQPPREPAPPSDKDTDKLTVASDK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: