MonarchBase - Protein-coding gene

DPOGS203340
Transcript	DPOGS203340-TA	1938 bp
Protein	DPOGS203340-PA	645 aa
Genomic position	DPSCF300003 - 144292-149593
RNAseq coverage	1002x (Rank: top 13%)

Annotation
*Heliconius*	HMEL013532	80.68%
*Bombyx*	BGIBMGA003862-TA	89.63%
*Drosophila*	ClC-c-PC	78.63%
EBI UniRef50	UniRef50_Q7Q6L5	87.46%	AGAP005777-PA n=15 Tax=Bilateria RepID=Q7Q6L5_ANOGA
NCBI RefSeq	XP_315792.4	87.46%	AGAP005777-PB [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|158294756	87.46%	AGAP005777-PA [Anopheles gambiae str. PEST]
NCBI nr blastx	gi\|270003872	88.94%	hypothetical protein TcasGA2_TC003158 [Tribolium castaneum]

Group
Gene Ontology	GO:0055085	2.6e-176	transmembrane transport
	GO:0005216	2.6e-176	ion channel activity
	GO:0016020	6.5e-100	membrane
	GO:0006821	6.5e-100	chloride transport
	GO:0005247	6.5e-100	voltage-gated chloride channel activity
KEGG pathway
InterPro domain	[1-624] IPR001807	0	Chloride channel, voltage gated
	[395-543] IPR014743	2.6e-176	Chloride channel, core
Orthology group	MCL10774		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS203340-TA
ATGCGGCATCGATACATCGTGAAAAAGCGTCAGGATTCCATCTGGAACCTCATTAAAGGCGCTCACGACGCTTGGTCGGGATGGGTGTGCGTTCTCCTTGTGGGCGTGTGTACAGGGGTGGTGGCTGGTGTCATCGACATTGGCGCTTCTTGGATGACGGACCTCAAGTTCGGTATATGTCCCCAGGCGTTCTGGTTCAACAGGGAGCAGTGCTGCTGGTCCAACGATGAGATAACTTTTGATCACGGCAACTGCTCGCAGTGGATGACCTGGGCCCAGCTGTTCGGCGAGTCTAAGGAGGGTGTTGGCGCTTACATCATCAGCTACTTATTCTACATCGTTTGGGCGTTGTTGTTCGCGGCGCTCTCTGCATCTCTAGTGCGTATGTTCGCGCCGTATGCCTGCGGATCTGGTATACCGGAGATTAAGACGATTCTAAGCGGATTCATCATCAGGGGCTACCTCGGCAAGTGGACGCTTGTCATCAAAGTGGTTGGCCTTATCTTGTCCGTGTCATCAGGCTTGTCCCTCGGCAAAGAAGGACCAATGGTCCATATCGCCAGCTGCCTAGGTAATATCCTGTCGTACCTCTTCCCAAAATATGGACGGAATGAGGCAAAGAAACGTGAGATTCTTTCGGCAGCAGCGGCTGCTGGTGTGTCAGTGGCTTTCGGTGCTCCCATCGGTGGAGTTCTCTTTAGTCTTGAAGAGGTATCTTACTACTTTCCCCTGAAAACCCTCTGGCGTTCATTTTTCTGCGCGTTGATAGCCGCCTTCATCTTACGATCCATTAACCCCTTCGGCAACGAGCACTCGGTTCTCTTCTTCGTGGAGTACAACAAGCCCTGGATATTCTTCGAGTTGATACCTTTCGTCGGCTTGGGAATCATTGGCGGTTGCATCGCGACAATATTCATCAAGGCGAACATTTACTGGTGCCGCTACCGGAAGTACTCCAAGCTGGGTCAGTACCCAGTGACGGAGGTGCTGGTGGTGACCCTAGTGACCGCGATCATCGCCTATCCAAATCCATACACCAGAATGAACACCAGCCAGTTGATCTACTTGCTATTCAACCAGTGCGGCATATCTAACTCGGATCCTCTGTGTGACTATAATAGGAATTTCACCGACGTGAATAAGGCGATTGAGAAGGCTGCCGCTGGTCCTGGTGTGTACCAGGCTATCTGGCTGTTGATGTTGGCACTGGTGCTGAAGTTGGTGATGACCGTGTTCACCTTCGGCATTAAAGTACCCTGCGGGCTGTTCATACCCAGCCTCGCGCTCGGAGCCATCGCCGGCAGGATTGTGGGCATTGGTGTGGAACAGCTCGCGTATAAGTATCCGAAGATCTGGTTATTCTCTGGAGAATGTTCTACTGGCGATGACTGCATCACTCCAGGGTTGTACGCTATGGTTGGTGCTGCGGCTGTACTCGGCGGTGTTACGAGGATGACCGTGTCTCTGGTGGTGATAATGTTCGAGCTGACTGGCGGCGTGCGGTACATAGTGCCGCTAATGGCGGCGGCTATGGCGTCCAAGTGGGTGGGCGATGCGTTGGGGCGCCAGGGTATATACGACGCCCACATCGCGCTGAACGGATACCCGTTCCTGGACAGCAAGGACGAGTTCCAGCATACGTCACTCGCTGCTGACGTCATGCAACCCAAACGTAACGAGACCCTCTCCGTCATAACGCAAGACTCGATGACCGTTGATGATGTGGAGACGCTGCTGAAAGAGACAGAGCATAACGGATATCCGGTGGTCGTGTCCAAGGAGTCGCAATACCTCGTCGGATTCGTACTGAGACGGGACCTTAACCTGGCCATAGATGATAAAGAGACAATTTTATGCAGTATCGTACAATCAACAAGCAACTCCATCAATGGCATCCTCCGACACGGCCGTCCTGACATATCACACGCCCTCGTGTGA

Protein sequence:

>DPOGS203340-PA
MRHRYIVKKRQDSIWNLIKGAHDAWSGWVCVLLVGVCTGVVAGVIDIGASWMTDLKFGICPQAFWFNREQCCWSNDEITFDHGNCSQWMTWAQLFGESKEGVGAYIISYLFYIVWALLFAALSASLVRMFAPYACGSGIPEIKTILSGFIIRGYLGKWTLVIKVVGLILSVSSGLSLGKEGPMVHIASCLGNILSYLFPKYGRNEAKKREILSAAAAAGVSVAFGAPIGGVLFSLEEVSYYFPLKTLWRSFFCALIAAFILRSINPFGNEHSVLFFVEYNKPWIFFELIPFVGLGIIGGCIATIFIKANIYWCRYRKYSKLGQYPVTEVLVVTLVTAIIAYPNPYTRMNTSQLIYLLFNQCGISNSDPLCDYNRNFTDVNKAIEKAAAGPGVYQAIWLLMLALVLKLVMTVFTFGIKVPCGLFIPSLALGAIAGRIVGIGVEQLAYKYPKIWLFSGECSTGDDCITPGLYAMVGAAAVLGGVTRMTVSLVVIMFELTGGVRYIVPLMAAAMASKWVGDALGRQGIYDAHIALNGYPFLDSKDEFQHTSLAADVMQPKRNETLSVITQDSMTVDDVETLLKETEHNGYPVVVSKESQYLVGFVLRRDLNLAIDDKETILCSIVQSTSNSINGILRHGRPDISHALV-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: