MonarchBase - Protein-coding gene

DPOGS210823
Transcript	DPOGS210823-TA	2490 bp
Protein	DPOGS210823-PA	829 aa
Genomic position	DPSCF300027 - 464308-467137
RNAseq coverage	249x (Rank: top 42%)

Annotation
*Heliconius*	HMEL012763	0.0	66.99%
*Bombyx*	BGIBMGA007138-TA	0.0	52.80%
*Drosophila*	CG7044-PA	4e-75	25.71%
EBI UniRef50	UniRef50_B0WL50	3e-93	30.18%	Putative uncharacterized protein n=2 Tax=Culicinae RepID=B0WL50_CULQU
NCBI RefSeq	XP_313823.4	3e-95	29.15%	AGAP004523-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|170043522	1e-92	30.18%	conserved hypothetical protein [Culex quinquefasciatus]
NCBI nr blastx	gi\|170043522	5e-96	29.71%	conserved hypothetical protein [Culex quinquefasciatus]

Group
Gene Ontology	GO:0005488	6e-12	binding
KEGG pathway
InterPro domain	[313-715] IPR016024	6e-12	Armadillo-type fold
	[439-607] IPR011989	4.9e-10	Armadillo-like helical
Orthology group	MCL15540		Insect specific

Nucleotide sequence:

>DPOGS210823-TA
ATGGATTCCAGTCTAAGAGTTGCTTATATGGAAGTAGCTCTGTCACTAACCAAACATAATTCCGGTATCTATTGGCTTTTAGAAACTGGAATTTGGAAAGAAATTCTACAGCTCTGTAATGAAAAACGGACAGTTTTTGTTGTCCGACAGACATACAAATTTGCTTCATTATTTTTGTGGAAATTGGTTGATATAAATGAGGAAGCTAGCATTAAAACCGTTTTAAATTTTATACTCAAACCTATGTCAGAAATTGATATGATCAATATAAATTCCATGTCAAGCGAGTATGAAGACGAGTTGTGTAAAGTATACGTACCGATGCTACAAATACTGTTGTCGGTGGTGGGCAATGCAGAGCGCATTAAAACACGTAATTCTGTGATAACGTCGATGATCAAAGATTTCAACATGTTAACATTCTGTTATTTGATAAAGACTAGAATAAGAAGGGAGGACGTACTTCTGCTTGTGACAAAATTATTATTTTGGCTTTCGATTGGTAAAACTTTTATTTTTAAACCGCTACAATTATCGGAGAGGTTCGAACGGGACGATTTCGTGGAGGTCACGATAACTTATTTCAACACAGTGAACTATCTCATGCAGCGTCGCTGTTGGGCTTTAGTGTTCGATTACTGTAACGCCTGTAATTTAATATTCAGCTCGGTCTGGAGCAACATGAGACCGGCGGTCTTCGAAGTAGACGGAAGGGAGGTGGAATTGCAGAAGCAGTTACTCGTCATATGTCTCATACCGTCCATGGTGTACATAGGTGCCGGGAAGACAATGGGAATCGACGGTGACGAAGTCGATAATTTTATTATTAAACTATTGCATTCAACTTGCGAGCACACTGCAAGGACATGTTATGCTCTCAGGGATCTGTTATTGCAGTTGGACATGGAGTCCGTGACCCTTCAGAGTGTGAAACGTCTTACTTGTTTGAAAGATCATTTAAATAATGACCAAGCGAACCTGCTATTCCAGGCACTATTCTACGTCCTTAAAGAATACGATCCTATAGACGAAAACGGGGTAGTGAAAGCGGATATAAATATTACAGATAGCGAAGAGAAAGTACTGATTATGACATACGTTTTGGACATACTGCTGTCGCTGGTTAAGAATTATAACATCAACTGGAAGGAGAGCCTTGAAGTCATTTGTCTTTATAGCGTTGTATTTAATATTTTGAAGATAAAGAATAACAATTTCTCTAGTAGGTTTGTAGTGATCGCATTAAATGTCATCACGATAACAGTGAAGAAGTTTCTACCGCCAACCCTATCTCTGTTAATGGAGTCCAAGCCTGGTTCCTCGATGGATGAACTCGGAGAACTAATTTATATGAAATTAAACGATTTCCAGTGGGAGGTCCGAGATTCCGCTCTGGAATTGCTATATGTGTGCACAGACATCTGCTTTATTAAGTTTCCGCCGTTCCAAAAACAAATTTTATCTAACAACCTCATCAATCTGGCGACAACCATGGCGCTGAATGACCACGAGTTCTATGTGCGTGTTTCTGCTCTGAGGTGTCTTGGAGCTGGTTGTAAAGTCGCCTCACTCTGGGATCACTTAAAAACTCAGTATCCCAACATACAGGAACTTCTAGTGGACATCATGAACACCAACCAAGAAGGCGTTGTACGTAAAGAGGCCTGCAACGTTTTATGCGAAATTTACCAAAGCGTCAAAATTAGCCCGAACTTCAAGTCCGTTCTATACGAGAACATGATGAACGCAGCGCTCTCTGATTTTCACTGGGAAGTTCAGCTGAGCGCACTTAAGTTCTGGAAAATAGTGATTCAATCCTTGCTCACCGCACAGGGCATGCTCGACGGCACATTTCCCCCGGTGACGTTTTCCAGACAGACAAGGAAAATTGTTACTCTAGACGCGAACGAAATCAAAAGGCGTTTGACGGCGACCCTTGAAGAACTGTCCTCAATCGGATGTTTAACTGTGTTAGTGAAACTCCTTCATGACGATACTGATGTCGAAATTATGGATTCTGCTAGGATTATTTCTACCGAACTTCTAGAGATACTTGATCAATACAATGTTCCTGAAACCTTGACACCAAGTAACAAAGAATCAAACACCATGGATGAGTTGCAGCAGCAGAACATTTCTGATGACAGTACTGGAAATGGTGACACTATGGACTCAGAACCCGCTACCTCATCGGAGAATGTGATAGAAAGTATATTGAATTCCGATGATATTAACTTACTTGCAAATATATATAAAAGACAAATGAACCTATCACCGGAACAGGAAACTAAAAACACAAGTCACACAAAAGTTGTAAGGTTAGCATCGCCATACTTATTTGTTAGATATACCAGGAGTAAAGACTTCAAACAAATCATAGAGGACAAAAGAAATTGGAAAGATGGAATCAAAAGTCTTTCGTCATTACTAGACGATGTTCTGGGCATATACGAATTCAATGAGGAGGTGAACTCACTAGACTGCTATTGA

Protein sequence:

>DPOGS210823-PA
MDSSLRVAYMEVALSLTKHNSGIYWLLETGIWKEILQLCNEKRTVFVVRQTYKFASLFLWKLVDINEEASIKTVLNFILKPMSEIDMININSMSSEYEDELCKVYVPMLQILLSVVGNAERIKTRNSVITSMIKDFNMLTFCYLIKTRIRREDVLLLVTKLLFWLSIGKTFIFKPLQLSERFERDDFVEVTITYFNTVNYLMQRRCWALVFDYCNACNLIFSSVWSNMRPAVFEVDGREVELQKQLLVICLIPSMVYIGAGKTMGIDGDEVDNFIIKLLHSTCEHTARTCYALRDLLLQLDMESVTLQSVKRLTCLKDHLNNDQANLLFQALFYVLKEYDPIDENGVVKADINITDSEEKVLIMTYVLDILLSLVKNYNINWKESLEVICLYSVVFNILKIKNNNFSSRFVVIALNVITITVKKFLPPTLSLLMESKPGSSMDELGELIYMKLNDFQWEVRDSALELLYVCTDICFIKFPPFQKQILSNNLINLATTMALNDHEFYVRVSALRCLGAGCKVASLWDHLKTQYPNIQELLVDIMNTNQEGVVRKEACNVLCEIYQSVKISPNFKSVLYENMMNAALSDFHWEVQLSALKFWKIVIQSLLTAQGMLDGTFPPVTFSRQTRKIVTLDANEIKRRLTATLEELSSIGCLTVLVKLLHDDTDVEIMDSARIISTELLEILDQYNVPETLTPSNKESNTMDELQQQNISDDSTGNGDTMDSEPATSSENVIESILNSDDINLLANIYKRQMNLSPEQETKNTSHTKVVRLASPYLFVRYTRSKDFKQIIEDKRNWKDGIKSLSSLLDDVLGIYEFNEEVNSLDCY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: