MonarchBase - Protein-coding gene

DPOGS206411
Transcript	DPOGS206411-TA	1278 bp
Protein	DPOGS206411-PA	425 aa
Genomic position	DPSCF300181 - 204556-223231
RNAseq coverage	56x (Rank: top 69%)

Annotation
*Heliconius*	HMEL006896	2e-70	97.16%
*Bombyx*	BGIBMGA013872-TA	2e-99	76.43%
*Drosophila*	tup-PA	4e-111	61.67%
EBI UniRef50	UniRef50_P92031	6e-108	61.11%	LIM homeobox protein n=36 Tax=Coelomata RepID=P92031_DROME
NCBI RefSeq	XP_319393.4	8e-134	56.68%	AGAP010209-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|158299279	1e-132	56.68%	AGAP010209-PA [Anopheles gambiae str. PEST]
NCBI nr blastx	gi\|157119485	2e-141	61.81%	insulinprotein enhancer protein isl [Aedes aegypti]

Group
Gene Ontology	GO:0008270	7.7e-22	zinc ion binding
	GO:0006355	1.2e-19	regulation of transcription, DNA-dependent
	GO:0043565	1.2e-19	sequence-specific DNA binding
	GO:0003700	1.2e-19	sequence-specific DNA binding transcription factor activity
	GO:0005515	2e-18	protein binding
	GO:0003677	1.2e-17	DNA binding
KEGG pathway
InterPro domain	[8-107] IPR001781	7.7e-22	Zinc finger, LIM-type
	[258-320] IPR001356	1.2e-19	Homeobox
	[256-331] IPR009057	2e-18	Homeodomain-like
	[231-316] IPR012287	1.2e-17	Homeodomain-related
Orthology group	MCL15245		Single-copy universal gene

Nucleotide sequence:

>DPOGS206411-TA
ATGATAGAAAAGCTCCGGCTGTCTCTGTGTGTGGGCTGCGGCGGCCAGATCCACGACCAGTACATCCTGAGGGTGGCCCCGGATTTGGAGTGGCACGCCGCATGCCTCAAGTGTCAGGAGTGCAGGCAGTTCCTCGACGAGTCCTGCACATGCTTTGTCAGGGATGGAAAGACTTATTGCAAGAGGGATTATACCAGATTATTCGGGACCAAGTGTGATAAATGCGGTTCATCATTCAGCAAGAACGACTTCGTGATGAGAGCAAAGACGAAGATATATCATATAGACTGCTTCAGATGCTGCGCTTGCGCACGACAACTTATACCCGTCATTCTGGACTACGCAACTGTTTCAAGATTCGATTCCCGGCCGGGTATAGCCGTAAATCTAGAAATAAAATTATTCGGGACCAAGTGTGATAAATGCGGTTCATCATTCAGCAAGAACGACTTCGTGATGAGAGCAAAGACGAAGATATATCATATAGACTGCTTCAGATGCTGCGCTTGCGCACGACAACTTATACCCGGTGACGAGTTCGCGTTGAGAGAAGGCGGAGCTTTATATTGTAGAGAAGATCACGATGTATTAGAAAAGAGCGCTAACACAAGCGGCAGCAGCGCCGGCAACGCCGAGAGCAACAACAACACAACACTCAGCAACAACAATTCGCATCACCCGCACGAGTTAGGATCTATGTCGGATTCAGGAAGTGAGTCTGGCTCGCATAAGAGTGGAAGAGCCAGGGCTGGCGCTGCGGCTGATGGTAAACCCACCAGGGTGAGGACTGTCCTCAATGAGAAACAATTACACACACTAAGAACCTGTTATGCTGCGAATCCTAGACCTGACGCTCTCATGAAGGAACAGCTGGTTGAAATGACAGGTCTTAGTCCTCGAGTGATAAGAGTGTGGTTCCAGAACAAGAGATGCAAAGACAAGAAGAAGACTATACAGCTGAAGATGCAGATGCAGCAAGAGAAGGAAGGCCGCCGTTTGGGCTATATGTCTATGGGAGTGCCGTTAGTGGCCGGTTCGCCTGTAAGACATGAGGCTGGGTCTCTAGCTCTAGAGGTGACGGCGTATCAGCCGCCGTGGAAGGCCCTCAGCGACTTCGCACTCCACGCGGACCTTGACAGGCCTCAACACAGCGCCGCCTTCCAACAGCTCGTGAACCAGATGCACGGTTACGACATCCCCTCTCTGCCCCCTCCACGTCACGAGGACAACTACGTCACCTATCTCGAGAGTGACGACAGTCTGCCGCCGTCACCCTAG

Protein sequence:

>DPOGS206411-PA
MIEKLRLSLCVGCGGQIHDQYILRVAPDLEWHAACLKCQECRQFLDESCTCFVRDGKTYCKRDYTRLFGTKCDKCGSSFSKNDFVMRAKTKIYHIDCFRCCACARQLIPVILDYATVSRFDSRPGIAVNLEIKLFGTKCDKCGSSFSKNDFVMRAKTKIYHIDCFRCCACARQLIPGDEFALREGGALYCREDHDVLEKSANTSGSSAGNAESNNNTTLSNNNSHHPHELGSMSDSGSESGSHKSGRARAGAAADGKPTRVRTVLNEKQLHTLRTCYAANPRPDALMKEQLVEMTGLSPRVIRVWFQNKRCKDKKKTIQLKMQMQQEKEGRRLGYMSMGVPLVAGSPVRHEAGSLALEVTAYQPPWKALSDFALHADLDRPQHSAAFQQLVNQMHGYDIPSLPPPRHEDNYVTYLESDDSLPPSP-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: