MonarchBase - Protein-coding gene

DPOGS203985
Transcript	DPOGS203985-TA	1080 bp
Protein	DPOGS203985-PA	359 aa
Genomic position	DPSCF300005 + 1206170-1216495
RNAseq coverage	40x (Rank: top 72%)

Annotation
*Heliconius*	HMEL008404	0.0	87.47%
*Bombyx*	BGIBMGA002127-TA	1e-60	76.00%
*Drosophila*	ap-PA	1e-79	45.14%
EBI UniRef50	UniRef50_E2B1F1	1e-104	57.30%	LIM/homeobox protein Lhx9 n=16 Tax=Neoptera RepID=E2B1F1_CAMFO
NCBI RefSeq	NP_001139388.1	9e-115	58.76%	apterous [Tribolium castaneum]
NCBI nr blastp	gi\|328925124	2e-164	76.58%	apterous B alpha [Bombyx mori]
NCBI nr blastx	gi\|328925124	1e-164	77.22%	apterous B alpha [Bombyx mori]

Group
Gene Ontology	GO:0003677	5e-24	DNA binding
	GO:0006355	5e-24	regulation of transcription, DNA-dependent
	GO:0043565	3.9e-23	sequence-specific DNA binding
	GO:0003700	3.9e-23	sequence-specific DNA binding transcription factor activity
	GO:0005515	9.7e-22	protein binding
	GO:0008270	2.1e-17	zinc ion binding
KEGG pathway
InterPro domain	[235-301] IPR012287	5e-24	Homeodomain-related
	[236-298] IPR001356	3.9e-23	Homeobox
	[220-293] IPR009057	9.7e-22	Homeodomain-like
	[79-133] IPR001781	2.1e-17	Zinc finger, LIM-type
Orthology group	MCL12901		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS203985-TA
ATGCTTAAGGAAAGAGAAAGCTCCGAGGGGTCGCCTGCTACCCCGGACGAGTGCGCGGGTTGTGGGGGCAGAATACAGGACAGATATTACCTACTTGCTGTGGACCGTCAATGGCACGGTGCTTGTCTGCGCTGCTGCGAGTGCCGACTGCCGCTAGACAGCGAACTAACATGCTTCTCCAGAGACGGAAACATTTATTGCAAAGACGATTATTACAGATTATTCTGCGTGAAGCGATGCGCGAGATGCGGTAACGGGATTACCGCTAACGAGCTGGTAATGAGAGCCCGAGACATGGTGTTTCACCTGACTTGCTTCACATGTGTCGCCTGCGGGACCCTGTTGTCTAAGGGAGATGTGTTCGGGATGAGGAACAGCCTGGTGTACTGCAGACCGCACTACGATAGCGTCTGCATGGATGACTTCTGTGAGGAAGACGTCAATAGTGTTTACAGGTGTCAAGAATTGAACAGCGAAGGTGACTCTCCGAATCAGTACTTTCCCGTAGGCGTTAACCAGAAGGGTCGGCCGAGAAAGAGGAAGATAGCCCACGGTCCTCATGAAGACATGCAAGTACAGACCATGAGAATGGCCAGCACGGCGTTAGACATCCTTCACCGGGCTGACCTATCATCGTCAATGGAGTCCTTGGCTTACGATTCTTCGGTTGCATCACCGGGAAGTGTTTCAAGTCATACACAGCGAACTAAGCGCATGCGCACCAGCTTTAAACATCACCAACTTCGCACGATGAAATCGTATTTCGCCATTAACCAGAACCCAGATGCAAAGGATCTTAAGCAATTGGCTCAGAAGACTGGCTTATCTAAGAGAGTTTTACAGGTTTGGTTTCAAAATGCTCGAGCGAAATGGCGTAGAAATATGATGAGACAGGAATCGAATCAGCTTGGACTGATGACTCCTAATGGAAGCACTGGACACTCTGTAAATGGTGGTCTTGTCACAGGAGTTCCTCCACCAAATGTAGATCCTGGAATGATAATGTCTGAACCATTGCAACCCATACAAGACATTAGGGTTCACACTCCTCATCCAATGAGCTTCGGAGAAATGTACTGA

Protein sequence:

>DPOGS203985-PA
MLKERESSEGSPATPDECAGCGGRIQDRYYLLAVDRQWHGACLRCCECRLPLDSELTCFSRDGNIYCKDDYYRLFCVKRCARCGNGITANELVMRARDMVFHLTCFTCVACGTLLSKGDVFGMRNSLVYCRPHYDSVCMDDFCEEDVNSVYRCQELNSEGDSPNQYFPVGVNQKGRPRKRKIAHGPHEDMQVQTMRMASTALDILHRADLSSSMESLAYDSSVASPGSVSSHTQRTKRMRTSFKHHQLRTMKSYFAINQNPDAKDLKQLAQKTGLSKRVLQVWFQNARAKWRRNMMRQESNQLGLMTPNGSTGHSVNGGLVTGVPPPNVDPGMIMSEPLQPIQDIRVHTPHPMSFGEMY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: