MonarchBase - Protein-coding gene

DPOGS201612
Transcript	DPOGS201612-TA	1188 bp
Protein	DPOGS201612-PA	395 aa
Genomic position	DPSCF300152 + 401181-405666
RNAseq coverage	231x (Rank: top 44%)

Annotation
*Heliconius*	HMEL008107	0.0	91.98%
*Bombyx*	BGIBMGA012202-TA	2e-170	80.89%
*Drosophila*	Chi-PB	1e-137	73.80%
EBI UniRef50	UniRef50_O43679	3e-135	72.70%	LIM domain-binding protein 2 n=62 Tax=Eumetazoa RepID=LDB2_HUMAN
NCBI RefSeq	XP_001599552.1	1e-156	80.60%	PREDICTED: similar to lim domain binding protein [Nasonia vitripennis]
NCBI nr blastp	gi\|383856253	7e-160	85.00%	PREDICTED: uncharacterized protein LOC100880826 [Megachile rotundata]
NCBI nr blastx	gi\|383856253	6e-159	81.66%	PREDICTED: uncharacterized protein LOC100880826 [Megachile rotundata]

Group
Gene Ontology	GO:0005634	1.9e-249	nucleus
	GO:0007275	1.9e-249	multicellular organismal development
	GO:0003712	1.9e-249	transcription cofactor activity
KEGG pathway
InterPro domain	[74-374] IPR002691	1.9e-249	LIM binding protein
Orthology group	MCL10313		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS201612-TA
ATGGCGCGCGAGCGCACTGAGCGGCAACACCGCACGAGGCCGACGCCGATCCGCGCTAGATGGCGCGGTAACAAAGTGGCCTACATGCCCGTGGCGCTGGGCTCGCTCGGCGAGGGCGAGTACCGGGAGTACCACCACCACTCGCCTCTTCATCATCAGAACCAGCACCAGCACCAGCCCCAGTACCATGAGTACGGAGCTATATACCATCCCATACCGGAGCCCTACTTTAGGAGGCATGCTCCGTACTTCGGACAGCCAGACTACAGAGTATATGAACTCAACAAGAGATTACAACAGAGGACCGAGGACTCCGACAACTTGTGGTGGGATGCCTTCGCCACTGAGTTCTTCGAGGACGACGCGACGCTCACACTGACATTCTGTTTAGAAGATGGACCCAAGAGATACACAATAGGAAGAACCTTAATACCTCGCTACTTCCGGAGTATATACGAAGGTGGTGTCTCCGAGCTGTACTACACCATGAGGCAGCCCAAGGAGTCCTTCCACAACACCAGCATCACGCTGGACTGCGACCACTGCACCATGGTCACCCACCACGGCAAGCCCATGTTCACCAAGGTTTGTACGGAGGGCCGCCTCATCCTGGAGTTCACCTTCGACGACCTGATGCGCATCAAGTCGTGGCACATGGCGGTGAGGGCGCACCGCGAGCTGATACCCCGGCAGGCGGTGCACCCCCCCGACCACGCCGCCCTGGACCAGCTGGCCAAGAACATCACCCGGCAAGGCATCACCAACTCCACACTCAACTATCTCAGGCTGTGCGTGATCCTGGAGCCGATGCAGGAGCTGATGTCTCGTCACAAGGCGTACGCGCTCTCCCCCAGAGACTGCCTCAAGACCACGCTGTTCCAGAAGTGGCAGAGGATGGTCGCCCCGCCCGAGTCCCAGAGGCCGGCCAGCAAGAGGCGCAAACGTAAAGGCAGCGCCGGAGCCAACGCCGCTCCCCCCGCGCCCGCCAAGAAGCGGTCCCCCGGACCCAACTTCAGCCTCGCCTCACAGGACGTGATGGTGGTCGGCGAGCCGTCGCTGATGGGCGGGGAATTCGGCGACGAGGACGAGCGGCTCATCACCAGGCTGGAGAACACGCAGTACGAGGGCGACGACTGGCCCGCCCCGCCGCCCGCCTCGCCCGCCAAGACCCCGCCGGCCAACCACTGA

Protein sequence:

>DPOGS201612-PA
MARERTERQHRTRPTPIRARWRGNKVAYMPVALGSLGEGEYREYHHHSPLHHQNQHQHQPQYHEYGAIYHPIPEPYFRRHAPYFGQPDYRVYELNKRLQQRTEDSDNLWWDAFATEFFEDDATLTLTFCLEDGPKRYTIGRTLIPRYFRSIYEGGVSELYYTMRQPKESFHNTSITLDCDHCTMVTHHGKPMFTKVCTEGRLILEFTFDDLMRIKSWHMAVRAHRELIPRQAVHPPDHAALDQLAKNITRQGITNSTLNYLRLCVILEPMQELMSRHKAYALSPRDCLKTTLFQKWQRMVAPPESQRPASKRRKRKGSAGANAAPPAPAKKRSPGPNFSLASQDVMVVGEPSLMGGEFGDEDERLITRLENTQYEGDDWPAPPPASPAKTPPANH-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: