MonarchBase - Protein-coding gene

DPOGS206885
Transcript	DPOGS206885-TA	3285 bp
Protein	DPOGS206885-PA	1094 aa
Genomic position	DPSCF300001 - 2019202-2039294
RNAseq coverage	208x (Rank: top 46%)

Annotation
*Heliconius*	HMEL006876	87.10%
*Bombyx*	BGIBMGA012843-TA	87.02%
*Drosophila*	Kdm2-PB	68.07%
EBI UniRef50	UniRef50_D2A5L6	55.50%	Putative uncharacterized protein GLEAN_15153 n=2 Tax=Tribolium castaneum RepID=D2A5L6_TRICA
NCBI RefSeq	XP_970863.2	56.02%	PREDICTED: similar to F-box and leucine-rich repeat protein 11 [Tribolium castaneum]
NCBI nr blastp	gi\|189238300	56.02%	PREDICTED: similar to F-box and leucine-rich repeat protein 11 [Tribolium castaneum]
NCBI nr blastx	gi\|189238300	56.20%	PREDICTED: similar to F-box and leucine-rich repeat protein 11 [Tribolium castaneum]

Group
Gene Ontology	GO:0005515	4.7e-36	protein binding
	GO:0003677	5.9e-14	DNA binding
	GO:0008270	5.9e-14	zinc ion binding
KEGG pathway
InterPro domain	[225-393] IPR003347	4.7e-36	Transcription factor jumonji/aspartyl beta-hydroxylase
	[554-598] IPR002857	5.9e-14	Zinc finger, CXXC-type
Orthology group	MCL11417		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS206885-TA
ATGTCGGAAACACTGCCGAATAACAAAAAACAAGTTCCAAGGCAACTGATCGCAGCATTGCGATGTAGCGACGTTGAGAATGAACGCCGCGTAAATTGCGCACAGCAGCAACGTCGTTATCGGGGCATACCTTGTGGGCATCTGGTAGGGACGAAGGCGTTATCCTCCCGCGACTGCGGAGGGCAGGGTGCCTGGGGCAGAGAAAGGAAACAGCGTAAGCTCTATTCAGATGAGTGGGCGCTGGGTGACGACGAGGCGGAGGGCGGGCGGGGCTTCTCGCTCGCTGACAAGTTGGAGAGTCCGCGCTTCGAGCATGCTGGGGCTGTACTGGAGATGAACGGTGCTGAACTTACAGTGGCCTACCTCCAGAAACATGGCTTCACAACCCCATTGCTTTTCAAAGAGAAACTTGGGTTGGGTTTAAGGCACACTCGACAGGCAGCCAATGTTGAAGTACCAAACCCTACTGTGGGGATTAAAATGAGCGGATCTGAATTAGTGCCAACCAGCAACTTCACAGTTAACGATGTGCGCATGTGCGTCGGCTCGAGGCGGCTTCTCGACGTCATGGATGTTAACACACAGAAAAATATTGAAATGACAATGAAGGATTGGCAGCGTTACTATGACGACGAGAACAAGGAGAGGCTGCTGAATGTAATCTCGTTGGAGTTCTCACACACACGTCTCGAGAACTACGTCCAGGCGCCGCGTATTGTGAGACTTATTGACTGGGTGGATACAGTCTGGCCGAGACATTTGAAAGATCAACAGACTGAATCGACGAACGCGTTGGATGAAATGATGTACCCGAAGGTCCAGAAGTATTGTCTCATGTCCGTCAAAGGTTGTTACACGGATTTCCACATCGACTTCGGCGGCACGTCAGTCTGGTACCACATACTGAGAGGAGCAAAAGTATTCTGGCTTATTCCACCCACTGAAAAGAATCTCCAGCTGTACGAGAAGTGGGTGCTATCCGGGAAGCAATCGGACGTTTTCTTCGGTGACACGGTCGAAAAATGTATAAGAGTTCATTTACAAGCCGGTTACACATTCTTCATACCGACCGGTTGGATACACGCTGTATACACACCGAGTGATTCACTCGTCTTCGGAGGCAACTTCCTGCATCAGTTCGGTATTGAGAAACAGTTGAAGATAGCTCAAGTCGAAGACGTCACTAAGGTGCCTCAGAAGTTTCGTTATCCGTTTTTCACTGAGATGCTGTGGTATGTACTTGACCGGTACGTGAGCGCGCTTTTGGGGCGGTCGCACCTCGCTCAAGAGGGACAGCCCGCGCCCACGACGCCCACGACGCCCACGCCGCCCGCGCCGCCCAAGGAACATGTTCACCTCACGCAGAACGAACTTCACGGACTAAAAGCTATAGTGGTATATCTTCATCAGCTCCCAGCAGCCCGTAAGTCAGTGCCCGAACTGCTAACGGATCCAATAGCATTGGTCCGTGATGTCCGTACTCTAGTGGAACAGCACAGGCATGATAAACAACAGCTAGCCATCACTGGTCTCCCATTACTTAAAGGTCCAGACGAGCCGTTGTCCGGAGAGCGTCGTCAGTCAGGAGGTCGGGGAGGTCGTGGTGGTCATCGTGGTGGTCCCGCGCGACCACGGCCCGACCACGCCGCCAACGCGCCACGTCGCAGGCGGACCAGATGCAAAAAATGTGAAGCCTGCCAGCGTACAGACTGTGGTGATTGCGTGTTTTGTCATGACATGGTTAAGTTCGGTGGTTTGGGGCGAGCTAAACAGACTTGCATCATGAGACAGTGTCTACAGCCAATGCTACCAGTGACAGCTTCCTGCGCCGTGTGTCATCTGGACGGATGGATGCAGACACCTGTAGCACCGCAGGCTAAAGGCAACTCAGGTCGTAACGGTCCATCAGTCCTGCGGGAATGCTCTGTTTGCTACAGCATAGTTCATCCAGCGTGTGTCCCTCCCGGAGGACAGCTCAACGAGGACCTGCCTAACTCATGGGAGTGCCCCACATGCACCACCATGGGTCTCAACCATGATTATAAGCCACGTCACTTCCGAGCCCGACAAAAATCTTCAGACTTGCGTCGCATGAGCGTTGGATCCGACGCCAGTCAGCTGAGTCAACAACATAACACCACAACGGCACAGACAAAATTACCAGCCCCACCTCCACCGGTGACTGTGAAGTCTGAGGCGGGATCGGACAATGAAAGCAAACCTGAAAGCACTAACGTTAAATCAGAAGAAGAAATAAAACGCGAAGAAGATCCATCAGAAGCACCCGAGGCGGAGGGAGTTGAGTGGGAGCCGACGGCGAAGAAACGACGAGCCAGCGATGAAGACGAGGCGCCTAAGAAACAAGCACTGAGAGCACATCTGGCGCTGCAGCTGACACACCATTCAGCTAAAGCTTTAAAGAAACCAATATATCCTGTACGTCCGGCTCCTCTGAACGTGGCCAATGTGAGCGGTGCGTGGCTGGATCGAGGGGCGATGCTGCGTGTCTTCGCTAAGCTCACGCCACACGAACTGGCTACATGTGCCCTGGTCTGCAAGGCTTGGGCAGAGTATTCAATGGACCCATCCCTATGGCGAAGTATGTCATTCGTTCAGGTGCGAGTGTCGGCGGCGCAGTTGGCGGGCATAGCAAGACGACAGCCGCTCAGTCTGGGACTCGAGTGGTGTCATCTAGCGAGACGACAACTCGCCTGGTTATTGGCTCGACTACCAGCCTTACGGTCGTTATCCTTGGCTGGTTCCCCGGCAGAGGCCGCTTTAGCTCTTCGCTCCAGTACATGTCCGCCCTTGACAGCCCTGGATTTATCTTTCGCTAGATGTTTAGATGATGCTAAATTACGAGGAATTCTAGCACCTCCTGAGAACTCTAGACCGGGAGGCGGAGCCAGGTCAGGAACCGAGCCTTCAAGGTTGGCAGCACTGGCTGTTCTACGTCTACCAGGAACTGACATCACCGACGTTGCCATGTTGTATATTGTACAGGCTCTTCCCAAGTTATGCGAGCTGGATGCTTCATCCTGTGCCCGTCTAACAGACGCTGGCGCGGCTCAGCTCGCGCTGCACGGCTTGCAGCGACTTTCGCTGGCGGGCTGCAGGCTGCTAACAGAGGCCGCATTGGACCATCTCGCAAGATGCCCTAACCTAGTTAGGCTGGACCTCCGACATGTACCACTTGTGTCTACACAGGCTGTCATCAAGTTCGCAGCCAAAGCTAAACATAACCTCCATGTTAAGGATGTTAAGTTGGTGGAGTTGAGAACCTGA

Protein sequence:

>DPOGS206885-PA
MSETLPNNKKQVPRQLIAALRCSDVENERRVNCAQQQRRYRGIPCGHLVGTKALSSRDCGGQGAWGRERKQRKLYSDEWALGDDEAEGGRGFSLADKLESPRFEHAGAVLEMNGAELTVAYLQKHGFTTPLLFKEKLGLGLRHTRQAANVEVPNPTVGIKMSGSELVPTSNFTVNDVRMCVGSRRLLDVMDVNTQKNIEMTMKDWQRYYDDENKERLLNVISLEFSHTRLENYVQAPRIVRLIDWVDTVWPRHLKDQQTESTNALDEMMYPKVQKYCLMSVKGCYTDFHIDFGGTSVWYHILRGAKVFWLIPPTEKNLQLYEKWVLSGKQSDVFFGDTVEKCIRVHLQAGYTFFIPTGWIHAVYTPSDSLVFGGNFLHQFGIEKQLKIAQVEDVTKVPQKFRYPFFTEMLWYVLDRYVSALLGRSHLAQEGQPAPTTPTTPTPPAPPKEHVHLTQNELHGLKAIVVYLHQLPAARKSVPELLTDPIALVRDVRTLVEQHRHDKQQLAITGLPLLKGPDEPLSGERRQSGGRGGRGGHRGGPARPRPDHAANAPRRRRTRCKKCEACQRTDCGDCVFCHDMVKFGGLGRAKQTCIMRQCLQPMLPVTASCAVCHLDGWMQTPVAPQAKGNSGRNGPSVLRECSVCYSIVHPACVPPGGQLNEDLPNSWECPTCTTMGLNHDYKPRHFRARQKSSDLRRMSVGSDASQLSQQHNTTTAQTKLPAPPPPVTVKSEAGSDNESKPESTNVKSEEEIKREEDPSEAPEAEGVEWEPTAKKRRASDEDEAPKKQALRAHLALQLTHHSAKALKKPIYPVRPAPLNVANVSGAWLDRGAMLRVFAKLTPHELATCALVCKAWAEYSMDPSLWRSMSFVQVRVSAAQLAGIARRQPLSLGLEWCHLARRQLAWLLARLPALRSLSLAGSPAEAALALRSSTCPPLTALDLSFARCLDDAKLRGILAPPENSRPGGGARSGTEPSRLAALAVLRLPGTDITDVAMLYIVQALPKLCELDASSCARLTDAGAAQLALHGLQRLSLAGCRLLTEAALDHLARCPNLVRLDLRHVPLVSTQAVIKFAAKAKHNLHVKDVKLVELRT-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: