MonarchBase - Protein-coding gene

DPOGS206164
Transcript	DPOGS206164-TA	5091 bp
Protein	DPOGS206164-PA	1696 aa
Genomic position	DPSCF300523 - 18193-38648
RNAseq coverage	262x (Rank: top 41%)

Annotation
*Heliconius*	HMEL011823	0.0	56.32%
*Bombyx*	BGIBMGA009297-TA	0.0	65.04%
*Drosophila*	Bap170-PA	5e-84	31.73%
EBI UniRef50	UniRef50_UPI00022CA1A6	1e-116	35.95%	UPI00022CA1A6 related cluster n=4 Tax=unknown RepID=UPI00022CA1A6
NCBI RefSeq	XP_001653162.1	7e-114	33.30%	Brahma associated protein 170kD, putative [Aedes aegypti]
NCBI nr blastp	gi\|328791607	1e-117	35.82%	PREDICTED: hypothetical protein LOC724311 [Apis mellifera]
NCBI nr blastx	gi\|189236343	7e-130	30.65%	PREDICTED: similar to AGAP006990-PA [Tribolium castaneum]

Group
Gene Ontology	GO:0003677	2.7e-23	DNA binding
	GO:0005622	2.7e-23	intracellular
	GO:0005488	4.9e-06	binding
KEGG pathway
InterPro domain	[8-104] IPR001606	2.7e-23	ARID/BRIGHT DNA-binding domain
	[270-477] IPR016024	4.9e-06	Armadillo-type fold
Orthology group	MCL13874		Single-copy universal gene

Nucleotide sequence:

>DPOGS206164-TA
ATGGCAAAATCTCAAATAAATACGAAATCTAGAAATTATGTTCAAGACAAAGAAGCATTTTTGAAAGAACTTAAGCAGTTTAATGAAAGCAAAAATATCCCTTATAAAATACCGGTTGTTAATGGTGTAGATATAGATTTGTATCTCTTGTATTCATTAGTTCAACAAAGAGGAGGTCTTAGCAAAGTTAATCAAAATGATACCTGGGAGACATTTTTGCGTCAGCTCCACTTGCCACATCCATGTGTTAATGGGTCTACATTATTGAGGAGAATATATGGAATGTATTTGGAGAAATATGAAAGAGCTAAAGGTCCACCAGGTAGAGATGATGACTTAGATATGGACGACGACCCTCGTCGTGGCAGGGGCGGAGGAATGCCACGCATATCATTTGCTTCGGGTGAACCGCTTCGTACAGGAAATCGTGTGGCTGGTCCATCTGAACGCCTTACATTATCATTGTTGTCTCCGATGCCGAATGAGCAGGATTTTGCTGTTAATGTTTGCACAGTACTAGCCGCTGATCATTCTAACCGGCTTCCGTTGAGCACAACACCTCATATACTGGATTTCTTGCTAGCTCATGCTGGAGTTTATAATCACTCAAGCCTCCGCGATACAATCGGCCGCTCATACTTCGAATCTCGCGGTCGGTATCCCCACGAGTTCTGGTCGGAGCGAGCTGGTGGTGGCGGGGCGAGGGAACTGGCCGACGAGACGAAGTTCACCGGGGATCAACCTGAACTGGTCGTGCAGGCATTGGCTGCACATAACACACTCACGGATTGTCTGATGCTGGCTGGTGGTGAAGAAGAGAATATGGAGAAGATTGTTGAGGATGACACCGAGGATTGGGTGACGGAACCTTCAGAGGAAGATCAGCTGTTTGCTCCGACGTTACCAGGAGGCGCCACATGTGTTTACACACAACGTGTACTACAGATAGCTAGCATCGTACGAAGCCTGTCCTTTCACGAGGAGAATGTACAGTACTTAGCCAGGAATACCACTCTTATAAGGTTCTTACTGCTATGTGCTAACTGTTGGGTGGGAACTCTTCGTCAGAGCGGTCTAGACACGCTCGGTAACGTTGCTGCCGAGCTCATTATTAAAGACCCCGCGACATGTTTGATATCTCGTCATGTTCTATCAACCATACAATCTGCGCTCGTATCTCAAGATCGTGCTAGAGTGTTGGCAGCACTGGAGCTCTTGAATAAGTTGGCACAGAACGAAGTCAACGAGGAAGCATTACTCAAAGCATTGGAATCAAAAGTGTATAGCGACGTGTGTGCTCTGCTCACCCTCCGTGATATAATGGTGTTGGTCTGCACCCTGGAGTGTGTATACGCCCTTACCGGTCTCGGAGACCGCGCGTGTGAGGCGGTCGCACGTGTACCGGGACTGCTACACACACTCGTGTCACTGGTTACTGTTGAGGCCCAGAGCTACGGTCCCCGCGCGTGTATCCTCATGCGTGTGGTGGAGACGGTTAGCGGTCCGCCCGCGGTGGACCACGTGCAACCACACACAGTACAGAACAATATCCCCTCCCAACAGGTTCAAGCCCCAAAGCCTCAAGTGGAACCCCCCGTGGCGTCCCCCGCGGCCGCCACCCACACACAGCCTACTACACTACAACAATCCCACATGCAACAACGTACTGTACAAGAAAACGAGCACTTCGCCCAAGCGTGGCTCCGCGCTACGTACGAAGCTCTGCCCGCGTCGGACAACAGCGCGTGCGATGCTGCGGACGTGTACAGGCAGTACCTCGCGTGCTGCACCAAACTGGCTCGCAAGGGAGTCATCGCACCCGCGCACTTCCCGCGACTTGTCAGGACGGTGTTCGGCGGCACGGTTGGGCCAAACACAGTGAGCACTTCTACGGGTGAAACACAACATGTGTACATCGGCATACGAGCGAAGAATATAGCAAATAGAAGTAATCCGCCTGTTGGTCCGTCGTCACCTATATTAAAAGCTCAACTCACTAACAAGCCGAGCGCGACCGTTGAAACAAAGCCGGTCGTGACGCAACTGCAGACGCCAGCGCAGCCCGCGGACAACAGCAACACGTCGCTTATCAAACACCTGTTAGCGCACAAAGTAAGCGCTGCTCACACACACGTCGCCCAGAGACAGCAAAGCCAACAACGTCTACCGACCTCTGGAACAGTGGTTGTACAAACATCTACAGCGACGTCGCTCCAGAATATGGAGGTGGATCCAGAAGCGCTCATCAAATGTACGACGATAATACCCGGAACCGTCACCAGCACGTCTGTTCAGGAGAAGAAAACAGCACAGAACAAGATGCTGGCTGATCTCCTTGAGAAAAAATCAAACCCACCAGTACAGGTTGTACAGATGGGACAACAAATAAATGCACCAACTATACAAATAACGGAAACGGGACAAATAGTTCAAGTTAAATCGGAAAATATGATACAGTTATCGGATTCCGTGCAACCGAGCGCGCCGTTTTTTCAAATTAAGAACGAGCAAGGACAACTGATACAGATCAAAAACGACCAAGGACAGATTATACAACTCAAAAGCGACCAATTACAGGGCATGATTCAAATTAAGAACGACCAAGGTCAGATCGTACAGATTAAAAATGACAATCTAGCACAGTTATTACAGTCTGGTGTTCTACAGAAGAATGAGAAGGATATAGCGGAAAGTGTTGTGACGGATCACTCGTATACGGAACCACCGAACAAGAAAATCAAAGTCGAAGACAAGGCAGAGAATCCCCCGGAAAGCGTTTCAAAGACTGCTGCCAATCTGTACGCGGCCTTAGCTGCCAGCCTCCAGGATGAAGACGATCTGCTTCCACCGAAACAAGAACCCGTGGATGTTATTCAGCCATCAGTATTAGTCGGTACGCCGGAGAACCAATCAGTTTTGATACAAGAACCTATATTACAGGTGCAGCAACCAACATTACAAGTGCAACAACCAACATTACAAGTGCAGCAACCGTCGTTACAAGTGCAGCAACCCACGATACAGATGCAGCAGCCGGCGTTACAGGTACAGGTACAGCAGCCCTTACAAGTTCAACAGCCGATGCTGCAAGTTCAACCAATGGATGTACAGAATATCATGTCCCAGGCTGGACAGATTATATTGCAGGAAAAACAGGTCGCTACTCAGCAGACGCAGTTTGTACAACAGCCCATGCAACTTATAGCAGCACCAAGCACATCACAAGGTGGTTTGAGTTACATAGCGCAAAACATACCCGGTAATATGATGCAGAAAACTATCATAATAGTTCAGGGTACTGGAGGTGGTCCTCTCACACTAACGGTTAACAATCCCTCTGGTTTGGACGAGGCCACGCTAAACTCGCTCATAGCGCAGGCGACTGAGGCGATAACACAGCAGCAAATTATTCAGGTGCAGCAACCAACATTACAAGTGCAACAACCAACATTACAAGTGCAGCAACCGTCGTTACAAGTGCAGCAACCCACGATACAGATGCAGCAGCCGGCGTTACAGGTACAGGTACAGCAGCCCTTACAAGTTCAACAGCCGATGCTGCAAGTTCAACCAATGGATGTACAGAATATCATGTCCCAGGCTGGACAGATTATATTGCAGGAAAAACAGGTCGCTACTCAGCAGACGCAGTTTGTACAACAGCCCATGCAACTTATAGCAGCACCAAGCACATCACAAGGTGGTTTGAGTTACATAGCGCAAAACATACCCGGTAATATGATGCAGAAAACTATCATAATAGTTCAGGGTACTGGAGGTGGTCCTCTCACACTAACGGTTAACAATCCCTCTGGTTTGGACGAGGCCACGCTAAACTCGCTCATAGCGCAGGCGACTGAGGCGATAACACAGCAGCAAATTATTCAGAACTCAGGAGTGATACAATCACAAAGGGTGATAGTCAGTCAGTCAGCGCTAGTCAGCTCGTCACAACCCATAATGCTGAAAACTTCCATCACACAGAATCCACCTCAACTGACGCCAAGCCAGCAACCTATAATAACATCTCAACCACAACCTCACAAAGCACAAATCGTTAACCCTCAACAAATCGTCGTCACCCAGAAACAACCACCTGGTATAATAAGTACGTCATCTGGCAACCAGATCGTCAGCACTATAGTTGGTAGCAACCAGCAAATAATCCAAGGGAATCAGCAGTTACTGCAGGGTAACCAACAAATAATAGCGGTTTCCAACAACCAGCAAATAATAGTTAACACTCCAATGAAACCAACTCATAGAGTTGTCCAAGCGTCAAGGAACCAGGTTACAACAGTTGTGACCAGTAACCAGGCTGTCGTCACAACTGATACAAAAACTGTTCAGAGTTCAGCGAAACCTCAATCGGTGATGCGACAGGTTATAACTCGACAACCAGTCATGGTCGGCAATACCAAGATCGGTGACAAAGAAATGGTGGTCACGCAACCTGTAACTGAGAAGATTCAACAACCAAAGAAGATAGAAACTCCACCGCCACAGACGCCACTTCAGACACAGACGCCTACGACGCCAGGGTCTGAGGACACGCCCTGGATCTGTCACTGGCGGGGATGTGGGAAAACGTTCTCCAGTTCGTCCGAGGTGTTCACTCACGTGGCTCGGACCCACTGTCCCAGTACAGCCGGCGGTGAAGCCCCCTGTATGTGGCTAGACTGTGATCGAGTCCCACGGAAGACATTTGCCTTACTAAACCATCTCACTGACAAACATTGCACTCCAAATGCTCTCAAAGCAATATTCAATTCCCGTCGTCACACCGCGAGCGAGGCCGAGTCTGGTAAGCCCATGTCAGTGGGATATCCGCCGAACGCAGCGTTGGCGGCCTTGAACAAACACGCGGCGGATATGTTCAATCCCAGGGAGCTTATGGATGAAAACGAAGGCCCAGTTACGAAAAGCATTCGACTAACAGCGGCACTTATTCTCAGAAACATAGTTATTTACTCAAACACTGGTAGAAGATTACTACGTTCATACGAAGCGCATTTGGCGTCAATAGCCCTCAGCAACGTGGAGGCATCGCGAACTATCTCCCAAGTTCTGTACGATATGAACAATATATGA

Protein sequence:

>DPOGS206164-PA
MAKSQINTKSRNYVQDKEAFLKELKQFNESKNIPYKIPVVNGVDIDLYLLYSLVQQRGGLSKVNQNDTWETFLRQLHLPHPCVNGSTLLRRIYGMYLEKYERAKGPPGRDDDLDMDDDPRRGRGGGMPRISFASGEPLRTGNRVAGPSERLTLSLLSPMPNEQDFAVNVCTVLAADHSNRLPLSTTPHILDFLLAHAGVYNHSSLRDTIGRSYFESRGRYPHEFWSERAGGGGARELADETKFTGDQPELVVQALAAHNTLTDCLMLAGGEEENMEKIVEDDTEDWVTEPSEEDQLFAPTLPGGATCVYTQRVLQIASIVRSLSFHEENVQYLARNTTLIRFLLLCANCWVGTLRQSGLDTLGNVAAELIIKDPATCLISRHVLSTIQSALVSQDRARVLAALELLNKLAQNEVNEEALLKALESKVYSDVCALLTLRDIMVLVCTLECVYALTGLGDRACEAVARVPGLLHTLVSLVTVEAQSYGPRACILMRVVETVSGPPAVDHVQPHTVQNNIPSQQVQAPKPQVEPPVASPAAATHTQPTTLQQSHMQQRTVQENEHFAQAWLRATYEALPASDNSACDAADVYRQYLACCTKLARKGVIAPAHFPRLVRTVFGGTVGPNTVSTSTGETQHVYIGIRAKNIANRSNPPVGPSSPILKAQLTNKPSATVETKPVVTQLQTPAQPADNSNTSLIKHLLAHKVSAAHTHVAQRQQSQQRLPTSGTVVVQTSTATSLQNMEVDPEALIKCTTIIPGTVTSTSVQEKKTAQNKMLADLLEKKSNPPVQVVQMGQQINAPTIQITETGQIVQVKSENMIQLSDSVQPSAPFFQIKNEQGQLIQIKNDQGQIIQLKSDQLQGMIQIKNDQGQIVQIKNDNLAQLLQSGVLQKNEKDIAESVVTDHSYTEPPNKKIKVEDKAENPPESVSKTAANLYAALAASLQDEDDLLPPKQEPVDVIQPSVLVGTPENQSVLIQEPILQVQQPTLQVQQPTLQVQQPSLQVQQPTIQMQQPALQVQVQQPLQVQQPMLQVQPMDVQNIMSQAGQIILQEKQVATQQTQFVQQPMQLIAAPSTSQGGLSYIAQNIPGNMMQKTIIIVQGTGGGPLTLTVNNPSGLDEATLNSLIAQATEAITQQQIIQVQQPTLQVQQPTLQVQQPSLQVQQPTIQMQQPALQVQVQQPLQVQQPMLQVQPMDVQNIMSQAGQIILQEKQVATQQTQFVQQPMQLIAAPSTSQGGLSYIAQNIPGNMMQKTIIIVQGTGGGPLTLTVNNPSGLDEATLNSLIAQATEAITQQQIIQNSGVIQSQRVIVSQSALVSSSQPIMLKTSITQNPPQLTPSQQPIITSQPQPHKAQIVNPQQIVVTQKQPPGIISTSSGNQIVSTIVGSNQQIIQGNQQLLQGNQQIIAVSNNQQIIVNTPMKPTHRVVQASRNQVTTVVTSNQAVVTTDTKTVQSSAKPQSVMRQVITRQPVMVGNTKIGDKEMVVTQPVTEKIQQPKKIETPPPQTPLQTQTPTTPGSEDTPWICHWRGCGKTFSSSSEVFTHVARTHCPSTAGGEAPCMWLDCDRVPRKTFALLNHLTDKHCTPNALKAIFNSRRHTASEAESGKPMSVGYPPNAALAALNKHAADMFNPRELMDENEGPVTKSIRLTAALILRNIVIYSNTGRRLLRSYEAHLASIALSNVEASRTISQVLYDMNNI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: