MonarchBase - Protein-coding gene

DPOGS210234
Transcript	DPOGS210234-TA	1449 bp
Protein	DPOGS210234-PA	482 aa
Genomic position	DPSCF300196 - 232118-235641
RNAseq coverage	167x (Rank: top 51%)

Annotation
*Heliconius*	HMEL020448	2e-107	59.43%
*Bombyx*	BGIBMGA002373-TA	5e-29	57.39%
*Drosophila*	CG32343-PB	3e-44	34.52%
EBI UniRef50	UniRef50_E2AG15	2e-55	37.91%	GA-binding protein subunit beta-2 n=5 Tax=Formicidae RepID=E2AG15_CAMFO
NCBI RefSeq	XP_316418.4	2e-56	41.23%	AGAP006384-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|383859784	2e-56	42.45%	PREDICTED: neurogenic locus notch homolog protein 2-like [Megachile rotundata]
NCBI nr blastx	gi\|158295784	2e-53	36.48%	AGAP006384-PA [Anopheles gambiae str. PEST]

Group
Gene Ontology	GO:0005515	1.5e-08	protein binding
KEGG pathway
InterPro domain	[43-195] IPR020683	1.5e-41	Ankyrin repeat-containing domain
	[143-171] IPR002110	1.5e-08	Ankyrin repeat
Orthology group	MCL16123		Insect specific

Nucleotide sequence:

>DPOGS210234-TA
ATGACTTCAGATCTCTGTGAAGAAGATGTAGTCGTTCGATTATCCTCACCTCATATAATATCATCAGAGACGATAGTACCAGCTGCCAGTAATGTTGGCGGTGGACGAATACAGACCGGAGGAGTGGAGCTGGGTCGCAGACTGCTCTTAGCAGCCAGAGCAGGAGATACCGCTACTGTACTTGATCTCATGGCCAAAGGTGCACCATTTACCACTGACTGGCTGGGTACATCACCGCTGCACCTGGCTGCTGCCAACAACCATGTGGAGACATGCGGTGTATTACTGAGGGCGGGTGTGTCTCGGGATGCTCGGACTAAAGTTGAACGAACACCGCTGCACCTGGCCGCACATGCTGGGCATGCCGCTGTAGTTGCACTGCTGCTCGACCATGGAGCTATGGTGGACTGTCGCGACATGCTCCACATGACGCCGCTGCACTGGGCGAGTGCTCGAGGTCACGTGGCCGTGGTCCGCGAGCTAGTGTGTCGCGGCGCGGATTTGCTCGCTCGCTGCAAGTTCAGGAAGACGCCGCGCTGCCTCGCCGTCCGCGCCGGGGCCAGTGACGTCATGGCTGTCCTCGACCAAGCTGCCAAGGAACACGACCGACCCACAGTGACTGAGGAAACGCCAAAGATTCAACATTTTGAAACAATCCAAAGACTACAGGAGGTCAGACAGCAGACCAAAACCAAGCCTCCGGAGAAGACTATCGTAATAGAATCTAAGACTGAGCCGGCGTCGGGTCTGTCCGGGGCGGCGTTACTCCGCGCACACGGCATCACTCTCCTACCCCGGGACCGCGGCTCCACTGTACTCAGCGCACTGAGGAGCGGACGGACCGTCGTACTGTCCGATGCCGGGAAGCTGATGTTGAAGGAGAGCACCAACGCCCCGGTGATGGTCAGCGCCACCAGCGCCTCTGTGGACGCGAGCAACAACACAGCCAGCAACAGTCAGTCAAGCTTGCCCACAACTAACATAGTGACCAGTTCAAACATCACCGACGCTAAAGGGGTCATGGTCCGAGCGAGGACTCTCAACACCATCAAGGGCGTCAAAGGCTTGCAAATGCTCTCCGTCAACAGATCCGACCACACTGTTAAGAAGGTCATCAGTTCACATGACTTGCAGAAAGTTAAATTACTCGGCGTGAAAGAGAACAAGTCACCCCGCCGTCCAGCTCTCAAGATCCTTCTCAACAAAGCCAACCTCACACGACTACTAGCCAACACCACTAACGCTTCTACCACCAACAACACACAGATATCGATCGAGCCTTCCGGCGAGCTGAGCGAGTCGCCGGTTCAAAGTGACGCGGTGATGGAGGACGCGTCGGAATCGTCTCTGAGGGTTCAACTGCAACAAGCGCACGCCGCCCTGGCCAGCCTGGCCGCAGAGTTACGACACTGTAAGGCTAAACTGGCCAAATACGAACACACGCACTGA

Protein sequence:

>DPOGS210234-PA
MTSDLCEEDVVVRLSSPHIISSETIVPAASNVGGGRIQTGGVELGRRLLLAARAGDTATVLDLMAKGAPFTTDWLGTSPLHLAAANNHVETCGVLLRAGVSRDARTKVERTPLHLAAHAGHAAVVALLLDHGAMVDCRDMLHMTPLHWASARGHVAVVRELVCRGADLLARCKFRKTPRCLAVRAGASDVMAVLDQAAKEHDRPTVTEETPKIQHFETIQRLQEVRQQTKTKPPEKTIVIESKTEPASGLSGAALLRAHGITLLPRDRGSTVLSALRSGRTVVLSDAGKLMLKESTNAPVMVSATSASVDASNNTASNSQSSLPTTNIVTSSNITDAKGVMVRARTLNTIKGVKGLQMLSVNRSDHTVKKVISSHDLQKVKLLGVKENKSPRRPALKILLNKANLTRLLANTTNASTTNNTQISIEPSGELSESPVQSDAVMEDASESSLRVQLQQAHAALASLAAELRHCKAKLAKYEHTH-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: