MonarchBase - Protein-coding gene

DPOGS209800
Transcript	DPOGS209800-TA	1659 bp
Protein	DPOGS209800-PA	552 aa
Genomic position	DPSCF300117 - 575755-584402
RNAseq coverage	427x (Rank: top 29%)

Annotation
*Heliconius*	HMEL008987	67.83%
*Bombyx*	BGIBMGA008025-TA	82.92%
*Drosophila*	ash2-PC	66.36%
EBI UniRef50	UniRef50_Q9VC55	66.36%	Absent, small, or homeotic discs 2, isoform D n=39 Tax=Coelomata RepID=Q9VC55_DROME
NCBI RefSeq	XP_968500.2	72.66%	PREDICTED: similar to trithorax protein ash2 [Tribolium castaneum]
NCBI nr blastp	gi\|270000937	72.66%	hypothetical protein TcasGA2_TC011210 [Tribolium castaneum]
NCBI nr blastx	gi\|270000937	72.66%	hypothetical protein TcasGA2_TC011210 [Tribolium castaneum]

Group
Gene Ontology	GO:0005515	8.9e-09	protein binding
	GO:0008270	1.4e-06	zinc ion binding
KEGG pathway
InterPro domain	[263-510] IPR008985	5.7e-42	Concanavalin A-like lectin/glucanase
	[343-506] IPR018355	3.6e-28	SPla/RYanodine receptor subgroup
	[20-101] IPR011011	4.6e-11	Zinc finger, FYVE/PHD-type
	[344-415] IPR003877	8.9e-09	SPla/RYanodine receptor SPRY
	[20-84] IPR013083	1.6e-07	Zinc finger, RING/FYVE/PHD-type
	[33-83] IPR001965	1.4e-06	Zinc finger, PHD-type
Orthology group	MCL13292		Single-copy universal gene

Nucleotide sequence:

>DPOGS209800-TA
ATGGACCCCGCTTCCAATGGTCAAAACATGCAATCCGAATCTCAGAAAGCGGGGGAAAATGAAAAAAATAAAAGTAAACCCGGAGACACGCAGGGAAACTGTTATTGTGGCAAAGAAAGGAATCTCAACATAGTGGAACTGTTGTGTGCATCATGCAACAGGTGGTATCATGAGTCTTGTATAGGATATCAGTTGGGAAAACTGGTACCATTTATGACGAATTACCTCTTCATATGTAAGAACTGTTCACCAACTGGTTTGGAAACATTTAAAAAGAATCAAGCTCCTTTCCCTCAAATGTGCCTGACTGCAATTGCAAACCTCAAGCAAGAGAGTGCCAAAGATGGCACTAATAGGATCTTATTCAGTAAAGATAGAGAGATAATTCCCTATATAGATCAATATTGGGAAGCCATGACAACTATGCCAAGGAGGGTGACCCAATCTTGGTATGCAACAGTGCAAAGAGCTCTTATTAAAGATATTCAAGTGCTGTTTATTTATGAAGAGGATCAGTCCCAAGGGCCAATGTTCGGTTTATTCAATATGGAATTGACTAATATCAAGCCCAATTATGAAGCCATGATCAAGCAAGGGCAACTCAAGGTCACCGACATGGGAATTGCAACAGTTCAACTAGCCGGTAACGTAAAGGGTCGCCAAGGTAAGCGTCGTCCGGTAGGAGTGGAAACAAGCGCCCCCGTCGGCAAGAAAGGTCGATCAGCTGATTTGGGCGCTCTAAAACTACCCTCCCACGGCTATCCGACCGAACATCCGTTCAATAAAGATGGATACCGCTACATACTAGCTGAACCCGATCCACACGCCCCGTTCAGACAGGAGTTTGATGAGAGCAACGAATGGTCCGGGAAGCCGATCCCGGGCTGGTTGTACCGGTCGCTGTGTCCCGGGATAGTGTTGCTGGCGTTACACGACCGAGCGCCGCAGCTGAAGATAGCCGAGGATCGGCTGGCTGTGACCGGCGAGAAGGGATACTGTATGGTGCGAGCTACGCACGGCGTTTCCCGCGGCTCGTGGTACTGGGAGGCGACTGTGGAGGAGATGCCCGAGGGCGCCGCGGCCAGGCTCGGCTGGGGGCGGCGCTACGCAAACCTACAAGCACCTCTCGGATACGACAAGTTCGGATACTCGTGGCGCAGCAGAAAAGGGACAAGATTCCACGAGTCCCGCGGTCGGCACTACAGCGCTGGCTACGGCGAGGGCGACACTCTCGGCTTCCTCGTCGTGTTACCTGATAACGGCGCCGCTAAATACACGCCAAGCACGTACAAAGACAGGCCTTTAGTTAAATTCAAAAGTCATCTGTACTATGAAGATAAGGACAATATCCAAGAATCTCTGAACAACCTCCGAGTGCTGTCCGGCAGTAAGATATACTATTTCAAGAACGGAGAATGTCAAGGCGAGGCGTTTGTGGATATTTACCAAGGATGCTATTACCCGACTGTGTCTTTACATAAGAACATCACAGTTAGTGTGAACTTTGGACCAAATTTCAAATATCCACCTAACATTGAACACAGCTTTAGACCGATGTCTGAGAAGGCTGAGGAGGCAATATGCGAGCAGACAATGGCGGATTTATTATTCCTTACCGAAAATGAGGGTAAATTACGTTTGGATGCCTTCAACCTCTGA

Protein sequence:

>DPOGS209800-PA
MDPASNGQNMQSESQKAGENEKNKSKPGDTQGNCYCGKERNLNIVELLCASCNRWYHESCIGYQLGKLVPFMTNYLFICKNCSPTGLETFKKNQAPFPQMCLTAIANLKQESAKDGTNRILFSKDREIIPYIDQYWEAMTTMPRRVTQSWYATVQRALIKDIQVLFIYEEDQSQGPMFGLFNMELTNIKPNYEAMIKQGQLKVTDMGIATVQLAGNVKGRQGKRRPVGVETSAPVGKKGRSADLGALKLPSHGYPTEHPFNKDGYRYILAEPDPHAPFRQEFDESNEWSGKPIPGWLYRSLCPGIVLLALHDRAPQLKIAEDRLAVTGEKGYCMVRATHGVSRGSWYWEATVEEMPEGAAARLGWGRRYANLQAPLGYDKFGYSWRSRKGTRFHESRGRHYSAGYGEGDTLGFLVVLPDNGAAKYTPSTYKDRPLVKFKSHLYYEDKDNIQESLNNLRVLSGSKIYYFKNGECQGEAFVDIYQGCYYPTVSLHKNITVSVNFGPNFKYPPNIEHSFRPMSEKAEEAICEQTMADLLFLTENEGKLRLDAFNL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: