MonarchBase - Protein-coding gene

DPOGS206420
Transcript	DPOGS206420-TA	927 bp
Protein	DPOGS206420-PA	308 aa
Genomic position	DPSCF300181 + 47056-49962
RNAseq coverage	300x (Rank: top 37%)

Annotation
*Heliconius*	HMEL002906	2e-78	90.07%
*Bombyx*	BGIBMGA013786-TA	6e-120	75.17%
*Drosophila*	Mat1-PA	2e-110	60.70%
EBI UniRef50	UniRef50_E2BZE4	2e-111	63.99%	CDK-activating kinase assembly factor MAT1 n=11 Tax=Bilateria RepID=E2BZE4_HARSA
NCBI RefSeq	XP_396068.1	5e-119	65.48%	PREDICTED: similar to Mat1 CG7614-PA [Apis mellifera]
NCBI nr blastp	gi\|48106220	9e-118	65.48%	PREDICTED: CDK-activating kinase assembly factor MAT1-like isoform 2 [Apis mellifera]
NCBI nr blastx	gi\|350417960	9e-117	67.31%	PREDICTED: CDK-activating kinase assembly factor MAT1-like [Bombus impatiens]

Group
Gene Ontology	GO:0005634	6.4e-165	nucleus
	GO:0007049	6.4e-165	cell cycle
KEGG pathway	ame:412613	1e-118
	K10842 (MNAT1)	maps->	Nucleotide excision repair
InterPro domain	[1-306] IPR004575	6.4e-165	Cdk-activating kinase assembly factor (MAT1)
	[1-309] IPR016390	3.9e-147	Cdk-activating kinase assembly factor (MAT1), metazoa
	[53-251] IPR015877	1.2e-55	Cdk-activating kinase assembly factor MAT1, centre
	[2-63] IPR013083	4.9e-12	Zinc finger, RING/FYVE/PHD-type
Orthology group	MCL13279		Single-copy universal gene

Nucleotide sequence:

>DPOGS206420-TA
ATGGATGATCAAGCATGTCCCCGTTGTAAAACAACGAAATACAGAAATCCATCCCTAAAGTTGATGGTAAACATTTGTGGCCATGCTTTGTGCGAGAGCTGTGTTGATTTATTGTTTTTAAAAGGATCTGGTTCATGTCCTGATTGCAATGTTCCTTTGCGTCGTAGTAATTTTCGTGTACAGCTTTTCGAAGATTCCATGGTGGAAAAAGAAATGGATATAAGAAAACGTGTTCTCAAGGACTTTAACAAAAAAGAAGAGGATTTCTCAACACTCAGAGAATATAACGATTATTTAGAAGAAATAGAAGTAATAATATATAATTTAGTCAATAACATAGATGTGGTCGGAACAAACAAAAGGATAGAACAATATAAAAGGGATAATAAAGAACTTATTATGAAAAACAAAGCCAAAATCGGTAGGGAAGAAATAGAATTAGAGGAGATATTGGAAATTGAAAAGCAAATGGAGGAATTAAGACGTCAGGAAATAGCTAAGATGGAGGATGAGGCGAAGAAACAGAAAATAAGAGCAAAGGAAGCTTTGATTGATGAGTTAATGTTCGCCGACGGAGACGCTAAGGATATATTGAACACATTTGCACAAACTGTGGCTAATAAGCAAGAGGAAGTTGTGCCGCTGCTACCTAAAGTGACACAGTTCTCATCGGGTGTGAAATTTACTAGAGGTTCGAGTCAGGCAATACCTATAATAGAAGAAGGGCCGCTTTACAAATATGAACCGTTAGAAATACCTGATAGATGTGGACCGGATCCACCGTCGTTGGAGGAGATTATGAATAACGGGTTTCTGCATCACGTTAGAGCAGAGAACGAGACAGAGAAAGCTGGTGGTTATACATCTACTCTACCGTGTCTGAGAGCACTCCAAGATGCACTCTCCGGCCTCTACCACGCCAGCTGA

Protein sequence:

>DPOGS206420-PA
MDDQACPRCKTTKYRNPSLKLMVNICGHALCESCVDLLFLKGSGSCPDCNVPLRRSNFRVQLFEDSMVEKEMDIRKRVLKDFNKKEEDFSTLREYNDYLEEIEVIIYNLVNNIDVVGTNKRIEQYKRDNKELIMKNKAKIGREEIELEEILEIEKQMEELRRQEIAKMEDEAKKQKIRAKEALIDELMFADGDAKDILNTFAQTVANKQEEVVPLLPKVTQFSSGVKFTRGSSQAIPIIEEGPLYKYEPLEIPDRCGPDPPSLEEIMNNGFLHHVRAENETEKAGGYTSTLPCLRALQDALSGLYHAS-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: