MonarchBase - Protein-coding gene

DPOGS202772
Transcript	DPOGS202772-TA	1764 bp
Protein	DPOGS202772-PA	587 aa
Genomic position	DPSCF300018 - 1073280-1076042
RNAseq coverage	250x (Rank: top 42%)

Annotation
*Heliconius*	HMEL002685	0.0	66.90%
*Bombyx*	BGIBMGA010495-TA	0.0	63.26%
*Drosophila*	Caf1-105-PA	4e-113	48.79%
EBI UniRef50	UniRef50_Q16HR3	5e-128	57.95%	Chromatin assembly factor i P60 subunit n=4 Tax=Pancrustacea RepID=Q16HR3_AEDAE
NCBI RefSeq	XP_308335.3	2e-129	54.20%	AGAP007544-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|158285483	3e-128	54.20%	AGAP007544-PA [Anopheles gambiae str. PEST]
NCBI nr blastx	gi\|158285483	4e-126	46.03%	AGAP007544-PA [Anopheles gambiae str. PEST]

Group
Gene Ontology	GO:0005515	1.1e-50	protein binding
KEGG pathway
InterPro domain	[10-381] IPR015943	1.1e-50	WD40/YVTN repeat-like-containing domain
	[13-380] IPR011046	5.7e-47	WD40 repeat-like-containing domain
	[115-154] IPR001680	1.5e-07	WD40 repeat
	[118-154] IPR019781	1.8e-07	WD40 repeat, subgroup
Orthology group	MCL12906		Single-copy universal gene

Nucleotide sequence:

>DPOGS202772-TA
ATGAAGTTTGCTATACCTGAAATATCATGGCATAACAGAGATCCAGTTTTAAGTGTAGACATTCAGCCCAAAACAAATGCAAGTGAACCACTGCGGTTAGCTACCGGGGGCACAGATTCTCATGTTGTGATATGGTATTTATCAAAAACAATAACCGGTTCAGTGAAATTAGAAGTCGCTACTGATCTCACCAGGCATCAAAAAGCCGTTAATGTAGTGAGATGGTCGCCCAATGGTGTCTACTTAGCATCTGGAGATGATGAATCTATCATATTTATATGGAAGCAAAAGACGGAAGAGCCAATAGCACCACCCTTAGAGGGAGAGGAGCAGTATAAAGAGACTTGGGTTATACATAAAACTTTAAGGGGTCACATGGAGGATGTTCTGGACATCAGTTGGAGTAGTTCATCACTACATTTGGCATCCGGCTCAGTAGACAACAAGCTGATTGTCTGGGATGTGGCGAGAGCTCGATCTAGTGGTATTGTCTCTGATCATAAAGGCTTTGTCCAGGGAGTAGCATGGGACCCTCAAGGACAGCTGATAGCCACAGCTAGCTCGGATAGAGTTTTCCGAACATTTGATGTGGGGACTAAGAAAGTGTTGTCTCGTAGCAGTAAGGCTATTCTACCGTTCCCTAAGGAGCATACCCTACATGAAGTGAAGGTCCGCCTCTACCATGACGACACTCTACAGACGTACTACAGGAGATTACATTTCAGTCCCGATGGAATGTTCATTGCTGTGCCGGCCGGAAGAATAGAACCAGAACAAGGCAAACTGGACATTAAACCAATGAATGCTGTTTACATTTACACTAGACACTCTCTCAAAACTCCTGCGTGTGTGGTTCCGTGTGGAGAGCCGGCGCTGGTGTGCCGCTGGTCGCCCGTGCGTCGTGCGGCGCGGACTTCGCCCCCCGCGCCGTCTGCTTTGCAGCACGCCCCTCGGCTTCTGCTGGCGGTGGCCACGCGGAGATCGCTGCTGTTGTACGACACGCACCAGAAAGCGCCCGTCGCGCTCATCTCAAACATACACTACACCAGGATCACAGACCTTTCGTGGTCTTCCGACGGCCTGACCCTAGTGGCCTCCAGCACTGACGGTTTCTGCTCCGTCGTCAGTTTCACCGAGGAAGAGCTGGGCGAGGCGCTCACCACCGCGGACGCCGTTAGTGCAGAGCCGATGGAAACGGAGGAACAGAAACATAACCAAGAAACTCCTAAACAGAGACACGCTGAGGCGAAACCCATAGAAGTCAAGCGGAGGCCGTCCTCGAACAACACCAAAATAGACGCCTTCATTAAGTTTAAAACTCCCGAAGATAAGTCTCCGAAGAAGAAGAAGATCGAAAACATTCAGCAGAAGACGCCCGTCAAGATGGACGTCCTCATGGAGACCGCGCTGCCATCCTGGTCTGACAACTCCAGCAACGACCTCATCAGACCCAAGGACACGGAGACCGCGACCCTCGGCGACGAAAATGACGTCACCGTCATAGAGGACAGCGAGGACATCCAGCTGGTCTACGAGGAGACCAAGGACGGCCAGTCGCCCAAGACGGAACCCTCGGAGGAAAAACCTGCTCCCAAGACGATGTCTCCCAAACAATGCGGCACGGCCGACAGCAACTTCCTAATGAAGGCAAAGATCACCGACATCAGGGAGCCGGCGCCGCTCACCGCCGTGCCGAGTCCCAAGGCACCGCGGAGAGTCAGCTTCGTGACGCTGTCGAGTCCTAAGAGCACGAAAAAAAAATAA

Protein sequence:

>DPOGS202772-PA
MKFAIPEISWHNRDPVLSVDIQPKTNASEPLRLATGGTDSHVVIWYLSKTITGSVKLEVATDLTRHQKAVNVVRWSPNGVYLASGDDESIIFIWKQKTEEPIAPPLEGEEQYKETWVIHKTLRGHMEDVLDISWSSSSLHLASGSVDNKLIVWDVARARSSGIVSDHKGFVQGVAWDPQGQLIATASSDRVFRTFDVGTKKVLSRSSKAILPFPKEHTLHEVKVRLYHDDTLQTYYRRLHFSPDGMFIAVPAGRIEPEQGKLDIKPMNAVYIYTRHSLKTPACVVPCGEPALVCRWSPVRRAARTSPPAPSALQHAPRLLLAVATRRSLLLYDTHQKAPVALISNIHYTRITDLSWSSDGLTLVASSTDGFCSVVSFTEEELGEALTTADAVSAEPMETEEQKHNQETPKQRHAEAKPIEVKRRPSSNNTKIDAFIKFKTPEDKSPKKKKIENIQQKTPVKMDVLMETALPSWSDNSSNDLIRPKDTETATLGDENDVTVIEDSEDIQLVYEETKDGQSPKTEPSEEKPAPKTMSPKQCGTADSNFLMKAKITDIREPAPLTAVPSPKAPRRVSFVTLSSPKSTKKK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: