MonarchBase - Protein-coding gene

DPOGS204352
Transcript	DPOGS204352-TA	1548 bp
Protein	DPOGS204352-PA	515 aa
Genomic position	DPSCF300142 + 366504-368051
RNAseq coverage	41x (Rank: top 72%)

Annotation
*Heliconius*	HMEL003193	7e-174	54.74%
*Bombyx*	BGIBMGA007055-TA	2e-174	52.68%
*Drosophila*	CG6053-PB	1e-96	37.72%
EBI UniRef50	UniRef50_D6WDC8	4e-101	40.28%	Putative uncharacterized protein n=1 Tax=Tribolium castaneum RepID=D6WDC8_TRICA
NCBI RefSeq	XP_971718.1	8e-102	40.28%	PREDICTED: similar to AGAP011539-PA [Tribolium castaneum]
NCBI nr blastp	gi\|91092924	2e-100	40.28%	PREDICTED: similar to AGAP011539-PA [Tribolium castaneum]
NCBI nr blastx	gi\|91092924	1e-98	39.73%	PREDICTED: similar to AGAP011539-PA [Tribolium castaneum]

Group
Gene Ontology	GO:0005515	1.6e-30	protein binding
KEGG pathway	tca:660389	2e-101
	K11143 (DNAI2)	maps->	Huntington's disease
InterPro domain	[98-429] IPR011046	1.6e-30	WD40 repeat-like-containing domain
	[136-428] IPR015943	2.8e-25	WD40/YVTN repeat-like-containing domain
Orthology group	MCL25310		Lepidoptera specific

Nucleotide sequence:

>DPOGS204352-TA
ATGAATACTATACGTGTTACTCTACAAGACCGTGGAGTTAACCATGCAGAAGGCGGGTGGCCAAAAGATGTTAATGTTAATGACGAGGAAGCGACAGCCCGATATCGTAGACGTTTTGAACGAGATGATGCATATGTGGGTGCTGTACTTTCTTCAAATCCTTATTTCGAACACTTAATTCATCAAAATAATGCTATTGAAATGTACAATATGTATTTCAAGGAAATGAAGCCCCAGAAACCAGTGGAAACATATTCAGTGAAAATAAAAAATGCTTATAAAGATTTATTTCAGCGTCCCGTTGCTTCAATTGCTTGGACCTTCGAGGCTAATTCTAAACTTGTTGTCTCCCATTGTTATAAAAAAATGCTTTTAGGTAAACCACTTAACACAAGACTAGAGGGCAATGTTTGGGATTTAGAAAATGCGAATGAACCAGCGGAACAATTTTTGTCTCCAACAGCATGTTGGCAAATAGTTTGTTCACCTTCTCATCCCAAAGTAATGATGGGTGGCCTCGAAGATGGCAGAGTATGTATTTTTGATTTGCGTGAAAAAATAGAACCAGTTCGGTTCAGCATGATGCATTTAGCCCATAGAGATCCCGTTAGTGCACTATTATTCTTACATAGCAGACTTAATACTGAATTCTTTAGTGGTTCTAGCGATGGAAAATGTATGTGGTGGGATATAAGAAATATATCTGAGCCTGTCGATTCACTTATTATGTCGATAAATCCGACTTCTCAAGATTTTGTATCTATGGCTGATGCAGAAGGTATAAGTTGTTTGCAATATGATAAAACTTTCCCAACCAAATTTTTGTGTGGTACTGACACAGGTTTAGTTATTAATGTGAATCGTAAAGGCAAAACTCATCAAGAAATTATGAGTGCCATTTTCAATGCTCATTATGGTCCAGTAAAAGCCCTTTATCGTAGTCCTTGCACGACAAAAGTTTTTATTACATGTGGCGACTGGACCGTTAATATTTGGAGTGATGATGTGCATTGCTCCCCTATAATATGTGGTAAAGCACATAGAATGCAAATATCTGACGTTAGTTGGTCTCCTCAAAAAATGTCAGGATACATGTCTATAAGTTATGATGGAAAATTTAGGTACTGGGATCTATTAAGACGACACTATGGTGCTATTGTCACAAAACCGGTTTCAAAATTTCCGCTTTTAAGACTGAAACCAAACAAACAGGGTAAATTTGTTGCCGTTGGAGACACACAAGGAATTGTGAATCTTTTATCGTTATCTGATAGTCTTGTTATTTCGGATAATAAAGATAAGACTTTAATGAACCAAACATTCGAACGTGAAGGGCGAAGGGAACATATAATAGAAACAAGAATAAAAGAAATAAGATTAAAATTGAGAGAAGTTGAAACGGGAGTAGATTCTGATATTGATTTAATGGATGAAAATGTTATAAAAACCGCAGAAGATGAATTTAAGAGAGTGGTTACTGAGGAATTGAAAAGATCTGGTACAACACACATTTCTAGCGGAAAACGTTATCCAATGCGAAACCGTTAA

Protein sequence:

>DPOGS204352-PA
MNTIRVTLQDRGVNHAEGGWPKDVNVNDEEATARYRRRFERDDAYVGAVLSSNPYFEHLIHQNNAIEMYNMYFKEMKPQKPVETYSVKIKNAYKDLFQRPVASIAWTFEANSKLVVSHCYKKMLLGKPLNTRLEGNVWDLENANEPAEQFLSPTACWQIVCSPSHPKVMMGGLEDGRVCIFDLREKIEPVRFSMMHLAHRDPVSALLFLHSRLNTEFFSGSSDGKCMWWDIRNISEPVDSLIMSINPTSQDFVSMADAEGISCLQYDKTFPTKFLCGTDTGLVINVNRKGKTHQEIMSAIFNAHYGPVKALYRSPCTTKVFITCGDWTVNIWSDDVHCSPIICGKAHRMQISDVSWSPQKMSGYMSISYDGKFRYWDLLRRHYGAIVTKPVSKFPLLRLKPNKQGKFVAVGDTQGIVNLLSLSDSLVISDNKDKTLMNQTFEREGRREHIIETRIKEIRLKLREVETGVDSDIDLMDENVIKTAEDEFKRVVTEELKRSGTTHISSGKRYPMRNR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: