MonarchBase - Protein-coding gene

DPOGS210632
Transcript	DPOGS210632-TA	1557 bp
Protein	DPOGS210632-PA	518 aa
Genomic position	DPSCF300168 + 575279-581778
RNAseq coverage	325x (Rank: top 35%)

Annotation
*Heliconius*	HMEL008297	3e-151	70.53%
*Bombyx*	BGIBMGA013583-TA	0.0	67.70%
*Drosophila*	Tango10-PB	1e-98	39.76%
EBI UniRef50	UniRef50_E2B6B0	9e-135	49.80%	BTB/POZ and BACK domain-containing protein LOC388419 n=11 Tax=Neoptera RepID=E2B6B0_HARSA
NCBI RefSeq	XP_624867.1	1e-136	48.74%	PREDICTED: similar to CG1841-PA, isoform A [Apis mellifera]
NCBI nr blastp	gi\|383857909	4e-136	48.36%	PREDICTED: BTB/POZ domain-containing protein 17-like [Megachile rotundata]
NCBI nr blastx	gi\|383857909	2e-133	48.36%	PREDICTED: BTB/POZ domain-containing protein 17-like [Megachile rotundata]

Group
Gene Ontology	GO:0005515	2.1e-18	protein binding
KEGG pathway
InterPro domain	[20-148] IPR011333	2.1e-23	BTB/POZ fold
	[43-147] IPR013069	2.1e-18	BTB/POZ
	[48-148] IPR000210	1.7e-16	BTB/POZ-like
Orthology group	MCL11758		Single-copy universal gene

Nucleotide sequence:

>DPOGS210632-TA
ATGGATTATTTAACAGTGGATTCTGCTTCTACATCCCTGGTTCAGAGCAAAGATGAAGAGAATGACAATGATGATCTTGAAGTGGACAACTCAAAAAGTGTTTTGCTCAAGATTGCCACACTTTATGCTGAACAGTTGATGAGCGACCTTATTCTGGAGGTGGCTGGTGTCAGCTATCCGGCTCATAGGCTCATTCTGTGTGCTAGTAGTGAAGTGTTCCAGATAATGTTAATGAATCGTGAATGGAGTGAGTGGCGTGAGAGTCGTATAGTTCTTCAAGAGACTCCATCAGCGGTGGCGGTGTTCCCACACTTCCTGAAGTACTTCTACACGGGACAAATCAAGATATCATACACATCGGTGTTGCCAGTACTGTCGCTAGCTGATAAATATAATGTTAAGGACCTTGTGAATCTGTGCTTGGAGTACATGTCCCAGCACATAGCTCAAGCTGCTCGACGTGGCCGCCTTATATCCTGGATGCAGTACACTATGGCATGGCCTGCGTGTGTCCGCTTCGTGAAATGGAACGTTGAATGGGTGGTGGAGGGAGAGCTTGGGGAGCTGGAAGACGACTCACTGCTGCTGTTGATGGACCAGAGCGACCTGGTGCTGCATAACGAGATGGCGCTCTACCAGTTGGTGGTAGCGACCAACTTATTCGTCTTCCTGCGTCTCCAGTCTACAGATGTACCGGAGCAAGATGTCAAGTTGCACTTTGACTCGCTCATAGTAACTGTTTTCTCACATGTCAGGTTCCCGATGATGTGTCCGAACCAATTGGCAAAGTTGTTGCTGTGTCCGCTCACTCAAGAACATAAGGAGTTTTTCATGGAGAGAATGGCGATCGCCATGAGTTACCAGTCAGGTCAGTACGAGCGTATAGCTGAAATCCAGCAGTCCGAGGCTGGTAGGATGTTGTTCACGCCCCGTCTCTACACTGAGGATATCTGGGGTTCCGTACTGGCGGTGGACAACTTCCACTCTCTTCCCTGTTATCACACCAGGACCTTCATATTCTCCACCAGACCCACCATCGCTGACGTCACAGACAAACTCACCGAGTGGACCGTGGACCTGTACCCTAAGGGCGTTTGGTTTAAGAAGAGCATGCTCATTATGTGGGCGGGCAATTATGATGTACCTGAGGTGGTGCTGCGCACAGTTCGCATCTCCATCACGTGTCAGAACGTCCCCGAGCGAGCCTCGCACGATCCCGACGTGAGGGTCAAGATAGGTATACTGGTGTGGGGAGTACAGAACGGCGTGGAGCACGTGGCCTCCGTGGTGGAGAGAGTGCACAGGTTCTCAGCGCAGAACAGGGTACTTAATATAGACGGTGCGCTGGACTTCGACGAGCTGAACAGTCCGCTGTACCGACCCGCCGCGCCGACGAACACGCCTAAGACTGGCGGCCAGCGGTGTCCGAAGTGTTCCGACAACTGTGAGGTGTCTCAGAAGACTCACCTGCTGGGACCGGCCGCCGATCAGCTGAGGATCCAAGTGGTGATAGTGCCCCTGACTGATTTCTGTGACGTCAGCGACACCCGCGGATGA

Protein sequence:

>DPOGS210632-PA
MDYLTVDSASTSLVQSKDEENDNDDLEVDNSKSVLLKIATLYAEQLMSDLILEVAGVSYPAHRLILCASSEVFQIMLMNREWSEWRESRIVLQETPSAVAVFPHFLKYFYTGQIKISYTSVLPVLSLADKYNVKDLVNLCLEYMSQHIAQAARRGRLISWMQYTMAWPACVRFVKWNVEWVVEGELGELEDDSLLLLMDQSDLVLHNEMALYQLVVATNLFVFLRLQSTDVPEQDVKLHFDSLIVTVFSHVRFPMMCPNQLAKLLLCPLTQEHKEFFMERMAIAMSYQSGQYERIAEIQQSEAGRMLFTPRLYTEDIWGSVLAVDNFHSLPCYHTRTFIFSTRPTIADVTDKLTEWTVDLYPKGVWFKKSMLIMWAGNYDVPEVVLRTVRISITCQNVPERASHDPDVRVKIGILVWGVQNGVEHVASVVERVHRFSAQNRVLNIDGALDFDELNSPLYRPAAPTNTPKTGGQRCPKCSDNCEVSQKTHLLGPAADQLRIQVVIVPLTDFCDVSDTRG-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: