MonarchBase - Protein-coding gene

DPOGS211010
Transcript	DPOGS211010-TA	1761 bp
Protein	DPOGS211010-PA	586 aa
Genomic position	DPSCF300004 + 1176562-1187207
RNAseq coverage	385x (Rank: top 31%)

Annotation
*Heliconius*	HMEL008091	9e-120	72.81%
*Bombyx*	BGIBMGA006492-TA	3e-67	96.75%
*Drosophila*	fru-PN	1e-63	87.90%
EBI UniRef50	UniRef50_Q8IN81	2e-61	83.58%	Sex determination protein fruitless n=9 Tax=Drosophila RepID=FRU_DROME
NCBI RefSeq	NP_001157690.1	5e-77	39.75%	fruitless [Tribolium castaneum]
NCBI nr blastp	gi\|255958217	1e-75	39.75%	fruitless [Tribolium castaneum]
NCBI nr blastx	gi\|255958217	5e-78	39.96%	fruitless [Tribolium castaneum]

Group
Gene Ontology	GO:0005515	1.1e-24	protein binding
	GO:0003676	1.1e-05	nucleic acid binding
KEGG pathway
InterPro domain	[87-200] IPR011333	4.7e-30	BTB/POZ fold
	[107-200] IPR013069	1.1e-24	BTB/POZ
	[115-210] IPR000210	1.2e-22	BTB/POZ-like
Orthology group	MCL30434		Lepidoptera specific

Nucleotide sequence:

>DPOGS211010-TA
ATGAAGTTCGCGTTGCGAATACTGGCCGATTATGATGTGAAAGATATTCCGAAGGCCGTGAGACGGCTAGAGGTTTTCGCGTCCCGTAGGGTCGGTGGCCCCGTCGTCAGCATTCTGGAATTAAATTACATAATGTATGGGTCTAGTTTGGAGCATGCAACAAGTAGATATGTGTCGGCGCTCGGCGGTCTAACTGTCAATGTGGAGTACACTTTTGATCATTTTTCAGCACGATCACTGACACTAGCACCAACAATGGACCAGCAATTTTGTTTGCGCTGGAACAATCATCCAACCAACCTGACAGATGTGCTTGCAAGCCTATTACAGAGAGAGGCACTATGTGATGTTACACTAGCATGCGATGGGGAAACAGTCAAGGCACACCAGACAATACTATCAGCGTGTTCCCCGTATTTTGAAAGTATATTCTTACAAAATTCACACCCGCATCCCATTATATTCCTTAAAGATGTGAGGTTCTCAGAGATGAAATCTCTGTTAGATTTTATGTATAAGGGAGAGGTGAATGTTGGCCAAAATATGCTACCAATGTTCCTAAAGACTGCCGAAAGTTTACAAGTTAGAGGTTTGACAGAGAATAATACGTTGAATACTAAGTCAGAGGAGCGGTCGACTCCCAGCGTGAGTGCTGAGAATTTATCCCGCGGTGAGTTCGCCACACCGCCTGCTGCTCATGCGCTCGCAGCTCTAACACCGCTGCCGCAGTCACAGTCACTGCCGCAGTCGCTGCCGCAATCGCTGCCGCAGCCGCTGCCGTTGCCGTTGCCGCCGCACGCGCCGCTCGAGAAGCGACGCAGGAAGAACTCCACCGCGCCAAGGGACGATATCGATCTGTCCTACCGACATTATGAGGGGCACGTGAAGGCTAGCAAAGGTTCAACCGGCTCTGGTTCCGAGCCGTCGACTCCTCCACCAGCTCACGGCCGCGCCGCTCGCTCCCCAGCATTGCTCGTTAAACAAGAGCCAGACTACACGCAACACCACTCCTACGACCAGACTCACCTCACGATGGAGGAGCCAGATGATCAAGACGTGTCTGCGAACCGAGCTCAAACACGGCGAAATGGAATGGGAGTGAATGATATGGCATCAATGATAACCCAGCACTCGATGAACAACGATTGCAACGAGAGCGAACCCGTAATGCCGCCTCACCCCGACCAGACGGACACCATTGACGGTGATAAATATGCGGACGAGAATGATATACCTCAAGAGCATTTCGGCCAAAATATAACAAATATTGAGAATATAGTAAAATCTTTTAGGATAGCATTAAATCATAGATCACATAGCCCAATGACCTGTCAGATATGTGGTAAAACTGTAAGCAATATCAAGAAGCACATGAAATCACACAATCCAGAACAACACAAATGCCCTCTCTGCTCGAAGGGCTGGCACATGAGGCTGACGTTCGAGCGTGTGGCGGGCGCCCTCAACCTGCACCGCTGCAAGCTGTGCGGGAAGGTGGTCACTCACATCAGGAACCACTATCACGTGCACTTCCCTGGACGGTTCGAGTGCCCGCTATGCCGAGCCACCTACACGCGCTCGGACAACCTGCGCACGCACTGCAAGTTCAAGCATCCGGCTTACAACCCCGACACGCGCAAGTTCGAGGGCGCGCCGGTGGCCGTGGGCGCGGGCGTGGGCGTGGGTGGCGCTCACGGGCCTCACGCAGCTCATGCGCCGCCGCCGTTGTTCGCGAACCACCTGGACGCGGGCTTCGACTGA

Protein sequence:

>DPOGS211010-PA
MKFALRILADYDVKDIPKAVRRLEVFASRRVGGPVVSILELNYIMYGSSLEHATSRYVSALGGLTVNVEYTFDHFSARSLTLAPTMDQQFCLRWNNHPTNLTDVLASLLQREALCDVTLACDGETVKAHQTILSACSPYFESIFLQNSHPHPIIFLKDVRFSEMKSLLDFMYKGEVNVGQNMLPMFLKTAESLQVRGLTENNTLNTKSEERSTPSVSAENLSRGEFATPPAAHALAALTPLPQSQSLPQSLPQSLPQPLPLPLPPHAPLEKRRRKNSTAPRDDIDLSYRHYEGHVKASKGSTGSGSEPSTPPPAHGRAARSPALLVKQEPDYTQHHSYDQTHLTMEEPDDQDVSANRAQTRRNGMGVNDMASMITQHSMNNDCNESEPVMPPHPDQTDTIDGDKYADENDIPQEHFGQNITNIENIVKSFRIALNHRSHSPMTCQICGKTVSNIKKHMKSHNPEQHKCPLCSKGWHMRLTFERVAGALNLHRCKLCGKVVTHIRNHYHVHFPGRFECPLCRATYTRSDNLRTHCKFKHPAYNPDTRKFEGAPVAVGAGVGVGGAHGPHAAHAPPPLFANHLDAGFD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: