MonarchBase - Protein-coding gene

DPOGS200537
Transcript	DPOGS200537-TA	1914 bp
Protein	DPOGS200537-PA	637 aa
Genomic position	DPSCF300119 - 298853-301970
RNAseq coverage	287x (Rank: top 38%)

Annotation
*Heliconius*	HMEL008568	0.0	76.13%
*Bombyx*	BGIBMGA001985-TA	2e-52	31.26%
*Drosophila*	m-cup-PA	3e-174	47.77%
EBI UniRef50	UniRef50_E3WWG9	0.0	50.60%	Putative uncharacterized protein n=1 Tax=Anopheles darlingi RepID=E3WWG9_ANODA
NCBI RefSeq	XP_001606383.1	0.0	53.99%	PREDICTED: similar to sex-determining protein fem-1 [Nasonia vitripennis]
NCBI nr blastp	gi\|375493326	0.0	55.38%	fem-1 homolog A-like protein [Locusta migratoria manilensis]
NCBI nr blastx	gi\|375493326	0.0	55.38%	fem-1 homolog A-like protein [Locusta migratoria manilensis]

Group
KEGG pathway
InterPro domain	[37-266] IPR020683	7e-45	Ankyrin repeat-containing domain
Orthology group	MCL16547		Insect specific

Nucleotide sequence:

>DPOGS200537-TA
ATGCAAGAGTGCAAGCATAGTGCCCCAGGTGCACGCCTCTCTGCAAAGCTGCGGACAGCTTTAGAAAGGATGCCTCCGGAGGAGCGTCGTGCAGTCTGCAGTAGGACCCGCGAGGGTTGCGCGCCGTTGTTCGTGGCCTGTCGCCGAGGCAACGTGGAGCTGGTGGAGTATCTGGTGCACGTGTGTGCGGCCGAGTTGGAGCAGCGTGGTGTGTACGAGGTGCCACATGACCGCTCCACGCACTCCGTCACTCCGCTGTGGTGCGCCGCCGTGGCCGGTCGTCTCGAGGTGCTGCGTGCACTGGCCGACGCCGGCGCCGACCTGGATGCTGGGAGTGACAGCGGCTCGACCCCGGTACGCTCGGCGTGCTTCATGACGCACCTCGAGGTGGTGCGCTTCCTGGTGGAACGCGGCGCCGACATTCACCGCGCCAACCACAACGGCGGCACGTGCCTCATTAACTCGGTGCAGTCCGTCCCTCTGTGCGCCTTCCTGCTGGAGCGCGGCGCGCACGTGGACGCCCGCGACATGCAGCACAAAACGGCGCTCCACTACGCCATCCAGGAGCACCGCCTCGAGACCGCGCGCCTCCTACTGGACCGCGGTGCTTCCCCTCACCTCCGCTCCCGAGCCGGCGACGACGCGCTCCGTACGGCCTGCCTCAAGGGTGCGTCGCAGATCGCAGCCCTGCTGTTGTCTCGTGTCCGATACTCACCGGCTCGGACGGCCGACGCCTACGAGCTGTTGGGTGCTACCCAGCTGGACGAATTCAACGATGTGGCGGCCGCTCTTGGCTCCTGGCGGCGGGCGACCGCCGTCCGGCACGCTCACGGCGGCTACGTCGAGAAGACCGGCGATCCCTTAGCGGAGGACGCAGCGGGCGGAGCGGACGCGCTGGCGGCCGGCGCCCTGGGCGGGGCACGCGAGTGGCGCTCGGCCGAGGAGCTGGAGATACTTGCCACCGACGTAGACGCGCTTCGCACGCAGGCTCTGCTGGTTGCCGTCCGCGTGCTCGGGGTCGCTCACAAGGACACCGTGTTCCGTCTCATGTACCGAGGAGCGTCGTACGCTGACGCCTTCCGCTACCAGCGATGCATCGACCTTTGGAGCTGGGCGCTGCAGATTCGTATAGAGAAAGATTCTCTGCTGTATACGGACACGTGTCACACAGCGAGCGCCCTGACCCGTCTGTTGTTGGACGCGGGCGGCGGTCGCCTGGAGCGTGCGCGAGGTCTGCCGAGACACCAGGACGTGCTCCGCGTTTTTACTCTACTGGCGGACCACCTGCCAGAATGTCGTCGTGCGCTGGTCGCCCGCCCCGTCCACAAGAAGCAGGCGGAGACCTTCGATCGCGCGCTACGTTGCGTGTCTCACCTCCTCCATCTCCTGCTGCTGACCGCTCGCTCGGAGAGCGATCACGAAGAGGTTCGCGCCCGTGTCCGCCGGCTGGTGGCGGCCGACGTTCGCAGCGCCCACACGGGTGACACGCTCCTCCACCTGTGCGTGTCGCGCCTGAACGTAGTCCGCTCCACGTACTTCGCCGACGAGACGGCGGTCCCGCCGGTGTTCCCGAGCGTGAAGGTCGTGGCGCTGCTGCTGAGCTGCGGAGCGGACGCTCGCGTGCGCAACGAGGCGCGGTCAACGGCGCTGCACGTGGCCGCCATTCCGTACAACTTCTCCACCGTGCTGGTGGAGACGCTGCTGGCGGGCGGCGCGCACCTCGACCAACCCAACCGCTTCGGAGACTCGGCAGCGGAGCTGGTGTCCCTGAACCGCGGCTCCCGCGTCCGCGTGCTGCGTCACGTGTCCCTGGCCTGTCTCGCGGCGCGCGCTCTGCTCGCGTCCCGGCGGGATATCCCCCCGCACACCCTGCCGCGGACGCTCCATGCCTTCCTCGACCTGCACCGAGCCTGA

Protein sequence:

>DPOGS200537-PA
MQECKHSAPGARLSAKLRTALERMPPEERRAVCSRTREGCAPLFVACRRGNVELVEYLVHVCAAELEQRGVYEVPHDRSTHSVTPLWCAAVAGRLEVLRALADAGADLDAGSDSGSTPVRSACFMTHLEVVRFLVERGADIHRANHNGGTCLINSVQSVPLCAFLLERGAHVDARDMQHKTALHYAIQEHRLETARLLLDRGASPHLRSRAGDDALRTACLKGASQIAALLLSRVRYSPARTADAYELLGATQLDEFNDVAAALGSWRRATAVRHAHGGYVEKTGDPLAEDAAGGADALAAGALGGAREWRSAEELEILATDVDALRTQALLVAVRVLGVAHKDTVFRLMYRGASYADAFRYQRCIDLWSWALQIRIEKDSLLYTDTCHTASALTRLLLDAGGGRLERARGLPRHQDVLRVFTLLADHLPECRRALVARPVHKKQAETFDRALRCVSHLLHLLLLTARSESDHEEVRARVRRLVAADVRSAHTGDTLLHLCVSRLNVVRSTYFADETAVPPVFPSVKVVALLLSCGADARVRNEARSTALHVAAIPYNFSTVLVETLLAGGAHLDQPNRFGDSAAELVSLNRGSRVRVLRHVSLACLAARALLASRRDIPPHTLPRTLHAFLDLHRA-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: