MonarchBase - Protein-coding gene

DPOGS200934
Transcript	DPOGS200934-TA	1482 bp
Protein	DPOGS200934-PA	493 aa
Genomic position	DPSCF300301 + 155252-162683
RNAseq coverage	5x (Rank: top 88%)

Annotation
*Heliconius*	HMEL004517	5e-90	71.98%
*Bombyx*	BGIBMGA000305-TA	4e-126	49.60%
*Drosophila*	dmrt93B-PA	3e-39	39.00%
EBI UniRef50	UniRef50_D7EHU2	3e-46	48.66%	Putative uncharacterized protein n=1 Tax=Tribolium castaneum RepID=D7EHU2_TRICA
NCBI RefSeq	XP_001649612.1	1e-43	39.34%	hypothetical protein AaeL_AAEL004696 [Aedes aegypti]
NCBI nr blastp	gi\|157107073	3e-42	39.34%	hypothetical protein AaeL_AAEL004696 [Aedes aegypti]
NCBI nr blastx	gi\|118794814	1e-41	47.49%	AGAP001388-PA [Anopheles gambiae str. PEST]

Group
Gene Ontology	GO:0007548	1.4e-21	sex differentiation
	GO:0005634	1.4e-21	nucleus
	GO:0003677	1.4e-21	DNA binding
	GO:0006355	1.4e-21	regulation of transcription, DNA-dependent
	GO:0003700	1.4e-21	sequence-specific DNA binding transcription factor activity
	GO:0005515	3.6e-06	protein binding
KEGG pathway
InterPro domain	[6-53] IPR001275	1.4e-21	DM DNA-binding
	[191-223] IPR005173	6.8e-14	DMRTA motif
	[179-237] IPR009060	3.6e-06	UBA-like
Orthology group	MCL17082		Insect specific

Nucleotide sequence:

>DPOGS200934-TA
ATGAACAACGGTAGAGCCCGTGTTCCGAAGTGCGCTCGATGTCGCAACCACGGTCTCATATCTAGTCTCAGGGGACACAAGAAGTCTTGTGCTTATCGAGATTGTCAGTGTCCAAAATGTGGATTGATAAAGGAGCGGCAGCGAATAATGGCCGCACAGGGATCAAGTTTTATTTTCGTTTCCAATGAGGCGGCCGACGGTTGTCGCCCAGAGATCCCTTGGGTGACCGCTCACCAAACACAAACATTGTCTGTAGCCTTAAAAAGACAACAAGCCGCGGAGGACAAGATAGCCTTACATTTGGCGTCGGTCGAGAGCGGCACAAATCTCGCGTCGCTGCCTCCGGGTCGTATTTACGGCATGAGAGTTACAGGACCTTCACCCAGCTCGGGACCTGATCCAGACTCCGTTGTTGATGATCATAGCCCCATCCACATTGACAGTGAAACGAGCGATTCTTTACCTGACTGTTGCACGGCAACTCGAGACAACGACGGAAATTCGAATGCAAATGCGCGATCTTGTGCTAGTGAAAACGAAGAAAGTTTGAGCAGCGTGAGTACAGCAGGACTGGACATGCTCAGGAAGTTGTTCCCGGGGAAGAAGAGATCGGTTCTTGAATTGGTGTTACGAAGATGCAACCATGACTTGCTTCGAGCTGTGGAGCACTGCAATGCTATACACGCTCAACGTGACAAATCAACTGCCAGTTCAAGCGGTGTTCGTTATGAGAACGTATCAAGTTCTCAAGAAGTTGAATCGCGATGGTCGGCGTTTCGTCCTGTGGGGCCACGTCCATTGCTGCCAACGTTGGTGATGGGTCGCGTGTGCGGGTCTGAATGGCTTGTGCCTTTGCCGGCACTCCCAGCTCTATCCGGCCCTTTGTTACTGCCCCTGCAACACACTCCACCAGCTTGCGCCCCAGATTGTAGGCATGATATAAATTACGGTATACGAACATTGTTCACCGTGTTAAGTGGGCGTTTATGTGAGAAAAGCTGTTCTTTGGCAGATGTTACTGTGATCTATGGAATGTGTACGTTTAAGGAATGCAAATTAACATTCAAGTCAATGCGTGTGGATCGTTTGATTCGCGACATTGACTTTGGGAAATATCATTTTTATGATAGAACTGGTATTTATAAGAGGAGTCGGCTTTTAGGTATTCACTCTTTGCAGGGTTCTACTTTGATTTTACGTGAAGAAGACATGCCGATATTTGTTCCATATAAGATTAATACAAAATTGGTATTTTGGGATGAGAGGTCATTTTTCTTCGAACACGAAGTGATAACAGTACATGATGGAAAAATAAGATATTTATTCGTTTCTCGGCAATATGCGATGGGCAAAAACACAAACAATATTAAAGATCTCATAAAAGGTCTCCCAGGATCCGAATGTGAACCAGATTGTCCAATTTACATTTCCCAATGGTTGCAGAGTATGGAAATGTCCAGTAAAAAAATTAACAGGATATAA

Protein sequence:

>DPOGS200934-PA
MNNGRARVPKCARCRNHGLISSLRGHKKSCAYRDCQCPKCGLIKERQRIMAAQGSSFIFVSNEAADGCRPEIPWVTAHQTQTLSVALKRQQAAEDKIALHLASVESGTNLASLPPGRIYGMRVTGPSPSSGPDPDSVVDDHSPIHIDSETSDSLPDCCTATRDNDGNSNANARSCASENEESLSSVSTAGLDMLRKLFPGKKRSVLELVLRRCNHDLLRAVEHCNAIHAQRDKSTASSSGVRYENVSSSQEVESRWSAFRPVGPRPLLPTLVMGRVCGSEWLVPLPALPALSGPLLLPLQHTPPACAPDCRHDINYGIRTLFTVLSGRLCEKSCSLADVTVIYGMCTFKECKLTFKSMRVDRLIRDIDFGKYHFYDRTGIYKRSRLLGIHSLQGSTLILREEDMPIFVPYKINTKLVFWDERSFFFEHEVITVHDGKIRYLFVSRQYAMGKNTNNIKDLIKGLPGSECEPDCPIYISQWLQSMEMSSKKINRI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: