MonarchBase - Protein-coding gene

DPOGS214553
Transcript	DPOGS214553-TA	1605 bp
Protein	DPOGS214553-PA	534 aa
Genomic position	DPSCF300266 - 82679-89014
RNAseq coverage	1045x (Rank: top 12%)

Annotation
*Heliconius*	HMEL016061	3e-135	73.35%
*Bombyx*	BGIBMGA003285-TA	9e-86	63.97%
*Drosophila*	da-PA	4e-53	84.55%
EBI UniRef50	UniRef50_E0VQ95	5e-78	41.48%	Protein daughterless, putative n=1 Tax=Pediculus humanus corporis RepID=E0VQ95_PEDHC
NCBI RefSeq	XP_973272.2	3e-79	55.33%	PREDICTED: similar to AGAP008814-PA [Tribolium castaneum]
NCBI nr blastp	gi\|189239212	5e-78	55.33%	PREDICTED: similar to AGAP008814-PA [Tribolium castaneum]
NCBI nr blastx	gi\|328786099	4e-84	41.59%	PREDICTED: hypothetical protein LOC410553 [Apis mellifera]

Group
Gene Ontology	GO:0005634	1.4e-22	nucleus
	GO:0006355	1.4e-22	regulation of transcription, DNA-dependent
KEGG pathway
InterPro domain	[428-487] IPR011598	1.4e-22	Helix-loop-helix DNA-binding
	[433-486] IPR001092	1.4e-11	Helix-loop-helix DNA-binding domain
Orthology group	MCL16048		Insect specific

Nucleotide sequence:

>DPOGS214553-TA
ATGGCTCTACTTCCGGTGTACGGCAGCGATGAATTCGGGCACGATTCACCCTCCAGATACGCGTCTCCGAAGGGCGCCGGCGCCAGTGCTGGCTATCAGGAGCCCTACTACGGGGAGTGGGCGGCGGGGTACTACCAGCCGCCGCCGCCCTATCATCATGATCCGTACGCGACGTCGCCGGGCATATCCGGTGCGCCCACGGACGCGAGCGCGGGCGGGGCGGAGCTGCCTCTGCCGCCCATGTCGTCGTTCCGCGCCGCCGCCCCCGTACACTCGCCCAGCGACCCCATGATAGTCGCCAAGCCGCCCATGCAACCGATGTACGCGGGGTCGGCAAACACCCCATCGGGCGGCGGCGAGGGCGGAGGACCAGCGGGCGGGCCGGGCGCCGGAAGCCTGTCCTCGTACTCGTCTCCCTCCACGCCGGTGCACTCGCCCCCGCCGCTACACGCCAGGCTCTACCCCATGAAACACTCCCCGCACCACCACCACCACCATAACGGACAGCAAGCGAGCTGGGTATCCACGGGTGTGTCGTCCCCACCCACGGCGGCGACGCCCCACGCGCCTCTGACGGGAGCTGTACTCCCGAATGGTCACCAGCACGTCGTGTTCCCACCCGTTATGGGCGCGCCGGCTGAACAACGCCAGCTAGACGAGGCGATGGTCTTCCTGAGGGAGCACTCCGACGTCGGGGGCGCTCGTATGGAGGAGCGTCTCGACGACGCGATCAACGTCCTGAGGAACCACGCGGAGGCGCCCGACCTGTACCCTCAGGACCACCACGTGCCACCGCCCGGTGCGGTGAGTCGCGTGGGCGCTCTGTCACACCTCCACGAGCCGCCCGTCAAGATGGAGAGGCATCTCATGGCAAATACTAAGAAACGCAAAGAGCCCCCGGACTCCGGGCTGGACTCGAAGCCTTCCTCGTCAGGCTCTGACGCGCTCACCAAGCCTCCGGGGGGGAAGAGGTCCAGGAGATATGTGAACAGCTGCTCGTCCGCTGATGAAGACGAGCTCGACCCGGACGCCAAGGCGGCGCGCGAGAGAGAGAGGAGGCAGGCCAACAACGTGCGGGAGCGTGCGAGTGAGAGGAGATGCTCTCTCACCTGCGTCGTGCATGTCTGTATGTATCGTGCATGTGTATCACGAGCGCAGTCGCCGGTTTCCTACCATGACCATACAGGTGTCCCCTCTCTCGCGCGCTGCCTGCTGGACGGTTGTTCGTCAGCTGACGAGGACGACATGGACCCGGAGGCGAAGGCGGTCCGCGAGAAGGAGAGGCGGCAGGCCAACAACGCCAGGGAGCGGATACGTATCAGAGACATCAACGAGGCGCTGAAGGAGCTGGGCAGGATGTGTATGACGCACCTGAAGAGTGACAAGCCGCAGACCAAGCTCGGGATCCTCAACATGGCTGTGGAGGTCATTATGACGCTCGAACAGCAAGTCAGAGAACGCAACCTGAACCCTAAGGCGGCGTGTCTGAAGAGGAGAGAGGAGGAGAAGGCGGAGGACGCGCCCAAACTGTTGGCGGCGCCCATACACCATTACCAGCCCGTCACGGGCATGGGAGGCGCCCCACCCCCCGCGCCGCCGCAATAG

Protein sequence:

>DPOGS214553-PA
MALLPVYGSDEFGHDSPSRYASPKGAGASAGYQEPYYGEWAAGYYQPPPPYHHDPYATSPGISGAPTDASAGGAELPLPPMSSFRAAAPVHSPSDPMIVAKPPMQPMYAGSANTPSGGGEGGGPAGGPGAGSLSSYSSPSTPVHSPPPLHARLYPMKHSPHHHHHHNGQQASWVSTGVSSPPTAATPHAPLTGAVLPNGHQHVVFPPVMGAPAEQRQLDEAMVFLREHSDVGGARMEERLDDAINVLRNHAEAPDLYPQDHHVPPPGAVSRVGALSHLHEPPVKMERHLMANTKKRKEPPDSGLDSKPSSSGSDALTKPPGGKRSRRYVNSCSSADEDELDPDAKAARERERRQANNVRERASERRCSLTCVVHVCMYRACVSRAQSPVSYHDHTGVPSLARCLLDGCSSADEDDMDPEAKAVREKERRQANNARERIRIRDINEALKELGRMCMTHLKSDKPQTKLGILNMAVEVIMTLEQQVRERNLNPKAACLKRREEEKAEDAPKLLAAPIHHYQPVTGMGGAPPPAPPQ-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: