MonarchBase - Protein-coding gene

DPOGS202817
Transcript	DPOGS202817-TA	1929 bp
Protein	DPOGS202817-PA	642 aa
Genomic position	DPSCF300018 + 433399-438499
RNAseq coverage	93x (Rank: top 62%)

Annotation
*Heliconius*	HMEL005991	8e-180	71.82%
*Bombyx*	BGIBMGA010518-TA	7e-168	63.98%
*Drosophila*	chm-PA	1e-101	47.23%
EBI UniRef50	UniRef50_Q7PM09	9e-106	51.48%	AGAP009676-PA (Fragment) n=2 Tax=Culicidae RepID=Q7PM09_ANOGA
NCBI RefSeq	XP_318735.4	2e-106	51.48%	AGAP009676-PA [Anopheles gambiae str. PEST]
NCBI nr blastp	gi\|158298552	3e-105	51.48%	AGAP009676-PA [Anopheles gambiae str. PEST]
NCBI nr blastx	gi\|270013354	4e-123	42.30%	hypothetical protein TcasGA2_TC011945 [Tribolium castaneum]

Group
Gene Ontology	GO:0005634	4.5e-37	nucleus
	GO:0006355	4.5e-37	regulation of transcription, DNA-dependent
	GO:0016747	4.5e-37	transferase activity, transferring acyl groups other than amino-acyl groups
	GO:0008270	8.4e-10	zinc ion binding
	GO:0003700	8.4e-10	sequence-specific DNA binding transcription factor activity
KEGG pathway
InterPro domain	[498-629] IPR016181	2.2e-56	Acyl-CoA N-acyltransferase
	[553-629] IPR002717	4.5e-37	MOZ/SAS-like protein
	[357-386] IPR002515	8.4e-10	Zinc finger, C2HC-type
Orthology group	MCL11687		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS202817-TA
ATGACTAATTTGGATGTGAGCAACAGCAGCACTGACAGCAGTTCAGGGTCGACTTCTGATTCTAGCAGTAGTGGGACGTCATCTACCAGCTCAGGCTCAGGATCCAGCAGTTCTGACTCTGAATCATCCACCTCCGACGTGCCGGCCACCGTACCGCCACCTAAATCACCAGTACCTCCACCAGTGGAAGAACCCGCAAAAGAGGAGCCAAAACCTCAAAGGCCAGCAAAAGTCTCTTCATCCAGTGATGATGAAGTACCAAAACCGGAGACACCAAAACCAATGCCACCAAGACGACGATCAATCAAATCTAAAAATGCTGCATCAGTACTCGTCAAAAAACAACCAGCAGTTCCGAGGATCACAACCGGTGCAAAGTCCAAAGCGATATCAAAAACAATACCGAAAGCAAATAAAATAGATGCAAATTCACTAAAAAAGAAAAGCATTTTCTCACCCGACAACAGTTCTGAATCAGAAACTGAGAGCAAGGACAGCAAAACGTCCAAAACCAGCCCAAAGGGTTCACCGATCAACAAAAAGACCAGTATTAAATCCAGCGACGAAAAAGATACGCCTTCACCATTGATGCCGGTGCAAAATGAAGATTCAAATTCCAACTCCAAGGATAGCTCTAAACGTAGAGCAAGCAGGTCAAGTGGGCCTCCGTCTAAAAAAGCTTCGGAGGACAAAAGCGCGTCTTCATGCTCGTCCAGCCAATCATCAGTGGAATCTGTGTCCTCCGAGAGTGATAGCGATCGCACGGAGAAGAAAGAAGATTCCAATACAAGCAAATCCAAACCATCCTCTAATGCGAGTAGTAAGCCGGAGACAACACCGAAGAGTGGTGATTCGAGTGACTCCGTGGGTACAATGACTCGTAAGTTGACTCGATCCTTGTCAGCCAGAGTGTCCCGGATGGCTGCCAAACCCACCAACACTGACACCGACTCAGAGGCTGATGATAAAACTGTGGAACAGAGTAAGGATGATAAACGCCTGGCAAAGGCTCGGGCTGCGATCGGACGCTCGCCGGTCACACCAGCTCCTCCGACCGCACCTTCAGAGAGGAGGTGTCCCGTCAGAGACTGTGACTCCAGCGGACATCTGGGCGGTAAGGTCAACCGTCACTTCACCTGGGACGCTTGTCCCGTGTATCACAACGTGACGGCTGCCTGGTGCGTCGCGGCGGCCGAGGAGCGAGCAGCCGCCGCCGCGACCAGGAGGCGGGCGCTCGCCGCAATGCACCAGAGGCCCAGGGCTATGCCCACCATCGAACAACGGGCGTACCAGCTCAAGGTCAAGGACCTGCGTTCGAAGTGGAAGGGCAGTCAGGAGTTACGGTCGATGGCGAACAACGAGGAGTTGGGTGATGAGAGGGAGCCGGTGCTGGAAGGCTTCGCCCCCGACTACGACCTGCGGCTGTTCAGGGAAGCGCAGGCTCTGGCGGCTGTTAAGATCGAAGAGGAACTTGGAGATATATCCACCGATAAAGGCACCAGATACGTGGTGATGGGCAAGTATCTGATGGAGGTCTGGTATCAGTCGCCGTACCCGGGCGACGCGGCTCGGGTGCCGAGGCTGTTCGTGTGTGAGTTCTGCCTGTCGCATCACAAGTGCGCGGCCGGCGCTAACAGACACAAGGCCAAGTGTGTATGGAGACATCCGCCCGGGGACGAGGTGTACAGGAAGGACAACCTGAGCGTGTGGCAGGTGGACGGCCGAAAACATAAGCAGTACTGCCAGCAGCTCTGTCTGTTGGCGAAGTTCTTCCTGGACCACAAGACGCTGTACTACGACGTAGAGCCCTTCCTCTTCTATGTGATGACCTGCGCTGATGATGAAGGCTGTCACATCGTTGGATATTTCAGTAAGAGCTTGGAGTCCCTCACTCCAAAAGTTCTAGAAGAAGACAAGAAGTATAACTGA

Protein sequence:

>DPOGS202817-PA
MTNLDVSNSSTDSSSGSTSDSSSSGTSSTSSGSGSSSSDSESSTSDVPATVPPPKSPVPPPVEEPAKEEPKPQRPAKVSSSSDDEVPKPETPKPMPPRRRSIKSKNAASVLVKKQPAVPRITTGAKSKAISKTIPKANKIDANSLKKKSIFSPDNSSESETESKDSKTSKTSPKGSPINKKTSIKSSDEKDTPSPLMPVQNEDSNSNSKDSSKRRASRSSGPPSKKASEDKSASSCSSSQSSVESVSSESDSDRTEKKEDSNTSKSKPSSNASSKPETTPKSGDSSDSVGTMTRKLTRSLSARVSRMAAKPTNTDTDSEADDKTVEQSKDDKRLAKARAAIGRSPVTPAPPTAPSERRCPVRDCDSSGHLGGKVNRHFTWDACPVYHNVTAAWCVAAAEERAAAAATRRRALAAMHQRPRAMPTIEQRAYQLKVKDLRSKWKGSQELRSMANNEELGDEREPVLEGFAPDYDLRLFREAQALAAVKIEEELGDISTDKGTRYVVMGKYLMEVWYQSPYPGDAARVPRLFVCEFCLSHHKCAAGANRHKAKCVWRHPPGDEVYRKDNLSVWQVDGRKHKQYCQQLCLLAKFFLDHKTLYYDVEPFLFYVMTCADDEGCHIVGYFSKSLESLTPKVLEEDKKYN-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: