MonarchBase - Protein-coding gene

DPOGS201100
Transcript	DPOGS201100-TA	1773 bp
Protein	DPOGS201100-PA	590 aa
Genomic position	DPSCF300137 - 480570-487025
RNAseq coverage	303x (Rank: top 37%)

Annotation
*Heliconius*	HMEL022621	3e-78	60.00%
*Bombyx*	BGIBMGA013649-TA	2e-149	54.42%
*Drosophila*	stmA-PC	5e-150	51.49%
EBI UniRef50	UniRef50_Q8IGJ0	7e-148	51.49%	Protein EFR3 homolog cmp44E n=42 Tax=Coelomata RepID=EFR3_DROME
NCBI RefSeq	XP_001120727.1	6e-173	55.14%	PREDICTED: similar to conserved membrane protein at 44E CG8739-PA, isoform A [Apis mellifera]
NCBI nr blastp	gi\|350420191	4e-173	56.24%	PREDICTED: protein EFR3 homolog cmp44E-like [Bombus impatiens]
NCBI nr blastx	gi\|350420191	9e-171	56.24%	PREDICTED: protein EFR3 homolog cmp44E-like [Bombus impatiens]

Group
KEGG pathway	ame:412176	7e-08
	K03125 (TFIID1, KAT4)	maps->	Basal transcription factors
Orthology group	MCL11441		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS201100-TA
ATGTGTCACAGTAACCACAACGACCAGGCGGTCAGAGACAACATCCGGCTCGCTGGGATACAGGGGCTCCAGGGCGTGATAAGGAAGACAGTGTCCGACGACCTCGTGGAGAACATCTGGGAGGCCCAGCACATGGACAAGATCGTACCCTCGCTGCTCTATAACATGCAGACAGCCGAGAAATACGAAACGGTCACCTGTATGGAGACGGACGCGAGGGACGGCTTGGAGGACGACCCGCCACGCCTCGCCGAGGCCTGTCTCAGGGAGCTGGTGGGCCGCGCCTCCTTCGGACACATACGGAGCGTGCTCAGACCCGTGCTCACTCATTTCGATCGTCACGAACTGTGGGTGCCGAACGACTTCGCCGTCCACACATTCAAAATCATCATGTTCTCAATTCAAGCCCAGTACTCGTATAGTGCTGTAGAGGCTCTGATGCAGCACTTGGACGCGGGGACCTGCGGAGACCCGGCCGCCAGGACCCGGGTCAGAGCCGCGAGGGCCGCGGTCCTTAGTAACATAGTCGCCATAGCAGCTGGAGATAGTGTTGGTCCATCAGTTTTGGAGATCATCAACAACCTCCTGACCAACCTGAGAACGTCTGTGGCGAGAGATTCAGAGAAGGAGTCGGACGAGAGGTTGTACCAGGAGGCTCTCATCAACGCGCTGGGGGAGTTCGCGGACCACCTGCCCGACTACCAGAAGATAGACATCATGATGTTCATAGTGAGCAAGATACCCACCACGCGCGGCAAGCCCGCCCGCGCCGACGTCATGCTGCAGAGCATCCTGCTCAAGTCCCTGCTCAAGGTGGGCACGACGTACAAGACGAGCGAGCTCAGCAAGGCCTTCCCCGCCGCCTTCCTGGAGGCGCTGCTGCGGCTGTCCGCGGCCGCCGGAGACTCGCCGCCGCCCGTCCTCTTGCAGCGGATACTGCACACGCTGCTCGACAGGAGGGGCAACGCGCACCTGCTCGCCGAGCCCACGGTGGAGTACGAGGCGCTGGGCCTGTCGGTGGGCAAGTGCTCGCGGCCCGACCTCATATTCATCAGCAAACACGGCTACGCCATATTTAACTCGCTGTACGAAGGGTTACAGCTGGAGTCCAACAACCTGGAGAACATCAGCGCCATCTACACCACGCTGGCGCTGCTGTTTGTGGAGCTGGCCTCGGACGAGACGGTGTGCGACATGCTGCAGCTCGTGCTGTCTATCCAGCAGTCCGCGCTGTCCAACCCGGTGCTGTCCGTGTGGCAGCAATGTTCGCTGCACGTCGTGTGCGCGTCCCTGGCGGCGCTGGTGTGTCACGTGATGATGCTGCCCGCCCTGCAGCACTACATCACTCAGATCGTCGACGCTCGCCGCGAGGAGGCGCCGCATCTGTTACCGCCGCTGAAGCAATACGACCAGCTGCCTCCCTCCAAGATGCCCAGCAAACTGCCCTACCTCATGATAGACCAGATGGCGTTGTCGGAGTGTTTGTCATCGTGCGGGGTGGAGGGTAGTCGACTGTCGAGTGGTGCTCGGTACGGCCCAGCTGTACACAGGCACTCCTGGGTCGAAGCTGGAGCTGCCCAGGGTAGAGACAGCTTGGCAGACATCTCAGCCGGGCCCACCACGGATCTGGACAGCGCTAACAGCTCTCCAGGTGTACAGAGGAGAATTCAGTACGACGATCTGGACGAGGAGTACAGACAGTTCATAGAGAAATATAACCACAACCACCGACCCACCGCACACGACTTCGGAACATACGTAACATACTACTAA

Protein sequence:

>DPOGS201100-PA
MCHSNHNDQAVRDNIRLAGIQGLQGVIRKTVSDDLVENIWEAQHMDKIVPSLLYNMQTAEKYETVTCMETDARDGLEDDPPRLAEACLRELVGRASFGHIRSVLRPVLTHFDRHELWVPNDFAVHTFKIIMFSIQAQYSYSAVEALMQHLDAGTCGDPAARTRVRAARAAVLSNIVAIAAGDSVGPSVLEIINNLLTNLRTSVARDSEKESDERLYQEALINALGEFADHLPDYQKIDIMMFIVSKIPTTRGKPARADVMLQSILLKSLLKVGTTYKTSELSKAFPAAFLEALLRLSAAAGDSPPPVLLQRILHTLLDRRGNAHLLAEPTVEYEALGLSVGKCSRPDLIFISKHGYAIFNSLYEGLQLESNNLENISAIYTTLALLFVELASDETVCDMLQLVLSIQQSALSNPVLSVWQQCSLHVVCASLAALVCHVMMLPALQHYITQIVDARREEAPHLLPPLKQYDQLPPSKMPSKLPYLMIDQMALSECLSSCGVEGSRLSSGARYGPAVHRHSWVEAGAAQGRDSLADISAGPTTDLDSANSSPGVQRRIQYDDLDEEYRQFIEKYNHNHRPTAHDFGTYVTYY-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: