MonarchBase - Protein-coding gene

DPOGS214954
Transcript	DPOGS214954-TA	1743 bp
Protein	DPOGS214954-PA	580 aa
Genomic position	DPSCF300280 + 126523-129766
RNAseq coverage	411x (Rank: top 30%)

Annotation
*Heliconius*	HMEL015595	2e-126	73.33%
*Bombyx*	BGIBMGA004851-TA	1e-168	63.79%
*Drosophila*	H-PA	1e-27	49.38%
EBI UniRef50	UniRef50_Q16Y99	2e-38	34.16%	Putative uncharacterized protein n=2 Tax=Culicinae RepID=Q16Y99_AEDAE
NCBI RefSeq	XP_001653350.1	3e-39	34.16%	hypothetical protein AaeL_AAEL008617 [Aedes aegypti]
NCBI nr blastp	gi\|157119308	6e-38	34.16%	hypothetical protein AaeL_AAEL008617 [Aedes aegypti]
NCBI nr blastx	gi\|157119308	1e-46	31.98%	hypothetical protein AaeL_AAEL008617 [Aedes aegypti]

Group
KEGG pathway	dme:Dmel_CG5460	9e-26
	K06064 (HAIRLESS)	maps->	Notch signaling pathway
Orthology group	MCL20352		Insect specific

Nucleotide sequence:

>DPOGS214954-TA
ATGACAGAAGAAGTAGACAGAAGACATGGTGTGAATGGGAACAGCAGTAGTAAGAGTGCTCATGAGGATCCTCCTGTGCAGAGTCCAGCTCCCGCTACGACGGGTGGGAGGCTCAAGTTTTTTAAAGATGGAAAGTTTATATTGGAACTGGTCCGAGGCAGCGCGCGCGAGGGTGAGCGCGCTGGGTGGGTGTCGGTGCCTCGTAAGACGTTCTGGCCGCCGGCCGCCGCCCCGCCGACGCCTCCTCACGCGGCGCCGCCCTGCGCCTCGTTGTCGCTGTCAGACGACAATTCCTCGCTGCACTCCTCGCCCTGCACTTCGCACCGCGACCACTGCTGGAAGCAGCCGACGCCGCGCCGCAACCTGTCCAAAGAGTTAGCCATGTACTACTGCAGGCCCGCTACCCTGCACACCGCTCATATCGCCACCGCCGCACGCCTCAAGCGAAGGAGACCCTTCGACACCGGCTACCATGAGATCCTCACCAACGGAGCGCTCCGGAAGACCTGTGTGAACGGCTCCTGTGACAAAAAACGAAACGGTGACGTCGGCTCGCCCGAGAACAAGCATTGTAAAGGAGATGACGTCGTCGACGGGCCGACGGAGGCCAAGACGAAGACGGACGAGGACAGGTGGACGGACTTCGACAGGGAGAAATACTTTCATATGAAACTCAAAAAACCATATCAGTATCATAAGTTAAGGGTGTACAAAAAGACGAGGCCGGCGTTACGACGCAAAGAGTTGGCCCGGGTCTTAGAAAGACTCCGAGAGAAAATTCTGTCGTTGCCCGTGCCCGTGAACGCCAAACTGGCAAACTGCAGGCAGGAGCACATGATGGTATCTCCGAGGAAGCGGATCCTGCGCGAGATGGAGCGGGTCAGTCTCGAAGACCAGGCGACCAAGCGGCGAGCGAAGACGGTCCCCGCTCTTAGCACGGCCTCCTACCCGCCCTCCCCCGGCCCCAGTCATACACAGCACCGCGGATCAGACGGGCCAGCGCGACTGTCCAACGGCACGGCTCCCAGGAAGGAGACCGCGGTGTCCAAGAACGTCAGCAGCTACAGCATACACTCGTTGCTCAGCATGCCTGATGAGAGTCCTACGCGCCGCTCGCCCGAGGCCAAGCGTTCACCGCATTCCTACCCACCGTCATTGAAGACGGAGTCTCCTTCGAGCGTCAACTCGCCCGATTTGAGCCCCAGTCCAGACAGCTACCGGTACAGGTACTCGACGCTCTCGCTGGGGTCCCCGGGTCGCGGGGCGGCGCGTGATTCGCCCACGCCGCCACAGCCCACCAACCCGCCTTCCTTCCGTGCATATGCACCGCCCACGTCCCCGTACAGTGGTCGTCCGGGGCCCGCGTGGCCTGCTCCGCCGCCGCCGGGGCCCTTCAGACGAGATGAGTGGGCTGGCCCTGGGGCTGTGAGCGGCATGAGCAGCGCACAGTATGTGTTCGGGTATGGATACGCTCCACACGTGTACCGCGCCGCGCCTGCGCCCCCTCTGTGGATGCATTACGCGTTGGCCCCGGGTGCTCCTCCCGGGCCGTGGGCGCCTCTCGCTCATCCCCTGCTCACAGACCACATACCCAAGGAGGAGCCCACGTCCGGTCAATTTGCCGTTAAACTTATCAAAACATTGAAGCCGACGTCAATTGTGACGTGTGACGTCACGCGTCCGTCTCGGCGGGTCGTCTACGAGTCGAGCCCGTCACGCGACACGTCACTGGCGGGAGGGTAG

Protein sequence:

>DPOGS214954-PA
MTEEVDRRHGVNGNSSSKSAHEDPPVQSPAPATTGGRLKFFKDGKFILELVRGSAREGERAGWVSVPRKTFWPPAAAPPTPPHAAPPCASLSLSDDNSSLHSSPCTSHRDHCWKQPTPRRNLSKELAMYYCRPATLHTAHIATAARLKRRRPFDTGYHEILTNGALRKTCVNGSCDKKRNGDVGSPENKHCKGDDVVDGPTEAKTKTDEDRWTDFDREKYFHMKLKKPYQYHKLRVYKKTRPALRRKELARVLERLREKILSLPVPVNAKLANCRQEHMMVSPRKRILREMERVSLEDQATKRRAKTVPALSTASYPPSPGPSHTQHRGSDGPARLSNGTAPRKETAVSKNVSSYSIHSLLSMPDESPTRRSPEAKRSPHSYPPSLKTESPSSVNSPDLSPSPDSYRYRYSTLSLGSPGRGAARDSPTPPQPTNPPSFRAYAPPTSPYSGRPGPAWPAPPPPGPFRRDEWAGPGAVSGMSSAQYVFGYGYAPHVYRAAPAPPLWMHYALAPGAPPGPWAPLAHPLLTDHIPKEEPTSGQFAVKLIKTLKPTSIVTCDVTRPSRRVVYESSPSRDTSLAGG-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: