MonarchBase - Protein-coding gene

DPOGS201130
Transcript	DPOGS201130-TA	1725 bp
Protein	DPOGS201130-PA	574 aa
Genomic position	DPSCF300065 - 645033-654833
RNAseq coverage	3210x (Rank: top 4%)

Annotation
*Heliconius*	HMEL014977	3e-78	64.78%
*Bombyx*	BGIBMGA003934-TA	2e-64	56.15%
*Drosophila*	CG6972-PA	1e-70	46.74%
EBI UniRef50	UniRef50_E2ALF6	2e-124	44.73%	UPF0326 protein FAM152B n=12 Tax=Neoptera RepID=E2ALF6_CAMFO
NCBI RefSeq	XP_393278.3	5e-127	46.73%	PREDICTED: similar to CG6972-PA [Apis mellifera]
NCBI nr blastp	gi\|307175901	8e-124	44.73%	UPF0326 protein FAM152B [Camponotus floridanus]
NCBI nr blastx	gi\|157137449	1e-129	44.69%	hypothetical protein AaeL_AAEL013800 [Aedes aegypti]

Group
KEGG pathway	tbr:Tb09.160.2050	5e-22
	K01227 (E3.2.1.96)	maps->	Other glycan degradation
InterPro domain	[8-135] IPR008580	4.9e-34	Domain of unknown function DUF862, eukaryotic
Orthology group	MCL11626		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS201130-TA
ATGTCTACTGAGGAGGGGGAGCCTGTGGACCTCTACATCTATGACCTCACAAAGGGTCTCGCTTCATTACTGTCACCAACTATACTTGGGCGCCAGGTGGAGGGCGTCTGGCACACGGCGGTGGTGGTGTTCGGCCGGGAGTACTTCTACGGAGGCGGCGGCGTCACCAGTTGTGCGCCGGGCAGCACCCAGCTTGGGGCTCCGTACCAGGTGGAGCGCCTCGGGACCACGTACGTGCCCTTCCCCGTGTTCCAGGAGTACATCCAGGGGCTCGCTACTAGCTCCTACACAGGCCAGGAGTACCGTCTGCTGGAGCACAACTGCAACCACTTCAGCGACGAGGTGGCTCAGTTCGTGTGCGGAGCTCGCGTCCCCAAGCACATCGTTTCTCAGGCCGAGCGGGACCTGCCCCCGCCGCTGAGGGTGGCGCTGCAAGCCGCCCTCGACCACCTCGTGCCGGACGGAGCGCCCGTCTACGGCGGAGTGAGACACAGTCGCCGGGACAGCCCCGACTACCTCACGCTCAACGACCAGATCGAGGAGGCCAGAGTGGCGTCCCAGGAGCTGGACGCGAGGCGGAGCACGCTCGCGGAAAAGTTGGCGAGGAAGGAGAGGCGGAAGGAAAAGAAGAGGAGAAAACAGATGGGAGGAGATCAGTCAGGGGAAGAGGGGGGCGGAGTCGAACTTGGACCCGAGGACACGGAGAGGGGAGGCGAGATGTCTGAAGCGGTGGAGGTTTTGGAGGCTCGGCCCGGACCCAGCACGCCGCCCCGCGAGGATGATCGCCCGCGGCCCAAAGACCCTCCCATACTGTTCAAGGACATAGACGGCGTGGCGGAGTACGAGGCGCTCGTGAAAGCTCTGGAGGGAGTCGACCTCAACGAGGAGGAGCGTCGCAGCTTGGACGAGTTACAGCAATACCTGGTGGCCGGGGAGGGCTCCTGGGTGCTCGGGGATGACTTCCTCGCCTTCGTCGGTCGCGTGCTGTCAGACTCTTGCTTGGCGTCGGCGGCGCGCGTGTCGATGCTCCGCTGCCTGTGCTGCGCCGCGCTTCGTGAGGACGTGTCGCTCGTGCTGCATCAGGACCGTCGCCACCACGCGCTGCTCTCATACGCGTACAACATCGACCGCCTCCCGGTGGACGAGCAGCTGGCGCTCCTTCTGTTCATGGTGAACCTGTTCTCGGGTCCGTCGTCGTCGGAGTGGTTGCTGTACATCAGCGAGTGGTCGGCGGGCGGGCCTCCTCTGTCCAACATCCGCGTCACCACCAAGGTGTGCGTGCACGGCGTGCTGGCCCCCGAGCCGGCGCTGAGAGACGCGGGCACCGCGCTGCTGTACAACGTAGCCACCAAGGAGGTAAAGACTGTGGTGTTCGACGAGGTGTGTGTAGAGCTGTGCATGGCGGCGCTCCAGCTGTGCTCGTCTGCTCCGGCCGAGGAGCTCCTGTGGCGCGCGCTGGCCTCTCTCGCCCGCCTCGCGGAACACTCACACGACGTGCCGCAACTCGTCGCACTCGTCGGACCTGACCCCAGCGCCTTCAGGTACACACACATCAACACACACAAACTCCTTCACCACTTGTCTACTCGACTGTACATGACGCGGCGCTCTGTGCAGGGGGACCAGCCCTCGAGTGGACGAGCAGGTGGACCTCATCACACAGAGAGTAGCGGCGAGGGGGTAGAAGGGGAGAGGGAGGAGATGGGAGGCGACCTGTACATATAG

Protein sequence:

>DPOGS201130-PA
MSTEEGEPVDLYIYDLTKGLASLLSPTILGRQVEGVWHTAVVVFGREYFYGGGGVTSCAPGSTQLGAPYQVERLGTTYVPFPVFQEYIQGLATSSYTGQEYRLLEHNCNHFSDEVAQFVCGARVPKHIVSQAERDLPPPLRVALQAALDHLVPDGAPVYGGVRHSRRDSPDYLTLNDQIEEARVASQELDARRSTLAEKLARKERRKEKKRRKQMGGDQSGEEGGGVELGPEDTERGGEMSEAVEVLEARPGPSTPPREDDRPRPKDPPILFKDIDGVAEYEALVKALEGVDLNEEERRSLDELQQYLVAGEGSWVLGDDFLAFVGRVLSDSCLASAARVSMLRCLCCAALREDVSLVLHQDRRHHALLSYAYNIDRLPVDEQLALLLFMVNLFSGPSSSEWLLYISEWSAGGPPLSNIRVTTKVCVHGVLAPEPALRDAGTALLYNVATKEVKTVVFDEVCVELCMAALQLCSSAPAEELLWRALASLARLAEHSHDVPQLVALVGPDPSAFRYTHINTHKLLHHLSTRLYMTRRSVQGDQPSSGRAGGPHHTESSGEGVEGEREEMGGDLYI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: