MonarchBase - Protein-coding gene

DPOGS202879
Transcript	DPOGS202879-TA	1104 bp
Protein	DPOGS202879-PA	367 aa
Genomic position	DPSCF300126 - 439709-443388
RNAseq coverage	442x (Rank: top 28%)

Annotation
*Heliconius*	HMEL014580	2e-94	73.01%
*Bombyx*	BGIBMGA004202-TA	1e-143	76.74%
*Drosophila*	Nup44A-PB	4e-109	54.38%
EBI UniRef50	UniRef50_Q96EE3	7e-120	61.63%	Nucleoporin SEH1 n=91 Tax=Opisthokonta RepID=SEH1_HUMAN
NCBI RefSeq	NP_001040420.1	0.0	81.48%	sec13-like protein [Bombyx mori]
NCBI nr blastp	gi\|114051650	9e-180	81.48%	sec13-like protein [Bombyx mori]
NCBI nr blastx	gi\|114051650	2e-178	81.48%	sec13-like protein [Bombyx mori]

Group
Gene Ontology	GO:0005515	3.4e-36	protein binding
KEGG pathway	bmy:Bm1_18455	1e-75
	K01840 (E5.4.2.8, manB)	maps->	Amino sugar and nucleotide sugar metabolism
			Fructose and mannose metabolism
InterPro domain	[16-322] IPR015943	3.4e-36	WD40/YVTN repeat-like-containing domain
	[19-320] IPR011046	4.7e-36	WD40 repeat-like-containing domain
	[283-320] IPR019781	8.1e-09	WD40 repeat, subgroup
	[281-320] IPR001680	2.5e-07	WD40 repeat
Orthology group	MCL13458		Single-copy universal gene

Nucleotide sequence:

>DPOGS202879-TA
ATGAGTGAATTAGGTGGGTGTAATTTATTTGAATCACAAGCAATAGTTGCCGATCACAAAGACTTAATACATGATGTGGCTTACGACTTCTATGGGGAGAGAATGGCGACATGCTCTAGCGACCAGTATGTAAAGGTGTGGGATTCTGATGGGCAAGGTGGTTGGAAACTGACTGCAAGCTGGAAAGCACATCACGGCTCAGTGTGGAAAGTCACATGGGCACATCCTGAGTTTGGACAAGTTCTGGCTACTTGTTCCTTTGATAGGACAGCTGCTATATGGGAAGAAGTTGGTGACACAGCAGCATCGGGTACAGAGAAAGGGCTCAGGACTTGGGTGAAGAGATCAAATCTAGTGGATTCCAGGACTTCGGTCACAGATGTGAAGTTTGGGCCCAAGCATCTAGGGTTACTATTGGTGACATGTTCTGCTGATGGTATTATAAGGATATATGAAGCTCCCGATGTAATGAATTTAGCACAATGGACCTTGCAACATGAAATACCAACTAAGGTCTCTATCAGTTGTCTGTCGTGGAACCCATCATTATCAAGAAGTAGCAGTAACCCACCGATGTTGGCGGTGGGCAGCGACGAGCCCAGTGTTGCTGATAAAGCCAGTTCAGAACGAGTCTTCATATATGAGTACAGTGAATCCTCAAGGCGTTGGACCAGGACGGAGTGTTTGTCGTCTGTGGTGGAACCGGTCAATGACCTCGCCTTCGCGCCGAACCTCGGCCGCTCCTTCCACCTGCTCGCTGTGGCCACTAAAGACGTGAGGATCATCAAAATTGAACCGTTGCCTGAGTCTTCCGGTTCCGCTAACGGCAGCGTCCGCTTCAAGTCGGAAGTGTTGGCCGCCTTCGAGGAGCATTCGTCTTGTGTGTGGCGCGTCGCCTGGAACGTTACCGGGACCATGCTGGCGTCTTCCGGGGACGACTGCTGTATCAGGCTATGGAAGATGCAATACATGAACCAGTGGAAAGGTGTCGGTGTGTTCAAGAGTGAGGCGACTGGGGGAGAAGCGACCGCGCCGGCGCGTGCTCACACCACCTATACAAGACTGGCGCCCATGGCCAACCCAGCACACATGCCCTACCACTGA

Protein sequence:

>DPOGS202879-PA
MSELGGCNLFESQAIVADHKDLIHDVAYDFYGERMATCSSDQYVKVWDSDGQGGWKLTASWKAHHGSVWKVTWAHPEFGQVLATCSFDRTAAIWEEVGDTAASGTEKGLRTWVKRSNLVDSRTSVTDVKFGPKHLGLLLVTCSADGIIRIYEAPDVMNLAQWTLQHEIPTKVSISCLSWNPSLSRSSSNPPMLAVGSDEPSVADKASSERVFIYEYSESSRRWTRTECLSSVVEPVNDLAFAPNLGRSFHLLAVATKDVRIIKIEPLPESSGSANGSVRFKSEVLAAFEEHSSCVWRVAWNVTGTMLASSGDDCCIRLWKMQYMNQWKGVGVFKSEATGGEATAPARAHTTYTRLAPMANPAHMPYH-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: