MonarchBase - Protein-coding gene

DPOGS201997
Transcript	DPOGS201997-TA	1230 bp
Protein	DPOGS201997-PA	409 aa
Genomic position	DPSCF300060 + 224427-226411
RNAseq coverage	98x (Rank: top 61%)

Annotation
*Heliconius*	HMEL002631	0.0	77.75%
*Bombyx*	BGIBMGA010405-TA	1e-135	78.35%
*Drosophila*	fy-PA	2e-42	28.97%
EBI UniRef50	UniRef50_E2C641	3e-73	33.98%	Protein fuzzy-like protein n=8 Tax=Formicidae RepID=E2C641_HARSA
NCBI RefSeq	XP_001604141.1	6e-84	38.22%	PREDICTED: similar to conserved hypothetical protein [Nasonia vitripennis]
NCBI nr blastp	gi\|156550598	1e-82	38.22%	PREDICTED: protein fuzzy homolog [Nasonia vitripennis]
NCBI nr blastx	gi\|156550598	1e-82	38.22%	PREDICTED: protein fuzzy homolog [Nasonia vitripennis]

Group
KEGG pathway	bfo:BRAFLDRAFT_119484	7e-34
	K12617 (PATL1, PAT1)	maps->	RNA degradation
Orthology group	MCL13334		Single-copy universal gene

Nucleotide sequence:

>DPOGS201997-TA
ATGTCTGTAATAGTGGTTGCTGTTGCCTCAGAGAGTGGTGTTCCAATATTTTCAAGAAAACGCGGTAGTAATGAAAATATTCAATTTTCTACTATAGCGTCACTTCATGGGATAAATATGTTCACAAAATGTCACAACCTCTCTTTAATTAATACACACCTTGATAATGGAACAATAATTTGGAAGGAGTATTGTAAAAGTATTACTTTAATAGGAATAGCTACGGGTGGACTACAATGTGACCTTGAAAATCTATTGGCCTGTATACATGATGTAATGATATTTTGTATTGGCAAAAAAGAGTTGGAAAATTTAAAAAATGTTGACCAAATCAAAAGAGACTTGAGGCAGTGTTATCCAATTCTAGATTACTTGTTGGAATCTCTAGATCCAAATTCATTGCCACAGTCCACAATCATCCTAGATTATATTCAAAGTCTTCTTTGTCCTCAGGCTCAACAGTTGCAGGAAGTTTTGGACAACTATGCGCAGACTGTAACAGGAAGGTGGGCTTGTCTTAGCATTCATGGTCATTTGGTTGCCACAAGTTCTGACTTCTCTGAGTTAGATGCAAGAGAAGCCAAATTACTCTTATTATTAGCAGCGGCTCAAGATGGAGCCCCATTAAGAGATACCTTGGTGTATTTGCCACAAATGAGTCCAAATGTAGCATTCCGGGCTGTAACATGCAAACTTTTAGCAGATGTCTATGTGCTAGTTATCTGTGGAGCGACTCCTCCGCTGTCAGAAATAGATGAAATAGTCCTTCGATGTTGGGAAGGGTATGCACAAACTATAAAGGAGGCAAAACTGACCTATCCCAGGAACTTTCCTACCAGTTTCACATTTGATCCAGCTTTGCTAGGTGTATTAGTGATAAACGTTACTAAGAGACGCTGCGTATTTTCACGTCATTTACATGGATCTAATCAGAAGAGCCGAAGCATGTCAAATGCCCACAGGATTGATATACTAAGAACATTTTTTGTAACATCGGTAAAAGATTTAGTACCAGAATTCAGAAGTAATGAGAGTGAAGAAACAGATGTCTGCCAAAGTATTTTAAGCGAAACATTCTGGTGTTCTGAATACCACAAATGTCATATGCAGAGGTCTGGAAATATATTATGTTGCGGGCTTTATTCCCCGACTGTTCCTACACACACTATGAGGTTGATGACAAGTAATTTGCTACAAGATTTGCTCTCAAACAAAGAAATCTATTGGTAA

Protein sequence:

>DPOGS201997-PA
MSVIVVAVASESGVPIFSRKRGSNENIQFSTIASLHGINMFTKCHNLSLINTHLDNGTIIWKEYCKSITLIGIATGGLQCDLENLLACIHDVMIFCIGKKELENLKNVDQIKRDLRQCYPILDYLLESLDPNSLPQSTIILDYIQSLLCPQAQQLQEVLDNYAQTVTGRWACLSIHGHLVATSSDFSELDAREAKLLLLLAAAQDGAPLRDTLVYLPQMSPNVAFRAVTCKLLADVYVLVICGATPPLSEIDEIVLRCWEGYAQTIKEAKLTYPRNFPTSFTFDPALLGVLVINVTKRRCVFSRHLHGSNQKSRSMSNAHRIDILRTFFVTSVKDLVPEFRSNESEETDVCQSILSETFWCSEYHKCHMQRSGNILCCGLYSPTVPTHTMRLMTSNLLQDLLSNKEIYW-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: