MonarchBase - Protein-coding gene

DPOGS210334
Transcript	DPOGS210334-TA	1710 bp
Protein	DPOGS210334-PA	569 aa
Genomic position	DPSCF300025 - 468998-470932
RNAseq coverage	171x (Rank: top 50%)

Annotation
*Heliconius*	HMEL013832	0.0	65.64%
*Bombyx*	BGIBMGA011975-TA	2e-170	56.07%
*Drosophila*	CG9300-PA	2e-33	27.38%
EBI UniRef50	UniRef50_D6WGP4	1e-70	30.17%	Putative uncharacterized protein n=2 Tax=Tribolium castaneum RepID=D6WGP4_TRICA
NCBI RefSeq	XP_001608202.1	7e-73	29.36%	PREDICTED: similar to conserved hypothetical protein [Nasonia vitripennis]
NCBI nr blastp	gi\|156538006	1e-71	29.36%	PREDICTED: nucleolar protein 11-like [Nasonia vitripennis]
NCBI nr blastx	gi\|156538006	1e-73	28.69%	PREDICTED: nucleolar protein 11-like [Nasonia vitripennis]

Group
KEGG pathway
Orthology group	MCL14698		Insect specific

Nucleotide sequence:

>DPOGS210334-TA
ATGGCAAAATTGCACAACTATTACGTTTTGTGTCCATTGATCGATCAAAACAGTTTTCTAGGAGTATCACAAGATAAAGATGATGAAAATGTTATCGTTACACTAGGCAGAAACGTTGTTAATAAATACAGGCTTTCAGATCAAAAACAAATTGGAGGCTGGACTTCAAAGGAACATCTCACGTCTTATGTTATTTATGATAAGGAGCAAGAAGGATATGTCGGAGTTTTTAATAAAAACACTATAAAGATATGGAAAGAAGATTCAGACAATTTAGACAAAACAAAAAAACACAAATTTTCAGTCAACATCTTAAAGCTTCAACAGAAAGGTGATAATACAATAATTATATTTGAAAATGGTTATTGTGCGTCCCTTTCCTATGCATTGGAAAATAGAAAAACATATGAAGGGAAACCTCTTATAAAAGATGCCGAAACTGTTGTGGATTCAGCTTGTTTTACATTAGATAAAACAGATTATATATGCTACGTCATCAAGAATACTAGCAACAATTATGAAATTCTCACGAGTCCACTAAGAGAAGAACTGGGTGACATGGACAAGTCCAAAATATGTAAAGTTAAAGTTACGAGGCCCCATGACGTGTATGTTGTTGGGAAACTTATTAATATAGATGAGAGCCCATCCGTTTACATTTTGTGGAGTGACTCTAAGATGTCAGTATACAATCTTGTGAGTAAATCATGGACAAACATTGGCACTGTACCCTGGATATCAACACTAACAAGCGTCTCTCTGGCTTGGATGGGGAAGGATCATCTCATTCTCTTCGGAAGCAACACCGATCAAGATGGAGCAATCATTGTGGCTTACAATGTCATATTGGGTGTGGGATCTTGCAGGTATCCCATGAAAATGTATGCTGAAAATGCTCACTTATATTGCTTCAATGGACGCATAATTCTGGAAGCATCCAATCACATCGGAATGTTGCCTTACATCCTTGAAACAAACAGAAACTTGTCAAGCCTTTTGGGTTCTCACGACACAACTGAAGACAGCTGCATTGAAGTAGCTGAGTGGGGCATAAAATCAAATCCTCTGTTTGCTGAGAGAGAAGAAATAAAAGACTTACTCAAAGTCGGCGTCACGGAACGTAACATGTGCTCACAAGTTATACTGCCTTTATTAGAAGAGAAGGATTTCAGACATGTGTACAATGTTGTTAGAGAATTCAAGGATGTTCCTGAATCAGTCCTAGTTTCAATACTTAACTATACAATTGAAATTTTAAATGCAAAGGAGATAGATGTTAATGATCATGAAGAATTCATGAAATTTTGTGATTGTGAAATTTTAGATTACTTGTTTGAAATAACCTTCAGTGACGCTCTGTTAATACCTTACTTGAGAAATGGACTTACACTAGATAACGCCTTATTTCTACTTTCATATATATCGTACCTGCTCACGGATTCTCATAAAGAATACAGTGATGTCTATGAGAGCAAGTTATTTGATTGGTGCACTTTGCTCATAGATGCTTTTTATCAACAGTATCTATTGACTAAAGATGACAAAGTTGTACAGGTTTTGAACAATGTGCAACGAGTGGTAGTCAATCTCATCGATCAACTCATGACAGTTGATAATGTTTTACCGATGCTACATAAAATTCTATCAGGAAAACCTCAAGTTGATCATGAAGAATCCTTGTCGTATACAATTGAGCTAATGGATATATAA

Protein sequence:

>DPOGS210334-PA
MAKLHNYYVLCPLIDQNSFLGVSQDKDDENVIVTLGRNVVNKYRLSDQKQIGGWTSKEHLTSYVIYDKEQEGYVGVFNKNTIKIWKEDSDNLDKTKKHKFSVNILKLQQKGDNTIIIFENGYCASLSYALENRKTYEGKPLIKDAETVVDSACFTLDKTDYICYVIKNTSNNYEILTSPLREELGDMDKSKICKVKVTRPHDVYVVGKLINIDESPSVYILWSDSKMSVYNLVSKSWTNIGTVPWISTLTSVSLAWMGKDHLILFGSNTDQDGAIIVAYNVILGVGSCRYPMKMYAENAHLYCFNGRIILEASNHIGMLPYILETNRNLSSLLGSHDTTEDSCIEVAEWGIKSNPLFAEREEIKDLLKVGVTERNMCSQVILPLLEEKDFRHVYNVVREFKDVPESVLVSILNYTIEILNAKEIDVNDHEEFMKFCDCEILDYLFEITFSDALLIPYLRNGLTLDNALFLLSYISYLLTDSHKEYSDVYESKLFDWCTLLIDAFYQQYLLTKDDKVVQVLNNVQRVVVNLIDQLMTVDNVLPMLHKILSGKPQVDHEESLSYTIELMDI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: