MonarchBase - Protein-coding gene

DPOGS206840
Transcript	DPOGS206840-TA	1572 bp
Protein	DPOGS206840-PA	523 aa
Genomic position	DPSCF300001 - 3187124-3190019
RNAseq coverage	274x (Rank: top 39%)

Annotation
*Heliconius*	HMEL013272	0.0	77.10%
*Bombyx*	BGIBMGA013072-TA	0.0	70.29%
*Drosophila*	CG5706-PA	6e-24	29.44%
EBI UniRef50	UniRef50_F4WQ34	9e-132	48.36%	Leucine-rich repeat-containing protein 47 n=8 Tax=Endopterygota RepID=F4WQ34_ACREC
NCBI RefSeq	XP_394881.3	1e-131	47.25%	PREDICTED: similar to leucine rich repeat containing 47 [Apis mellifera]
NCBI nr blastp	gi\|380013257	7e-140	49.32%	PREDICTED: LOW QUALITY PROTEIN: leucine-rich repeat-containing protein 47-like [Apis florea]
NCBI nr blastx	gi\|328783055	6e-140	49.51%	PREDICTED: leucine-rich repeat-containing protein 47-like [Apis mellifera]

Group
KEGG pathway	bfo:BRAFLDRAFT_124565	4e-25
	K01890 (FARSB, pheT)	maps->	Aminoacyl-tRNA biosynthesis
Orthology group	MCL14638		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS206840-TA
ATGAGTGTCTGGCCAGAAGTAGCGACGGCAAAATCCGAAAACAGGCATGAAATCAAATTGGCGGGTGCTGCTATATCTAAACGCATTTCGGAGGAAGGTTTAGACAAGACAGTCTTTAAATTAACAAATATTAATCTACTAAACATTAGCGATACATGTCTTCCATCTATTCCCGATGAAATCAAATCACTTGTTAACCTCCAATCGCTATTGTTATACGGGAATAAGTTAACAGAATTTAATGAAAACATAACCTCTTTGAAAAAACTTAAGGTGCTCGATTTATCTAGAAATCAAATAACAAGCATTCCGGATAGTTTAAACAACATGAAAGAGCTGTCCAGCATAAATTTTAGTTCAAATAAAATCGATCACATGCCAGCCTTTGGTGATTTTCCTAACTTAATCTCGATAGATCTATCGAACAATAAATTAACGGACTTTTTGAATACCGAACAGGCAAACCTGCCTCATTTAACAGACTTAAAGATTAAGGGAAACGAAATAGAAACACTTCCAGGTTATATAGCAAGTACCATGCCTTCACTAAAAAATTTCGATATTGGGGAAAATAAATTGAAAACACTCCCTGGAGAAATAGCTGGAATGGCAAAGTTGAAAGAATTGAATCTAAAAGGTAACAAGCTTTCTGATAAGCGTCTCATGAAGCTAGTAGACCAGTGTCGCACAAAACAAATTGTCGACTACATTAGAGAGCATTGTCCTACATCAGACAGTAACCAAGCTACAAGCAAGGGTAAAGGGAAGAAAGCCAAGAAACAAGATGAAATCCTACCAGACAATGCATCTGAACTCAGTCACACTCTGAAAATTATGCACCTAGACGATGATACATTGAAAATAAAAATTATAGAACAAGAAGTCTGGAACATTCGCCCCTACATACTCAGCTGTATAGTGTATGGGTTGAACTTTGATGAGGCACTCTTCAAGAAATTCCTGCAAATGCAAAATAAATTACATGACACTGTGTGTGACAAACGGAATGTAGCCACGCTGGCTACGCATGACATGAGTAAAATACCTCCAGGTGACCTTGTATACACAGCCAAAACACCATCGGAATTAAAACTGATTCCTTTAAATCGAACAAAACATTTTACGGGTGAACAATTGTTCCAGCAATTGACAAACGAAGCGGATGCACTGAGGAAGGAAAAGAAAAGAAATGTTTATTCAGGAATACATAAATACCTGTACTTACTTGAAGGCAAACCCAAATATCCATGCTTAGAAGATGCAACAAAGAGAGTGATCAGCTTTGCCCCAATCACCAACTCTGAGGAAACTAAAATGACGGTAGACAGCAAATCAATGTTAGTGGAAGTGACATCGCATTCATCGCTCGGTGCTTGCAAAACTGTCATGGATAAACTCCTACAAGAATGTTTGATGCTTGGCATTGGGGAAGGAGACGGTGACTTCCACACATTGACTGTGCAACAGGTCAAAATTGTGGATCCCGAGGGTAATCTGAAGAGCATCTACCCATCAAGAACAGACTGTGTTTACGATAGCACCATCAAAGTTTACAGGATTCCCAAGAAATAA

Protein sequence:

>DPOGS206840-PA
MSVWPEVATAKSENRHEIKLAGAAISKRISEEGLDKTVFKLTNINLLNISDTCLPSIPDEIKSLVNLQSLLLYGNKLTEFNENITSLKKLKVLDLSRNQITSIPDSLNNMKELSSINFSSNKIDHMPAFGDFPNLISIDLSNNKLTDFLNTEQANLPHLTDLKIKGNEIETLPGYIASTMPSLKNFDIGENKLKTLPGEIAGMAKLKELNLKGNKLSDKRLMKLVDQCRTKQIVDYIREHCPTSDSNQATSKGKGKKAKKQDEILPDNASELSHTLKIMHLDDDTLKIKIIEQEVWNIRPYILSCIVYGLNFDEALFKKFLQMQNKLHDTVCDKRNVATLATHDMSKIPPGDLVYTAKTPSELKLIPLNRTKHFTGEQLFQQLTNEADALRKEKKRNVYSGIHKYLYLLEGKPKYPCLEDATKRVISFAPITNSEETKMTVDSKSMLVEVTSHSSLGACKTVMDKLLQECLMLGIGEGDGDFHTLTVQQVKIVDPEGNLKSIYPSRTDCVYDSTIKVYRIPKK-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: