MonarchBase - Protein-coding gene

DPOGS210851
Transcript	DPOGS210851-TA	1980 bp
Protein	DPOGS210851-PA	659 aa
Genomic position	DPSCF300027 + 519496-523732
RNAseq coverage	290x (Rank: top 38%)

Annotation
*Heliconius*	HMEL008520	2e-123	59.15%
*Bombyx*	BGIBMGA006979-TA	5e-172	50.77%
*Drosophila*	CG4751-PA	3e-06	27.07%
EBI UniRef50	UniRef50_D6X384	8e-37	34.40%	Putative uncharacterized protein n=1 Tax=Tribolium castaneum RepID=D6X384_TRICA
NCBI RefSeq	XP_972498.1	2e-37	34.40%	PREDICTED: similar to myb-like, SWIRM and MPN domains 1 [Tribolium castaneum]
NCBI nr blastp	gi\|91090584	3e-36	34.40%	PREDICTED: similar to myb-like, SWIRM and MPN domains 1 [Tribolium castaneum]
NCBI nr blastx	gi\|91090584	2e-33	34.40%	PREDICTED: similar to myb-like, SWIRM and MPN domains 1 [Tribolium castaneum]

Group
Gene Ontology	GO:0005515	8.8e-06	protein binding
KEGG pathway
InterPro domain	[432-527] IPR000555	8.8e-06	Mov34/MPN/PAD-1
Orthology group	MCL25294		Lepidoptera specific

Nucleotide sequence:

>DPOGS210851-TA
ATGGCCGACGACGACGAGATTGACATTCTTGGTGATTTTTCATTTAATTCTTGTTTTGCCCAAAATAATCAGGGAATTCCTTCTTGCTCCAACAGAGAAGACACCGTGCACCCTCAATGGCTTCTGGATTCCCCTCCAACAAATTGGTATGATACACAGAATAAAGATAAAAGTTATAGGCCCAAAGATGGACCATCAAGGAAGCTATCAGGAACAACAGCAAATTATCAGCATACAACGGTCCATACATCCTGGACTCAGAAGGAAAGAGATTTGCTGGCACAAGAAATGGCCAGGTATGGGAGAAATGTGAACAAAATATCCAAAGCACTAAAAACAAAAAGTGAATTAGAAATTCAAGCTCTCATAGAAGCAGAGCACGGCATTCTATTGGAGACGGAAAATATTAAAACACCCGCAGTGAAACCTGACAACATACCCACAGTAGCACAGGAGGAAAAAATATCTAACTGTGGTAATGTGGATCTTGTGGTTAATAACAACACAGAAGAATGTGAAACAGCACCTGTGCCAAGAAAATGTTCAAAAATGAAGAAATCACACAAAAATATCAAAGAAATTGATAGCACCATTGAAACAAATCCACTGATTGGCTCCGAAATATTCTATGACGATGATTTAATTATAGGATCGACAGAGTCCATCGGTTCCGAGTTAGATGTGACAGATGTTGTAGCAACGAGTCTTACCAAGCAGCAAAGAGACAAAACGAAAGTGTTAAGGAAGAATGGAAACCACAGAAGAAAAGTGTCCAGAAACTTCGATAGAAATAGGAGCAAGGATTTTCTTAAATCACCACATAGAAGAAAAAAAGATTCCAGCTTGTCAGATGATAGTGTGAAAAGTCCAAAGATGCAGATTGTTCTGGGCTCTGGGCTGGCTCTGCCTGTGTCAGAAGGTGAAGAAGTGATAAAAATAGAGAAGAAGCCCGACTTAGATGGTGAAAGTGATATAGAAGTGGATGTAGGCAGTGATTCTGATAAAGATATATATATACCAAAAAATAAAACAGTCAAAGAGGTTGTTCACGAAGAGGTTCCAGTTGCTGTGCCATTGAGAAAATTTGAACCCATGCCCAGAAGAAATCGGAAAATTAACTTAGACGGCGGTGGTGGTTACACGATAATGCACACGGAAGCTGGTGACATGTATGAGATAGGTCAAGAACCTCGGAAAGAGAGACAGCAAAGAAAACAAGCGGTCCAACTTATACCGTTGCATGTTTATAACTCTGAGAAACCGGCGCCGTGTGCCGTGCACATGTTCGTGTCGGTGTTAGTGAGTATGGACGTGCAGGCTCACTGCAGCAGGGCGGAGGTGATGGGTCTGACGGGAGGCAGCTGGGAGCCCGGACCACGAACACTCACGCTGCAGCTGTACAGGACTGTGCGGGCCGCCGCCGCACACACGCACTGCGACATGGACCCGGTGTCCCAGTCGTCGTCGGCGGAGTCCCTCCGGTGTCGTGGTGTGAGTGTGTGTGGTTGGCATCACTCCCACCCCCAGTTCCCGCCCTCTCCGTCCGTGAGAGACCTCGTCAGTCAACGCTCGCTCCAGAGCCTCGCCTGGGGTCTGCCGTGTGTGGCGCTGGTCACCTCCCAGCACTGGCCTCCCGGACGCAGAGCCTCGCAACTCAGATGTTTCCGTGTAGAAGAGGACGACAAGCTTGACACTCCGGAGGTCCCCGCGGGCTACCAGCTCAATGTGAAGTTGGAGCGTGACCTGGACCGGAGCACCCTCGACCAGTACTTGGAGGAGCTCCGTGTCCTGGCACACGACACGCTCGCACACGTGGAGCTGCCCGTGGACGTGACACGGGACGTGTGTCCTCAGGCCGGCATCACTTACATGGAGAAGTGTCTTTCAAGTGTGAGTCACCACATGCGGTCGGCCGGCTACGAAGACGAGGATCCCATAGTCGCTCGGCTGTTACAAGGAATTAGAGATATATTCAGATAG

Protein sequence:

>DPOGS210851-PA
MADDDEIDILGDFSFNSCFAQNNQGIPSCSNREDTVHPQWLLDSPPTNWYDTQNKDKSYRPKDGPSRKLSGTTANYQHTTVHTSWTQKERDLLAQEMARYGRNVNKISKALKTKSELEIQALIEAEHGILLETENIKTPAVKPDNIPTVAQEEKISNCGNVDLVVNNNTEECETAPVPRKCSKMKKSHKNIKEIDSTIETNPLIGSEIFYDDDLIIGSTESIGSELDVTDVVATSLTKQQRDKTKVLRKNGNHRRKVSRNFDRNRSKDFLKSPHRRKKDSSLSDDSVKSPKMQIVLGSGLALPVSEGEEVIKIEKKPDLDGESDIEVDVGSDSDKDIYIPKNKTVKEVVHEEVPVAVPLRKFEPMPRRNRKINLDGGGGYTIMHTEAGDMYEIGQEPRKERQQRKQAVQLIPLHVYNSEKPAPCAVHMFVSVLVSMDVQAHCSRAEVMGLTGGSWEPGPRTLTLQLYRTVRAAAAHTHCDMDPVSQSSSAESLRCRGVSVCGWHHSHPQFPPSPSVRDLVSQRSLQSLAWGLPCVALVTSQHWPPGRRASQLRCFRVEEDDKLDTPEVPAGYQLNVKLERDLDRSTLDQYLEELRVLAHDTLAHVELPVDVTRDVCPQAGITYMEKCLSSVSHHMRSAGYEDEDPIVARLLQGIRDIFR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: