MonarchBase - Protein-coding gene

DPOGS206140
Transcript	DPOGS206140-TA	4218 bp
Protein	DPOGS206140-PA	1387 aa
Genomic position	DPSCF300028 + 1237372-1253827
RNAseq coverage	279x (Rank: top 39%)

Annotation
*Heliconius*	HMEL008778	3e-163	86.97%
*Bombyx*	BGIBMGA000509-TA	0.0	62.67%
*Drosophila*	ph-d-PA	6e-20	57.35%
EBI UniRef50	UniRef50_E5RWY0	0.0	63.77%	Polyhomeotic n=1 Tax=Bombyx mori RepID=E5RWY0_BOMMO
NCBI RefSeq	XP_002428662.1	1e-40	40.59%	polyhomeotic, putative [Pediculus humanus corporis]
NCBI nr blastp	gi\|319803029	0.0	63.77%	polyhomeotic [Bombyx mori]
NCBI nr blastx	gi\|319803029	0.0	66.21%	polyhomeotic [Bombyx mori]

Group
Gene Ontology	GO:0005515	3.4e-16	protein binding
KEGG pathway
InterPro domain	[1303-1379] IPR013761	4.6e-21	Sterile alpha motif-type
	[1308-1377] IPR010993	3.4e-16	Sterile alpha motif homology
	[1314-1377] IPR021129	3e-12	Sterile alpha motif, type 1
	[1312-1379] IPR001660	1.1e-07	Sterile alpha motif domain
Orthology group	MCL22622		Insect specific

Nucleotide sequence:

>DPOGS206140-TA
ATGGAGAGCGTTCAGCTAACGGGGGAGTTGAGGGGAGGTGAGGGGAAGTCTGAAATATTAGAAAATATTCAAAAGAAGAAAGACCAAGATAAAGATCAGCCTCAGAGTCCAGGATTCCAGCAGCAATTGCCAAAGCCACTCGATAAACAGATCCTAGCTGATGTACAGAATGCTTTAGCCCAGCATGTCCCAAAACTTATATCTTCATCGCATACCTCCACTGCATCGATTCAGTCAAAAGACGAGACAACAGAAAAGACAATAAAAGTTGCAAACTCAACTACAATAACATTAATAGAAAACACAAGTCACAGTGTTGAAAAAGACAAAGATAACAATTATCCTAAAAATTATTTCACATTAGAAGCTAAAAATGATAAAAAGGATGAGGCTAACAAAAACAGCATTACTATAACAAGAACAGCACCGAAACAGTCACCTGGTGGTAGTCAAAGTGACAGGCCCAAGGGCAACTCGAAAGCCACAAAGAGGCCTTTACAATACTTAGAAACACTCGCAGAGAAAGCTGGTATCACATTCGAGGATAAATATGAAGCTGCAAATACACTTTTAGCTCTTGACAAACAAAACAGTACCTTCCGCAGACCGGAGATTAAACAGCCAAAGCTTGAACCAGAAACTCATAATCAAGGTGAAGAATATCGTTATAGAAATCAAAAGGAAGAAGATGATAAGTTACAAATACAACAGCAGATAATCCAACAGCAGCAGCAGCAGCAACAGCAATTGCAACAGCTCCAACAACAGCAATTACAGCAACAAATCCAACAACAGTTGCAACAGCAAGTTTTGCAGCGTCAGGCTATACAGCAACACTTCAAAAACCAACAAGATCAACAGGAGCTGTTGCAAAAACAATTTCAACAACAACAACAGCATCACGCTCAACAACAAGCCCAACAACAGCAGCAGCATCAACAACAACAGCAACAGCAGCAGCAGCAACAACAGCAGCAGCAGCAGCAGCAACAACAACAGCAACAATCACAACAACAGCAACCTAAAACTGATATACAGCAATTATCCCAGCAACAAGACCTACAGCAACAGAAATTTCTTCAGGTTGTGAATCAGCCGGTACATACACAGCAGTTTAACGTACCCGGCATCGGCGAGATCAATCTCAGTTTCCTCGCGTCACCACAAAATAACGTTAATCTACTTTACGAAAAAAATCAAAAAACCAGCATGAGCGGAGACATTAAGCCGCAACAGATAGTTGATGGTCAGGCGCAGGTGGTTCAGCAGCAGATCAACATGTCTCAGCACGAGCCGACCCAGCACCATCAGACGGTCACAGTTGTGTCCTCGATGCCAAGCAGCATGGCACCACATCAGGTGCAGCAACAGAGCTCTGGAGGGCTGCAACAACAGGCCGCAATGCCGCCATTACAGAGTCTGCCGAACACCCAACACCCGCAACAGATAAGCGCTGAGTGGGGACACAGCCGCGTGCAGGTCATCCAGCAGCCGCTGCAGAACAGCACGTACCTTCAACAGCTGTATAATGCTCAAGGGCCGCTACTGATGCCGGGGAACATAGCTTTGCACCCGGGAATCAATTCACCCCAGATACAGGTCATTGCTGCGGGGAAGCCGTTCCAGGGAAACCAGCTGGCTCCGCATATGTTGACGACCCAGGGCAAACAAGTACTACAAGGACAGGCTGCCCCGTTCCCGGGATACACGACTATCCCGGCTATCCCGACAACCCAGAACCAGACGTTCGTGTTCAGTCCACTCGGCGTGATCAACTCGCAGTCGAGTATACTACCAGCTCACTCCCAGCCGACTGTGTCTGGGATAGGACAACAGCAAAAAACTTCTGACATGCACAAGGTGATGAGTGGTGGGAAGGTCGGTGGTAAAGTCGGTAGCGCGGTGCCGGTGCAGGCGCAATGCGTCCAGGTGTCCCAGCCCGTGCTCGGCCAACAGCAAGCCCAGATCATCAGTCCGTTACAGACGGGTGGTCAGATGCAGTTCGCGCCATGGCAGATATCCGGGGCCCTGCCGCAAGTGTGGGCAGGAGGTCTGCAGGCGGGGGCCCTGCCCGCGGGGGGCCTGCTCGCCCCCAACCCTATATTCATTAGGGGGACCCAACCCGACGCCCCATCCATGTTCATACAACACTCACCACAGAATAACGTTCAACACAACAATGTGAGCGTGGCCTGTGCGACGGCGACCACGTCGAAGCCCCGGGCCTCCAGTGAGGGAATGACGAAGACGTCTCGTCCTCTTTCCAACATTCTACCATCTAGCGGCATCAGACCCGCTTCATCTGTCTCCACCCAGACTAATACTAACCAAGCACAGAATCAGGCAAAGCAACGCGGCAAGCCAGGCGTACGATCCCCAGCACCGGCAGCCAAACAAGATGCTGCTAACCAAACAAACAAAATGCAGCATCAAATGCAGCAAACTAAACAGTTGCTGGTTATGAATTCTAGTGGACAGATGGCTCAAATTTCGAGCGTGTCGGAAAAACAGACGATTAACAAGAACATTCAGCAGCAGACAATCATACAGCAACAGCAGTCCATTCAGCAGCAGCAACAGCAGCAACAACAGCAGCAGCAGCAACAACAGCAGCAGCAGCAACAACAACAACAACTACTTCAACAGCAACACCAAACCCAGATTGTACAGCATTATCAACAACAAGGAATGACTTTGGGCATGCAGCAGAGTACACTTCCGGTTGGTTCTGTGTCCCAAACTTTGCCAATGACTGGGATGCCGCAAACTGTGTCTATGGTGCAGCAATTACACTCGTTGAGCGGTCTCGGCCAAACAAGTGCTTTAGTGAGTCAATTGAACAGTACTCAACCACCAAACTCACTATCCCAAGTGCCGTCACTTCAACAGCCACAGTTGGTGAGCAGTGGTCTCGTTCAGACGTCTGTTGGCATGGCAGTTCAACAGCCAACCGGCTTGAGTCATACCACCCAGATGCAAGCGCCCGCGTTGGCGCTCGATGGATCGCTGCTGACTCCACTCGTCGTCTCACCGGCGATATTACACCACGAGGTAACAACAAACAATCTAAGTTCGCCGCAACTGACTCTACAGGGCCAGGGGACGGTTGGTCTTCTAGCGGCACCGCTGCAGGGGTCCGTGCTGCCCTTGTCCCAGACCCTCTCGCAGACCTTGACTCAGACCCTACTCCATGTGAAGAGTGAGGAAGACAAGACACAACAAATGCCGCCACCGCAAAGCTCCGTTGTTCCGCAGTCATCACAGCCAATGGATACCAGCGACGCTACATCAACAGTATCATCACCAAGTCCTACCACCACCACGGTCAGCGCAGACGCTGCTGTCTCTACCACTACCGCTTCCGGTCCAAAAACTCCAACCGACACTCCAAAACCGAGCCCAAGTAAGGAGTCTCCGGAACAACCAGCGACCACAGCTTCACCAGCCACCAGCAGCGCCCAGAGCACCACCTCTCTAACGCCACAGGTGATGACAACTCTGGCTTGCTCTACAACAGCAACTGTTCCCACTTCCATAACCACGCCGGTAACAAGTAACTCGCTGTTCAAACCAGCTCAATGTCCTCCTCGTCATATCAACCAGCAGACAGCTCATGATAAAACCTTGCCGAAAGCCATGGTGAAGCCGAATATACTAACCCACGTTATTGAGGGCTATGTTATTCAGGAAGCTGGTGAACCATTTGCTGTTAATAGACCTCTCCGCGAGTGGGGCACGGATAAGGAGCAGGACAAAGAGAATAAACTGCCCTCAACAGACGAACCGCCCAGAAAGAAACAAATGTTAGAAAACGGCAGTAGTCTACCAAGGATATCATCAAGCAATGAGTCCAGTGAAAGCTCACAGAGCTCCAAGTCTGATCCCACACCGCAGCCCGAGGCGCCGTCGGAGGAGTCCCCGAAAATACCCAACGCTAACAAGTGGACCGTGTCCGAGGTGTGCGACTTCATACGCAGTATCCCAGGCTGTGCCGGTTACGCGGACGAGTTCCTTATGCAGGAGGTCGATGGGGAGGCTCTGCTGCTCATTAAGCCTGAACACCTGGTTATGGCGCTCTCTATGAAGCTGGGACCAGCATTAAAGATAGTCGCATGCATTGACTCGCTGCGGCCGGAAAGCGAACAGACAAATGATCATGACTGAGGTAATATATACATACATATATATACTATATATATATATATGTATATAGCTTAA

Protein sequence:

>DPOGS206140-PA
MESVQLTGELRGGEGKSEILENIQKKKDQDKDQPQSPGFQQQLPKPLDKQILADVQNALAQHVPKLISSSHTSTASIQSKDETTEKTIKVANSTTITLIENTSHSVEKDKDNNYPKNYFTLEAKNDKKDEANKNSITITRTAPKQSPGGSQSDRPKGNSKATKRPLQYLETLAEKAGITFEDKYEAANTLLALDKQNSTFRRPEIKQPKLEPETHNQGEEYRYRNQKEEDDKLQIQQQIIQQQQQQQQQLQQLQQQQLQQQIQQQLQQQVLQRQAIQQHFKNQQDQQELLQKQFQQQQQHHAQQQAQQQQQHQQQQQQQQQQQQQQQQQQQQQQQSQQQQPKTDIQQLSQQQDLQQQKFLQVVNQPVHTQQFNVPGIGEINLSFLASPQNNVNLLYEKNQKTSMSGDIKPQQIVDGQAQVVQQQINMSQHEPTQHHQTVTVVSSMPSSMAPHQVQQQSSGGLQQQAAMPPLQSLPNTQHPQQISAEWGHSRVQVIQQPLQNSTYLQQLYNAQGPLLMPGNIALHPGINSPQIQVIAAGKPFQGNQLAPHMLTTQGKQVLQGQAAPFPGYTTIPAIPTTQNQTFVFSPLGVINSQSSILPAHSQPTVSGIGQQQKTSDMHKVMSGGKVGGKVGSAVPVQAQCVQVSQPVLGQQQAQIISPLQTGGQMQFAPWQISGALPQVWAGGLQAGALPAGGLLAPNPIFIRGTQPDAPSMFIQHSPQNNVQHNNVSVACATATTSKPRASSEGMTKTSRPLSNILPSSGIRPASSVSTQTNTNQAQNQAKQRGKPGVRSPAPAAKQDAANQTNKMQHQMQQTKQLLVMNSSGQMAQISSVSEKQTINKNIQQQTIIQQQQSIQQQQQQQQQQQQQQQQQQQQQQQLLQQQHQTQIVQHYQQQGMTLGMQQSTLPVGSVSQTLPMTGMPQTVSMVQQLHSLSGLGQTSALVSQLNSTQPPNSLSQVPSLQQPQLVSSGLVQTSVGMAVQQPTGLSHTTQMQAPALALDGSLLTPLVVSPAILHHEVTTNNLSSPQLTLQGQGTVGLLAAPLQGSVLPLSQTLSQTLTQTLLHVKSEEDKTQQMPPPQSSVVPQSSQPMDTSDATSTVSSPSPTTTTVSADAAVSTTTASGPKTPTDTPKPSPSKESPEQPATTASPATSSAQSTTSLTPQVMTTLACSTTATVPTSITTPVTSNSLFKPAQCPPRHINQQTAHDKTLPKAMVKPNILTHVIEGYVIQEAGEPFAVNRPLREWGTDKEQDKENKLPSTDEPPRKKQMLENGSSLPRISSSNESSESSQSSKSDPTPQPEAPSEESPKIPNANKWTVSEVCDFIRSIPGCAGYADEFLMQEVDGEALLLIKPEHLVMALSMKLGPALKIVACIDSLRPESEQTNDHD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: