MonarchBase - Protein-coding gene

DPOGS202638
Transcript	DPOGS202638-TA	4827 bp
Protein	DPOGS202638-PA	1608 aa
Genomic position	DPSCF300039 - 788438-804187
RNAseq coverage	143x (Rank: top 54%)

Annotation
*Heliconius*	HMEL014520	80.31%
*Bombyx*	BGIBMGA000839-TA	72.04%
*Drosophila*	CG12325-PA	53.34%
EBI UniRef50	UniRef50_B4GGA0	53.46%	GL17309 n=9 Tax=Neoptera RepID=B4GGA0_DROPE
NCBI RefSeq	XP_623489.1	54.04%	PREDICTED: similar to CG12325-PA [Apis mellifera]
NCBI nr blastp	gi\|328782245	53.92%	PREDICTED: periodic tryptophan protein 2 homolog [Apis mellifera]
NCBI nr blastx	gi\|380020249	54.48%	PREDICTED: LOW QUALITY PROTEIN: periodic tryptophan protein 2 homolog [Apis florea]

Group
Gene Ontology	GO:0005515	7.6e-64	protein binding
KEGG pathway
InterPro domain	[636-1041] IPR011046	7.6e-64	WD40 repeat-like-containing domain
	[880-1091] IPR015943	2.5e-42	WD40/YVTN repeat-like-containing domain
	[1485-1584] IPR007148	2.7e-16	Small-subunit processome, Utp12
	[377-416] IPR001680	2.6e-09	WD40 repeat
	[508-546] IPR019781	1.1e-08	WD40 repeat, subgroup
Orthology group	MCL14261		Single-copy universal gene

Nucleotide sequence:

>DPOGS202638-TA
ATGAAGTATAATTATAAGTTTCAAAATTTACTGGGCACAGTGTATCGTCATGGTGATATATTGTTCACTAATGATGGAAACTGTGTCATCAGTCCCGTTGGAAACAGGATAACCATTTACAATCTGAAACAGAATAAAAGCAATACTCTCCCTGTGGAAAGTCACTACAATTATACAGCCATCGACATATCTCCAAATGGATCAGTACTTCTTGCTATCAATGAAAAGGGTGAAGCACAAATGATCAGCCTCGTAACCTGCACGGTCATACACAGATATAAGTTCAAGCAGCAAGTTAATGCTGTCAAATTCAGTCCTGATGGGAAATTGTTTGCTGCTTGTTGTGATGACACAGTGTTCATAATGACTGCACCCAGTGCATTTACGGGAGAGTTCCGTTCATTCATAATGAGACGTGTGTTTAAAAAATCACATGACGAAGTCACTTGCCTGGACTGGTCTAGTTGTGGAAAGTTACTTGCGGTGGGATCCAAAGACACAACAACCAAAATATACACAGCCGAGTACTTGGACAACCTAAATATGTACTCTTTAAGTGGTCATACAGACAAGATTGTTGGTGTATTCTTTGAGCAGAAGAGTTTAGACCTTATAACTGTGAGCCGTAATGGTCAGGTTTGCTTGTGGGATGCCAGTCTGGATTCAGATAGCCTGGTTACTTCAGAGGTACAAATATCACATAAGAAGAGACGGAAATTGCAAAAGGAAGCCGAATTAGTTGAGGATGAAGTTGATGAAGAGAATATAGTTGAAAAGGACAAAGAATATGAGAGTGATAAAGATGTTGAAATAGAAGAGGAACAAAAGACAAATGACGGTAAAAAACTCCAATACAACAAGCTGGGGAGGCATTATATTGGGGATTCCATAAGGAATGGTAACCATAAGGTGAAACTAACGGCTGCGGCATACCACAGGGGGACCAAGATATTAGTGACAGGTTTCTCCACTGGTATATTCTTCCTTCACGAGATGCCAGATGTGAATCTCATCCACTCCTTGAGTATATCAGAACACAGGATTGGCAGCATCTCAGTATCTCACCAGGGGGACTGGATAGCGTTTGGTTGTCCCAACATTGGACAACTGTTGGTTTGGGAGTGGCAGAGCGAGCAATATGTTATGAAGCAGCAGGGCCACTCGCTAGACATGACCTGCCTCGCGTATTCGCCTGACGGGCTCTACATAGTCACAGGCGGCTATGACGGGAAGGTCAAAGTATGGAATACCAGCTCGGGCTTCTGCTTCGTTACATTCAGTGAACATAAGTCGACGGTGACCGGGATAACGTTCAGTGCCAATAAGAAATTCTTCGTGTCTTCATCTCTGGACGGCACCGTGAGATGTTACGATCTGACGAGGTATCGTAACTTCCGTACTTTCTCGTCTCCGACCCTGGTTCAGTTCGGCTGCGTGTCCTTGGACAGCAGCAGTGAACTGTGTGCTGCTGGAGGACAGGACGTCTTCGAGATATACCTGTGGTCCGTCAAATTTGGGCGACTTTTGGAGGTGCTCGCAGGTCATGCAGCTCCAGTGGCTAGTTTAGCTTTCAGTCCACTTCTGTCTAGTTCCAAACTGGCCTCCGCCTCCTGGGACAAGACGGTAAAGATATGGAACTGTATAGAAACAAGCTCGGACTGTGAAACTATACAACTGGGTTCGGACGCACTGCAAGTGAGCTTCAGACCTGATGGAGAAGAGATAGCAGTATCGACGTTAGACGGTAACATATCATTCTTCAACGCCACCACTTGCGACCAGACTGCCAGTTTGGAGGGGAGAAATGATCTGGGAGCCGGCAGGGCCGACACCGATCTGGTTACACCGGAGAAGCTGTTGAAGACCAAGAATAAAAGCAATACTCTTCCTGTGGAAAGTCACTACAATTATACAGCTATCGACATATCTCCAAATGGATCAGTACTTCTTGCTATCAATGAAAAGGGTGAAGCACAAATGATCAGCCTCGTAACTTGCACGGTCATACACAGATATAAGTTCAAGCAGCAAGTTAATGCTGTCAAATTCAGTCCTGATGGGAAATTGTTTGCTGCTTGTTGTGATGACACAGTGTTCATAATGACTGCACCCAGTGCATTCACGGGAGAGTTCCGTTCATTCATAATGAGACGTGTTTTTAAAAAATCACATGACGAAGTCACTTGCCTGGACTGGTCTAGTTGTGGAAAGTTACTTGCGGTGGGATCCAAAGACACCACAACCAAATTATACACAGCCGAGTACTTGGACAACCTAAATATGTACTCTTTAAGTGGTCACACAGATAAGATTGTTGGTGTATTCTTTGAGCAGAAGAGTTTAGACCTTATAACTGTGAGCCGTAATGGTCAGGTTTGCTTGTGGGATGCCAGTCTGGATTCAGATAGCCTGGTTACTTCAGAGGTACAAATATCACATAAGAAGAGACGGAAATTGCAAAAGGAAGCCGAATTAGTTGAGGATGAAGTTGATGAAGAGAATATAGTTGAAAAGGACAAAGAATATGAGAGCGATAAAGATGTTGAGATAGAAGAGGAACAAAAGACAAATGATGGTAAAAAACTCCAATACAACAAGCTGGGGAGGCATTATATTGGGGATTCCATAAGGAACGGTAACCATAAGGTGAAACTAACGGCTGCGGCATACCACAGGGGGACCAAGATATTAGTGACAGGTTTCTCCACTGGTATATTCTTCCTTCACGAGATGCCAGATGTGAATCTCATCCACTCCTTGAGTATATCAGAACACAGGATTGGCAGCATCTCGGTATCTCACCAGGGGGACTGGATAGCGTTCGGTTGTCCCAACATTGGACAACTGTTGGTTTGGGAGTGGCAGAGCGAGCAATATGTTATGAAGCAGCAGGGCCACTCGCTAGACATGACCTGCCTCGCGTATTCGCCTGACGGGCTCTACATAGTCACAGGCGGCTATGACGGGAAGGTCAAAGTATGGAATACCAGCTCGGGCTTCTGCTTCGTTACATTCAGTGAACATAAGTCGACGGTGACCGGGATAACGTTCAGTGCCAATAAGAAATTCTTCGTGTCTTCATCTCTGGACGGCACCGTGAGATGTTACGATCTGACGAGGTATCGTAACTTCCGTACTTTCTCGTCTCCGACCCTGGTTCAGTTCGGCTGCGTGTCCTTGGACAGCAGCAGCGAACTGTGTGCTGCTGGAGGACAGGACGTCTTCGAGATATACCTGTGGTCCGTCAAATTTGGGCGACTTTTGGAGGTGCTCGCAGGTCATGCAGCTCCAGTGGCTAGTTTAGCTTTCAGTCCACTTCTGTCTAGTTCCAAACTGGCCTCCGCCTCCTGGGACAAGACGGTAAAGATATGGAACTGTATAGAAACAAGCTCGGACTGTGAAACTATACAACTGGGTTCGGACGCACTGCAAGTGAGCTTCAGACCTGATGGAGAAGAGATAGCAGTATCGACGTTAGACGGTAACATATCATTCTTCAACGCCACCACTTGCGACCAGACTGCCAGTTTGGAGGGGAGAAACGATCTGGGAGCCGGCAGGGCCGACACCGATCTGGTTACACCGGAGAAGCTGTTGAAGACCAAAGCTTTCACTACGATATGCTACTCAGCGGATGGCACGTGTATCCTGGGGGCAGGAAACTCCAAACACATATGTCTGTACAGTATTAAGGAGGGTGTACTCATCAAGAAGTTTGTGATCACGCAGAACAAGTCCTTGGACGCTATTAATGACTTTATAAATCGTCGGAACATCACCGAATTTGGTAATATGGCGCTGGTTGAAGAGAGGGAGGAGTTGGAAGGAGGGGAGGTTAGGGTGAGGCTGCCGGGGGTCGGCGGGGGAGATATGGCTGATAGGAGGCTGAAACCTGAGGTTCGTGTGTGGTGTGTTCGTTTCTCTGGTGCTGATGAAAGCTTTGCAGCAGCATGTACCGAGGGACTGCTGTTATATGGAACAAGAACGGGGAGTGGGTTCAGGCCATATCGTCTAGAAACAGGTTCCACGCCGGCTGCAGTGAAAAATCTATTGTCGGAGAGATCATGGGGCTTCGCCCTCATTGGAGCCCTACAGCTCAACGACAACACTCTCATACAGCAATGCGTAGAAGCTGTCCCCCCGAATGACATCGAACTAACAGCAAAGAGTTTGGAAGAAGATTACATGATACGTCTTCTTAACTCGATCGCAAGTCTTCTAGAAGATAGTCCCCATCTAGAACATTTGCTCATCTGGGTTAGGAGTCTCGTCACAGACAAGAAGAAATTCCCGCCCAGCGTGTTGCTAGCCTTAGAGAAGGCGCTCACGGTGAAATATTCGCAGATTAATAAAATGCCATATCGTCTAGAAACAGGTTCCACTCCGGCTGCAGTGAAAAATCTATTGTCGGAGAGATCATGGGGCTTCGCCCTCATTGGAGCCCTACAGCTCAACGACAACACTCTCATACAGCAATGCGTAGAAGCTGTCCCCCCGAATGACATCGAACTAACAGCAAAGAGTTTGGAAGAAGATTACATGATACGTCTTCTTAACTCGATCGCAAGTCTTCTAGAAGATAGTCCCCATCTAGAACATTTGCTCATCTGGGTTAGGAGTCTCGTCACAGACAAGAAGAAATTCCCGCCCAGCGTGTTGCTAGCCTTAGAGAAGGCGCTCACGGTGAAATATTCGCAGATTAATAAAATATGTGAGTTCAATAAATACACAATACGCTGTATAAAGTCAGTTGGCGCTTTGACTCTGAAGGATGAGGACGGTTCCAGCGGACGAGGCACTTTCACTGACGATTCAGATTCTGATTAA

Protein sequence:

>DPOGS202638-PA
MKYNYKFQNLLGTVYRHGDILFTNDGNCVISPVGNRITIYNLKQNKSNTLPVESHYNYTAIDISPNGSVLLAINEKGEAQMISLVTCTVIHRYKFKQQVNAVKFSPDGKLFAACCDDTVFIMTAPSAFTGEFRSFIMRRVFKKSHDEVTCLDWSSCGKLLAVGSKDTTTKIYTAEYLDNLNMYSLSGHTDKIVGVFFEQKSLDLITVSRNGQVCLWDASLDSDSLVTSEVQISHKKRRKLQKEAELVEDEVDEENIVEKDKEYESDKDVEIEEEQKTNDGKKLQYNKLGRHYIGDSIRNGNHKVKLTAAAYHRGTKILVTGFSTGIFFLHEMPDVNLIHSLSISEHRIGSISVSHQGDWIAFGCPNIGQLLVWEWQSEQYVMKQQGHSLDMTCLAYSPDGLYIVTGGYDGKVKVWNTSSGFCFVTFSEHKSTVTGITFSANKKFFVSSSLDGTVRCYDLTRYRNFRTFSSPTLVQFGCVSLDSSSELCAAGGQDVFEIYLWSVKFGRLLEVLAGHAAPVASLAFSPLLSSSKLASASWDKTVKIWNCIETSSDCETIQLGSDALQVSFRPDGEEIAVSTLDGNISFFNATTCDQTASLEGRNDLGAGRADTDLVTPEKLLKTKNKSNTLPVESHYNYTAIDISPNGSVLLAINEKGEAQMISLVTCTVIHRYKFKQQVNAVKFSPDGKLFAACCDDTVFIMTAPSAFTGEFRSFIMRRVFKKSHDEVTCLDWSSCGKLLAVGSKDTTTKLYTAEYLDNLNMYSLSGHTDKIVGVFFEQKSLDLITVSRNGQVCLWDASLDSDSLVTSEVQISHKKRRKLQKEAELVEDEVDEENIVEKDKEYESDKDVEIEEEQKTNDGKKLQYNKLGRHYIGDSIRNGNHKVKLTAAAYHRGTKILVTGFSTGIFFLHEMPDVNLIHSLSISEHRIGSISVSHQGDWIAFGCPNIGQLLVWEWQSEQYVMKQQGHSLDMTCLAYSPDGLYIVTGGYDGKVKVWNTSSGFCFVTFSEHKSTVTGITFSANKKFFVSSSLDGTVRCYDLTRYRNFRTFSSPTLVQFGCVSLDSSSELCAAGGQDVFEIYLWSVKFGRLLEVLAGHAAPVASLAFSPLLSSSKLASASWDKTVKIWNCIETSSDCETIQLGSDALQVSFRPDGEEIAVSTLDGNISFFNATTCDQTASLEGRNDLGAGRADTDLVTPEKLLKTKAFTTICYSADGTCILGAGNSKHICLYSIKEGVLIKKFVITQNKSLDAINDFINRRNITEFGNMALVEEREELEGGEVRVRLPGVGGGDMADRRLKPEVRVWCVRFSGADESFAAACTEGLLLYGTRTGSGFRPYRLETGSTPAAVKNLLSERSWGFALIGALQLNDNTLIQQCVEAVPPNDIELTAKSLEEDYMIRLLNSIASLLEDSPHLEHLLIWVRSLVTDKKKFPPSVLLALEKALTVKYSQINKMPYRLETGSTPAAVKNLLSERSWGFALIGALQLNDNTLIQQCVEAVPPNDIELTAKSLEEDYMIRLLNSIASLLEDSPHLEHLLIWVRSLVTDKKKFPPSVLLALEKALTVKYSQINKICEFNKYTIRCIKSVGALTLKDEDGSSGRGTFTDDSDSD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: