MonarchBase - Protein-coding gene

DPOGS201993
Transcript	DPOGS201993-TA	2004 bp
Protein	DPOGS201993-PA	667 aa
Genomic position	DPSCF300060 + 153683-159223
RNAseq coverage	1134x (Rank: top 11%)

Annotation
*Heliconius*	HMEL005614	83.86%
*Bombyx*	BGIBMGA010562-TA	78.79%
*Drosophila*	Cka-PE	52.19%
EBI UniRef50	UniRef50_E2APP1	53.22%	Striatin-3 n=14 Tax=Formicidae RepID=E2APP1_CAMFO
NCBI RefSeq	XP_001601585.1	54.34%	PREDICTED: similar to striatin [Nasonia vitripennis]
NCBI nr blastp	gi\|332031514	54.28%	Striatin-4 [Acromyrmex echinatior]
NCBI nr blastx	gi\|189236270	55.88%	PREDICTED: similar to AGAP008755-PA [Tribolium castaneum]

Group
Gene Ontology	GO:0005515	3e-63	protein binding
KEGG pathway
InterPro domain	[338-666] IPR015943	3e-63	WD40/YVTN repeat-like-containing domain
	[346-666] IPR011046	4e-61	WD40 repeat-like-containing domain
	[38-163] IPR013258	2.2e-42	Striatin, N-terminal
	[582-621] IPR001680	2.2e-08	WD40 repeat
	[584-621] IPR019781	2.7e-08	WD40 repeat, subgroup
	[373-387] IPR020472	7.9e-07	G-protein beta WD-40 repeat
Orthology group	MCL10720		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS201993-TA
ATGGATGATAGCTCCGTATCTCATCATAACGGAGGGCAAGTGGGATCTCAGATAGGAGTTAGTGTAAATAACAAACAAAATGAAGAATCTAGTCAAAGTGTCCAGTATTCAATACCGGGCGTTTTGCATTTCATCCAACATGAATGGGCGAGATTTGAAGTCGAAAGATCACAATGGGAGGTGGACAGAGCAGAGTTTGAGGCACGGATTGCCTTCCTCCAAGGTGAGAGGAAGGGTCAAGAGAATCTAAAAAATGATTTGGTAAGGCGGATCAAAATGCTTGAGTATGCACTTAAGCAGGAAAGAGCGAAGTTTCATAAGCTGAAATATGGAGTAGATCTTCAGCAGAGGGACATGCATCCACCAGCTGAAGAGCCTACACAGGAACCAGAGCCTTCAGAGCGCGCCCAATGGAAGCAGGGTAGACAATTGATTAAACAGTACCTACAGGAAATTGGTTACACAGATACCATCCTTGATGTTCGTTCAAACAAAGTAAGAACTTTGCTTGGTTTAAACAATGAGGAGCCGGCCGATGATAGTAGCCACAGAAACTGTGACAAACAACAACACTATTCTATGAATACTGCCTTAAATCGTAAGATGTATGAATATGGTGGAAAAGATCAACGCAAAGGAGCTCAGCAAGGCAGCGGTTATAATGAAGAAGGGATGTCCGTTCAAGAGACAGCGGCTGTGTTTGCTAACTTTGAGTTTCTATCTAATCAGGAAATGGATATGGATGAAATTGATGACTTAGATGCCAAACAAATGCACCACACTGCAACTAAGCAAGGTGAAGAGGTGGACCAAGAAGCGGAGGAAGTATTAAATGAACTAAACCTGCTAACTGAGAGCGAGGCTGACGGAGGACAAGGAGATGAGTTCCCAACCGTGAAATTCCCAGCCTCTTCAGCGACAGCGGCGCGTGAGGGTGACGGGAAGCCGCTAGCTCTGGGAGAGCTGGCACAGCTGACGGTCAGCAACGAGTCCGAGGGTTACGACGTGGCCAGCGCTAGCAAGGAGTCCTTCAGGAAGACCTGGAACGCTAAATACAGTCTGCGTTCACACTTTGATGGGGTGCGTGCTCTCGCCTTCCATCCGACGCGGGCTGCTTTGGTGACAGCCTCCGAGGATCACACGCTGAAGATGTGGGATCTCCAGCGTACTGTCCCAGCTAAGAAGTCGGCCGGTTTGGATGTGGAACCTCTGTATACGTTCAGAGCCCACACAGCGCCGGTGCTCTGCCTCGCTATGGGCGCTCCCCGCTCGGAGGAATGTTTCTCAGGGGGTCTGGACGGGACCATCAGAGTTTGGAACCTGCCCCCACCCATCGCTGATCCATACGACTCATATGATCCCGCTGTATTGGGGCCTGTACTCCGCGAGCACACGGACGCGGTGTGGTCGCTGTCGTGCGCTGGTGGTAGGCTGTTGTCTTCATCAGCGGACGGTACAGCCAGGCTGTGGTCCCCACGAGACCCTCGGCCCCTGCTCGCCACGCTCAGGGACGACTCCCCCGGCTCCACCTCAGCGCCGGCGGCCGCGGACTTCGCTGATGCAGCCTGCCGCGCGGCAGTCGTCTACACTGACGGCACTCTTCTATTATACGACCTCGAAACTGGACAGGTGGTGTTGCGCGTGCCGTGCGACAGTCCCGCCAACCGCGTCCGCTCCCATCCAACTCTGCCGCTCCTTGTGACGGCTCACGAGGATCGTCACATCCGTTTCTGGGACGCCGTTTCCGGTCGCTGTGCGCACGCGATGGTCGCCCACCTGGACGCCGTGACGGGTCTGGCACTGGATCCGAACGGCCTGTTCCTGCTGTCGGGCTCCCACGATTGTTCCGTGCGCCTGTGGAACCTGGACACCAAGACCTGCGTGCAGGAGATCACTGCTCACAGGAAGAAGTTCGACGAGAGCATCCTGGATGTGGCCTTCCACCCCCTCCGGCCGTACATCGCCAGCGCCGGCGCCGACGGCCTCGCTAAAGTCTTCGTCTGA

Protein sequence:

>DPOGS201993-PA
MDDSSVSHHNGGQVGSQIGVSVNNKQNEESSQSVQYSIPGVLHFIQHEWARFEVERSQWEVDRAEFEARIAFLQGERKGQENLKNDLVRRIKMLEYALKQERAKFHKLKYGVDLQQRDMHPPAEEPTQEPEPSERAQWKQGRQLIKQYLQEIGYTDTILDVRSNKVRTLLGLNNEEPADDSSHRNCDKQQHYSMNTALNRKMYEYGGKDQRKGAQQGSGYNEEGMSVQETAAVFANFEFLSNQEMDMDEIDDLDAKQMHHTATKQGEEVDQEAEEVLNELNLLTESEADGGQGDEFPTVKFPASSATAAREGDGKPLALGELAQLTVSNESEGYDVASASKESFRKTWNAKYSLRSHFDGVRALAFHPTRAALVTASEDHTLKMWDLQRTVPAKKSAGLDVEPLYTFRAHTAPVLCLAMGAPRSEECFSGGLDGTIRVWNLPPPIADPYDSYDPAVLGPVLREHTDAVWSLSCAGGRLLSSSADGTARLWSPRDPRPLLATLRDDSPGSTSAPAAADFADAACRAAVVYTDGTLLLYDLETGQVVLRVPCDSPANRVRSHPTLPLLVTAHEDRHIRFWDAVSGRCAHAMVAHLDAVTGLALDPNGLFLLSGSHDCSVRLWNLDTKTCVQEITAHRKKFDESILDVAFHPLRPYIASAGADGLAKVFV-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: