MonarchBase - Protein-coding gene

DPOGS206502
Transcript	DPOGS206502-TA	3606 bp
Protein	DPOGS206502-PA	1201 aa
Genomic position	DPSCF300367 - 18347-31834
RNAseq coverage	289x (Rank: top 38%)

Annotation
*Heliconius*	HMEL006600	0.0	48.89%
*Bombyx*	BGIBMGA012725-TA	4e-101	48.03%
*Drosophila*	cnk-PA	4e-69	34.73%
EBI UniRef50	UniRef50_UPI00022C977F	9e-85	40.56%	UPI00022C977F related cluster n=1 Tax=unknown RepID=UPI00022C977F
NCBI RefSeq	XP_001602905.1	8e-84	41.01%	PREDICTED: similar to conserved hypothetical protein [Nasonia vitripennis]
NCBI nr blastp	gi\|350409681	3e-84	40.56%	PREDICTED: hypothetical protein LOC100748006 [Bombus impatiens]
NCBI nr blastx	gi\|195123865	7e-105	28.07%	GI21034 [Drosophila mojavensis]

Group
Gene Ontology	GO:0005515	3.8e-17	protein binding
KEGG pathway
InterPro domain	[3-82] IPR010993	3.8e-17	Sterile alpha motif homology
	[4-78] IPR013761	5.7e-12	Sterile alpha motif-type
	[194-318] IPR001478	9.2e-12	PDZ/DHR/GLGF
	[8-72] IPR021129	2e-11	Sterile alpha motif, type 1
	[764-843] IPR011993	2.3e-09	Pleckstrin homology-type
	[6-74] IPR001660	3.8e-09	Sterile alpha motif domain
	[745-846] IPR001849	4.4e-06	Pleckstrin homology domain
Orthology group	MCL14139		Single-copy universal gene

Nucleotide sequence:

>DPOGS206502-TA
ATGGGCAGTTTGAACATAGCGGAATGGACACCAGAGCAAGTAGCGGACTGGTTAACAGGTCTAGGACCGAAAGTAGCCCAGTATGTGCCGGAGCTACAGAAGAAGGCTCTCAATGGCTCGAAACTGCTGACGATGCGCTGTGATGACTTAGAATATCTAGGCGTTCATATCATTGGGCACCAGGAACTTATATTAGAGGCTGTGGAGCACTTACGAAACTTTCACTACGAGTCGTCCCGCGAGTGCGTGCAGCAGCTGGCGGTACGCGTGTCCGGGGCGGCTCAGTCCTTGGCCCGCGCACTGCGCTACCATGGTGACGCGCGCCTGGAGACGGACTCGCTGGCGGACGTGGCCCGCACTGTACACGCCGTCAAGCCCCTCGTGTGCTGGCTGGACCGCTGGCCGCTGTGTTCGGGTTCGCCTCTCGCGGCACGGAAGGCTGCCCTGTTGAAGCTGTCCCTGGAGGCGGCCACGTGCGCCCAGCGGGAGAGGTTCGCGGAGCAGCCGGCCCGCGCCGTGGCCGCCGCCGCTGCCGCCCTCGCCGCACTCGCAGACTACATCATACAGGACGTGTCGGACCCCATGATCCTGCAGCCGGCGCGGGTGGACTCGGTGTCGCTGGTGCAGGGAGAGCGCGCGCTCGGCTTCGAGGTGGTCCCGTCGTTCTGCGGGCACCACCAGCTCGCACACATCAGGTTCGCGTCTCCCGCACACGCCTCCGGGCTCGTGCACGAGGCCGACGAGATCGTCCAGGTGGGAGGGCGCTGCGTGGTGGGTTGGCCCGGGGAGGCCGTGGAGGCGGCGTGCACGCGGGCGGCGCGGGGCGGAGACCTGGCGCTGAAGCTGCGGCGGCGCGGGGCGCGTGCTCTGCCCGCCCTGCCCACTCCGCCGCTCCGCGCGCCCCGCGCTCGGGCCCGTCCTCGTCCTCCGCACGCTCCCTTCACTCTGCACCGGTACGAGCTGGAGTTTCCCCTGTCGGGCGCCGTGCACCCCGCGCCCCGCTCCCCTCCCCGCCCGCCCCGCGCCGACAGCCCGTCCTCCGAAGACAGCGACGCTCTCTCCCCGCCCGCCTCGCCGACGCTCCTACTGCTGCCGGACACCGCGCGTATGTATCCTCCCAAGCCGCGCCTGTCGGTGGTCCGTCGTCACTCAGTGAGCGGGGAGACGCCGGCGGCCGCGAGTCACGCGCTCGCCGTCCACCAGTTATGGCAGCAGTTGCAGCAGCAGCGGCTGGCGTGTGTCGACGGTGACAACGCCCTGTATCGGAGAGATAAGGCCGTGTCGTGTAGTACGGGCCTGCAGTTGTCTCCTCGGCCCCGTACGTGCCTGGTGGTGCCGCGGCCGCTGGGTCAGCTGGGCCAGGTCGCGGGGCCTCCGGCCGCCTCGCCGTGTCGCGGGAAGCTCGACAAGAGTCACTCGACCCCCGCCTACGACTTCGAACCGAGCTCGGAGCCGGGGTCGCTGGCCGCGCAGACCATCCCGGAGTCCCCGACCACTCCAGTCACGGACGCCCCGCCTCACACAGAGAAGGCGGGGCAGATACTGGACTTCAAGAAGTCCAGTTCGCAGATAGAGGAGGCCATCCAGCAGAGGAACCGGCGGGCGAACGGAGACGACGACAAGAACGACGCGTTCACAGAAGACGACACGAAGCTAGAGATAGTGGAGACGGTCAACGAGGTGATGAGGGAGACGGCGGGAGGGGCGAGGGAGGGAGGCAGGGAGGACGCGAGGAGGAGGAGGGAGGCGGCCGGGGACGACACGAGCAGCGACGACCAACAAGCGGCTGGAACCATGAGACGAACGAAACCTCGCATCACGGAACGCTTCCGTCCGGCGGACCCGTCCCGGCCTCCTTCCCCCCCACCTCGCCCCTCCCTCCCTCATCGTCCCGCGCCTCCCGCTCCCCGCGAGCCTCGCCCTCCTCCCCGAGACGCTCCTCAGTACCCTCCAGTGCGCGTCCTCACCCGACCCGCCGAGTCTCGGGACGCCTCCCCGCTCAAGGCCCTGAGGCCAGACATCCCGCAGGGGTCTGTGCCGTTGAGACACATCACCAAACACGACATCAAACTGGTGTCGGCGGAGAGGCGCGAGATGCCCGCCATCAACGGCGAGGCGGAGCGCGCGGCCGCACGGAAGGATGACGTCACGGTGACGGCGGCGAGTCCGGGCGGGGGGGCGGCGGCGGGCGGGGGCGGGCGTCGGTCGGTGCCGGCGCGGTTGCTGTCGGGGCGCGGCGCCTGCGGCAGCGTTGTGCAGCGCGTGCGGGCGGGCGCGGGCACGGGCTGCACGCGCTGGGCCTCCCGCCACCTGCTGCTGGCCCACAACCTGCTGTACGCCTACCGGTCGGCGGAGTGCTCGCGCGCCGCCTGCATGATCTACCTGGAGGGGTTCACGGTGTGCGCGGCGGCCGAGGTCAAGTCCCGCGCGCACGCCTTCAAAGTGTACCACACGGGGACGGCCTTCTACTTCGCGTGCGACTCGCGCGAGGCGATGCTGGCCTGGATCGGTCTCATCCACCGCGCCACTCTGCTGCCGTCGCTGCTCTCCGAGGCGATGGAGTTATCGAAACAGTTTTCGGAAACTGATTACTCCGAAACCGAATCGGACTTAGAAACATCGGAAAGAAGGTTAGAAAAGGAAAAAGAGAGGGAGAAGGAGAGGGAGAGGGAGAAGGAGAAGTCGAAGTTTGGATCGTTGAAGAAGTTAACGCATCGGACGAGTAGGAGCGAGTCACAGGAGAACGTGAGCCAGCAGGCGGCCACCAGCCTCGACAGGAAGTACCTCAGGTTCTTCTCACGGGCGCGCGCCAAGGACGACAACAAGACGCCTAAGAAACCGTCCGGCGTGCCCGTGCCTACCGAGCATTACCGCAGCTACCGCCGCGCGGAGCCCCCTCTACCCTCTCCCCGCGCCCCGCCGCCCGCGCCCCGCCCCTCATCCTCCAGTAGCAAGAAGCTGCCGAAGCCCATCAACTACATCCACGCGTCCAACCCCAACTTGCTGGACTTCGAGAAGAGCGACTTCGTCACCAAGCCGACCATCCAGGTTCCGAAGCCGAAGGTGTCGAAGCCGGACAGCCTGGCGGGGTTCGTGACGCTCGAGGAGTTCATGCTGCAGAAACAGGCAGAGGAGAGGCAGCAGCTGTATTCCGGCCGCGTGCTGCTCGGAGTGGAGCGGGGGGCGCGGGCCGCGGGCAGGGGGGCGCAGGGGGAGGGAGGCGAGCTGCAACGGCGGCTCGACCGGATAGTGCCCGACGTCATCTACGGAGAGTTGGCGCCCGAACATAGAGACAGAAACAAACCGGTCTCCGTCCCTGACAAGGATGGTTACGAGACCCTCGTGTATCCGGACGAGAGAGACGGCCGGACTGACTCGATAGTGTCCGGCTCCTCCCACGGTCCGCACTCGGCCGCCGACAGCGTGTCGACGGGCGTGTCGCGGCTACGGCTCATGTTTGGAGCAAGACGGGACCTCGTGCGACAAGAGAGCAGTCGCTCGGAGCAGTATCCTCACCTGCAGTGTCCGCCGACCTTCCAGCCGGAGACGTACTCCCTGGCGCGGCCTCCGAGAGACGCACACACACGCACACACGCGCGCGACTGA

Protein sequence:

>DPOGS206502-PA
MGSLNIAEWTPEQVADWLTGLGPKVAQYVPELQKKALNGSKLLTMRCDDLEYLGVHIIGHQELILEAVEHLRNFHYESSRECVQQLAVRVSGAAQSLARALRYHGDARLETDSLADVARTVHAVKPLVCWLDRWPLCSGSPLAARKAALLKLSLEAATCAQRERFAEQPARAVAAAAAALAALADYIIQDVSDPMILQPARVDSVSLVQGERALGFEVVPSFCGHHQLAHIRFASPAHASGLVHEADEIVQVGGRCVVGWPGEAVEAACTRAARGGDLALKLRRRGARALPALPTPPLRAPRARARPRPPHAPFTLHRYELEFPLSGAVHPAPRSPPRPPRADSPSSEDSDALSPPASPTLLLLPDTARMYPPKPRLSVVRRHSVSGETPAAASHALAVHQLWQQLQQQRLACVDGDNALYRRDKAVSCSTGLQLSPRPRTCLVVPRPLGQLGQVAGPPAASPCRGKLDKSHSTPAYDFEPSSEPGSLAAQTIPESPTTPVTDAPPHTEKAGQILDFKKSSSQIEEAIQQRNRRANGDDDKNDAFTEDDTKLEIVETVNEVMRETAGGAREGGREDARRRREAAGDDTSSDDQQAAGTMRRTKPRITERFRPADPSRPPSPPPRPSLPHRPAPPAPREPRPPPRDAPQYPPVRVLTRPAESRDASPLKALRPDIPQGSVPLRHITKHDIKLVSAERREMPAINGEAERAAARKDDVTVTAASPGGGAAAGGGGRRSVPARLLSGRGACGSVVQRVRAGAGTGCTRWASRHLLLAHNLLYAYRSAECSRAACMIYLEGFTVCAAAEVKSRAHAFKVYHTGTAFYFACDSREAMLAWIGLIHRATLLPSLLSEAMELSKQFSETDYSETESDLETSERRLEKEKEREKEREREKEKSKFGSLKKLTHRTSRSESQENVSQQAATSLDRKYLRFFSRARAKDDNKTPKKPSGVPVPTEHYRSYRRAEPPLPSPRAPPPAPRPSSSSSKKLPKPINYIHASNPNLLDFEKSDFVTKPTIQVPKPKVSKPDSLAGFVTLEEFMLQKQAEERQQLYSGRVLLGVERGARAAGRGAQGEGGELQRRLDRIVPDVIYGELAPEHRDRNKPVSVPDKDGYETLVYPDERDGRTDSIVSGSSHGPHSAADSVSTGVSRLRLMFGARRDLVRQESSRSEQYPHLQCPPTFQPETYSLARPPRDAHTRTHARD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: