MonarchBase - Protein-coding gene

DPOGS215834
Transcript	DPOGS215834-TA	3417 bp
Protein	DPOGS215834-PA	1138 aa
Genomic position	DPSCF300073 + 412057-428614
RNAseq coverage	1836x (Rank: top 7%)

Annotation
*Heliconius*	HMEL011644	0.0	79.54%
*Bombyx*	BGIBMGA013563-TA	0.0	76.92%
*Drosophila*	by-PA	6e-72	47.20%
EBI UniRef50	UniRef50_E0VF33	0.0	39.79%	Tens, putative n=1 Tax=Pediculus humanus corporis RepID=E0VF33_PEDHC
NCBI RefSeq	XP_002424660.1	0.0	39.79%	tens, putative [Pediculus humanus corporis]
NCBI nr blastp	gi\|242007688	0.0	39.79%	tens, putative [Pediculus humanus corporis]
NCBI nr blastx	gi\|270006735	0.0	39.05%	hypothetical protein TcasGA2_TC013103 [Tribolium castaneum]

Group
Gene Ontology	GO:0005515	3e-26	protein binding
KEGG pathway	dpe:Dper_GL12292	4e-57
	K00665 (FASN)	maps->	Insulin signaling pathway
			Fatty acid biosynthesis
InterPro domain	[999-1134] IPR013625	3e-26	Tensin phosphotyrosine-binding domain
	[884-981] IPR000980	2.9e-22	SH2 motif
	[995-1136] IPR006020	7.2e-15	Phosphotyrosine interaction domain
	[247-374] IPR008973	3.9e-14	C2 calcium/lipid-binding domain, CaLB
	[302-371] IPR014020	7.3e-10	Tensin phosphatase, C2 domain
	[993-1127] IPR011993	1e-09	Pleckstrin homology-type
Orthology group	MCL12073		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS215834-TA
ATGAGACCACGTGTCAAGAAGGAATCTGAAGCAGCTAGGGCGCTCCATCGACTTGCGTTCGCGTTGTGGCGGGCGGCCTTTTATTTGCAGCGCGGACCCTCACGAGCACATACTTCGAAGCAAGGAACCTTGACCCGAGCCGTCAGCGCCCCAGCAACCCCGGCCACTGCTGCTTTTGAAAGGGAACATGAAGGCCTTCGATCTGTCAGTTATCCTGGTCCAGGTGGATCTGGGACCCGGTTAGACCTGTGTTACGTTGCGGAGCGGATGCTGGCTCTACATCTTCCTGATAGAGACGCACATGCAGAGGCACAAGCCGCACACATGCTTAATAATAAACACGGAGAACATTATATGGTATTCGAAGTAAGTGGAAGTGATACGAGTGGCGATGGTCGAGTGGCTCGAGGAGTGTTCGGTCGCGCTCGGTCCCTGGGCTGGCCGGGGGACCTGGCGCCGCCGCTGGAGAGACTCTGCGCCGCCTGCAAACACATCGAGAGCTGGCTCGCGGCTCATCCGAAGAATGTCGCTATATTACTCGCTTGGGGTAACCGCGAACGTCTAGGAGTGCTGGTGGCGGCTTACATGCATTACTCCGCTATCTGTGGGGCGCCGGAGCACGCACTAGATCGATATGCGATGAGGAGATATTTGGACGACAGAGTACCGATATTCCACCTGCCTTCTAACAAACGATACATAGACACGTTCGCGGGTTTGCTCGCCGGGCAGATTCGCGTCAACGCTGCACCTCTACACCTGACGCACGTGAGCGTCGCGGGTTCCCTGGCAGCACCAACCACTCCGACCATCGCCTTCCTTAAGATCTATGAGAATTACAACTGCGTCTATACATCTGGTCTGTACATGGTGAATGGCGGTGGATGGACGGTGGGCGTCGGCCGGCTGGCTCTGCGCGGCGACGTGCTCGTCCGAGCGTACCGCCGGCCGGCTCACACCAACACACACACACAGCGCCACCTGGTGTTCGCCTGTCAGTTCCACACGTGCGCTGTCGCTGACCACACACTATCCTTCACTAAGCAACAACTTGACCACGCTGTGCACGATCCGTCATTTCCGTCGGACGGTGCTGTGGAGCTAATCTTTGCTCGGGGGGAAATGACACAGATGTTAGGAAGAGCGCCTCGTCCGCACATCCTCTTCCTGGGCCAGTATTTCGTAACAGTAGCCTTCTCCGGCGACTGTGATAACAACGGCAGCGCCGAGGGTTCGGGCTCCGGCGGGGAGACGGGTGAGGGGGGTGAGGCAGCCCATACGTTCGGACCTCTCGACGGGTCCATCTACGCGACGGTAGTGCGAGCGAGCGGAGGCCCATCCTCTCCGCTCAGCGCCTCCATGGACTCGGGCATCTCATCAGCGGGCCGCCGCGCTGCCCCCAGTCCACCCGATGAACTGGACGCGTTACTTGGAGATATGTTGAGAACTGTGAGCGCGCTGCCCGATCCGCCGCCAGCGCCGCAGTCGCACGCCGATCGTGCTCCTGATATACCGTATCACGCGCGCGCTGACTCTGCCCCATTCACGTACGGAGCTCCTGGTCTGAGACCCGGCATGCTGCGAGCCTCCAACCGGCTCGCTAGTCCTGAGTTGGTGCGGAGGGCTCTGGGCACCGACCGGAACTATAAGGGGATAGAAGATGATGATGACGACCGCATCCTCACCCCGGAACCTTCACCTCGCAACCCACTGTCACCACGCACAGTACGGAAATTTAGTCACGAAAATGTCACTACTACTACTGCTACTACTACTACAAGCATTCCTCCACCGACTTCGCCTCTACGTAACGGAAGATGGGCCAATGGTGATACGGAATGGATAGAGCGTCCGCCGAGTAGCGCAAGGAAGACTCCAATTGAGAACGGTACTCTGAGATCAAGCAGTACCTTAGGTTGGTACGAAAGCAATCGTTTTAGAGAACCGAGGAAATCTGAGGGTAACAATAATGTTGAAGCAACTTCCGGGCTCACGTGGTTACAAAGGCAACAGCAAAAGTTAAGAGAGAAAAAAGAAGCCAGGGAAAGAGTCGCTCGACTGCCGCTCGAGTGGGACGCACCTTCCCGACACGTGAGGCGATCAGCTAGCCATCGTGTGGACGGTTACACTAGCGATACTACAGCGTTTGCCGATGATGACGACGACTTTAGTGTACCCCTGCACGTCAACACACGTACTCTTAACAGGACTGATAGCATCAGCCCTCAGGCTCCAGACAGGACCTCATCTAGAAAATTCATGTATGAAAAGATGACGATGCGCGAGTGGAGTACTAACACAACACCGACGAGTACACAAGCGCCTGGTTTACTGTCGCTGGCGGAGCCGAACAACAACGATACCATTAGTCGAGAAAGGACAGAGAGCTGGTCTAGAAGCGAGTCCCGCGCGGGTACGCCGGCTTTTCCAACCCACCCCCGAACACCGTACCCTCCCACACCAACACCCTCGCTATCCGCTAGACCACCAAGATCACCCACCGTCTCCAGAAAAGAACGTGAAGGCAGCCCGGAGTCGGAATATCGTACATACAATGGCAGCGTCGGATCTCGGCGGTCGAGTGTGAGCGGCGGTGCGGAGCCCCAGCATGTGGCGCCTGACCGCGTGCGATTCGCGAGAGATACCAGTCACTACTGGTACAAGCCCAATATATCTAGAGATGACGCGGTGACAGCACTCCAACAGCTGGAAGAAGGTGCGTTTATAGTGCGTGATTCCAACTCCTTCCCCGGCGCCTTCGGTCTAGCTGTCCGTGCGGGAACGGGAGTCCGTCACTTCCTCATCGAGCCTACAGCCCGAGGAGTCCGACTGCGAGGGTGTCCCGATGAGCCTGTATTCGGGTCCCTATCAGCGCTCGTGTATCAACACACTGTTACACCCCTCGCCCTGCCTGTGCCACTCAAACTGCCTGACAGAGACCCGTGGACGGGCGGCGCGAGTGCAGCGGCGCGTGCGTTATTAGCTACAGGCGCGGCCTGCAACGTATTGCTACTGGGCTCTGAGAACACCGAGGCTCTCACCGGACCGGCCGCTGTCAAGCGAGCTGTACAGAACATATTGCAGAAAAAATCGCCAGCCCACGTGGTTCACTTCAAAGTATTCGGTGGCGGCATCACACTGACGGACGCGGCTAGGAAATTGTTCTTCAGGCGCCACTATCCGGCTACTGGTGTGTCATACGCCGGCATAGACCCTGACGAGCGTCGGTACAAATACGTGGACAATGGAACCCAGACCGAGAAACGTATCTTCGCCTTCGTCGCGCGCGCCTCTTCCGGCGCCGACAACCAGTGTCACGTATTCGCTGAGTTGGAACCAGAACAGCCAGCTACTGCTATTGTCAACTTCGTAAACAAGGCACTTCTCGGTAACACTCAGAAACAGGACATAATATAA

Protein sequence:

>DPOGS215834-PA
MRPRVKKESEAARALHRLAFALWRAAFYLQRGPSRAHTSKQGTLTRAVSAPATPATAAFEREHEGLRSVSYPGPGGSGTRLDLCYVAERMLALHLPDRDAHAEAQAAHMLNNKHGEHYMVFEVSGSDTSGDGRVARGVFGRARSLGWPGDLAPPLERLCAACKHIESWLAAHPKNVAILLAWGNRERLGVLVAAYMHYSAICGAPEHALDRYAMRRYLDDRVPIFHLPSNKRYIDTFAGLLAGQIRVNAAPLHLTHVSVAGSLAAPTTPTIAFLKIYENYNCVYTSGLYMVNGGGWTVGVGRLALRGDVLVRAYRRPAHTNTHTQRHLVFACQFHTCAVADHTLSFTKQQLDHAVHDPSFPSDGAVELIFARGEMTQMLGRAPRPHILFLGQYFVTVAFSGDCDNNGSAEGSGSGGETGEGGEAAHTFGPLDGSIYATVVRASGGPSSPLSASMDSGISSAGRRAAPSPPDELDALLGDMLRTVSALPDPPPAPQSHADRAPDIPYHARADSAPFTYGAPGLRPGMLRASNRLASPELVRRALGTDRNYKGIEDDDDDRILTPEPSPRNPLSPRTVRKFSHENVTTTTATTTTSIPPPTSPLRNGRWANGDTEWIERPPSSARKTPIENGTLRSSSTLGWYESNRFREPRKSEGNNNVEATSGLTWLQRQQQKLREKKEARERVARLPLEWDAPSRHVRRSASHRVDGYTSDTTAFADDDDDFSVPLHVNTRTLNRTDSISPQAPDRTSSRKFMYEKMTMREWSTNTTPTSTQAPGLLSLAEPNNNDTISRERTESWSRSESRAGTPAFPTHPRTPYPPTPTPSLSARPPRSPTVSRKEREGSPESEYRTYNGSVGSRRSSVSGGAEPQHVAPDRVRFARDTSHYWYKPNISRDDAVTALQQLEEGAFIVRDSNSFPGAFGLAVRAGTGVRHFLIEPTARGVRLRGCPDEPVFGSLSALVYQHTVTPLALPVPLKLPDRDPWTGGASAAARALLATGAACNVLLLGSENTEALTGPAAVKRAVQNILQKKSPAHVVHFKVFGGGITLTDAARKLFFRRHYPATGVSYAGIDPDERRYKYVDNGTQTEKRIFAFVARASSGADNQCHVFAELEPEQPATAIVNFVNKALLGNTQKQDII-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: