MonarchBase - Protein-coding gene

DPOGS208117
Transcript	DPOGS208117-TA	2706 bp
Protein	DPOGS208117-PA	901 aa
Genomic position	DPSCF300154 - 97019-101049
RNAseq coverage	2777x (Rank: top 4%)

Annotation
*Heliconius*	HMEL012268	92.93%
*Bombyx*	BGIBMGA006770-TA	87.49%
*Drosophila*	Ect4-PI	66.79%
EBI UniRef50	UniRef50_D6WZH3	68.99%	Putative uncharacterized protein n=1 Tax=Tribolium castaneum RepID=D6WZH3_TRICA
NCBI RefSeq	XP_394430.3	75.65%	PREDICTED: similar to Ect4 CG7915-PB, isoform B, partial [Apis mellifera]
NCBI nr blastp	gi\|380030235	75.83%	PREDICTED: LOW QUALITY PROTEIN: sterile alpha and TIR motif-containing protein 1-like [Apis florea]
NCBI nr blastx	gi\|328779741	74.85%	PREDICTED: LOW QUALITY PROTEIN: sterile alpha and TIR motif-containing protein 1 [Apis mellifera]

Group
Gene Ontology	GO:0005488	1e-43	binding
	GO:0005515	1.2e-17	protein binding
	GO:0031224	1.2e-13	intrinsic to membrane
	GO:0007165	1.2e-13	signal transduction
	GO:0004888	1.2e-13	transmembrane receptor activity
	GO:0045087	1.2e-13	innate immune response
KEGG pathway
InterPro domain	[275-557] IPR011989	1e-43	Armadillo-like helical
	[271-581] IPR016024	6.5e-27	Armadillo-type fold
	[558-639] IPR010993	1.2e-17	Sterile alpha motif homology
	[566-633] IPR001660	9.4e-15	Sterile alpha motif domain
	[566-631] IPR011510	6.6e-14	Sterile alpha motif, type 2
	[706-864] IPR000157	1.2e-13	Toll-Interleukin receptor
	[558-635] IPR013761	3e-13	Sterile alpha motif-type
Orthology group	MCL13667		Single-copy universal gene

Nucleotide sequence:

>DPOGS208117-TA
ATGGCTTCTCGTCTAGTCGCATGGACCAGTAGGATATTCCGTCGCGGCGGTTCGCCGGGGGCGGTGAGCTCATTATCTCAGAGCGGTTATCGTTTACCGCACCATGCTCGTGTCAGTCATCGTTTGACCGCCGTGCGTGCCAGCACGCGGAAGTCAATTATTGCGCATGCGCCTTTGGGTACACGAATAGACGGCTTTAAATATAGAAACGGAATGTCTAACGGCGCGGGTTCGGCCCCGTGGCCGGTACACAGAAACGTCCTGTCGCGTTTCCCCCCTAAGCCGACGTATCCTTCGGAAAAGCGTTCTCTACAAGCGGGGGAAGTATCAGCTCAGGAGGCGAATAACATGTCCGCGACCAGTTCGAGATTACAAACGGAGGCTTTCAGTGCTGAGAAAAAGGCGATGGCATCATCACAGGCGAGACAGACGTTCACTTCCAGTGGAATTTTCAGTCACAAAGAACATTCAAGCGTCGCTCACTCCAACATGACCATATCCAGCAAGAATCTTAGCACTAAATCAACATTACTATCGTCTCAAATGAGTCAGCTGTTGAATGGGACAGTGAAACCGGGAGACGAAGACCTCTCCAACCTAACATTCGAAGATTTAGACAAATTGGATGCTAAGTCGAATCAGAAGGACGTAGATTTAGCGATTCAAAAATATTCACACAGGATGAACGCTTTCATAACGGCCATAAAAAATAATCAGATAGACATGAAAAACGCCTGCGTCCACTTCATGAAGTTAAACGAGATGGTCAAAAGAGCATGGGCTGTGCCTACATACGGCCATGAGTTAGGGTACTCGTTGTGCAACACGCTGAGATCGTCCGGCGGTTTGGACATTTTGATGGCGAACTGCTTGGAATCCAATAACCCGGATCTTCAATTCTGTTCCGCTAAACTATTGGAGCAATGTCTCACCACTGAAAATAGAGATCATGTAGTGCAAAATGGTCTCGAAAAAGTCGTTAACGTGGCCTGTGTGTGCACGAAGCATTCGAATTCAGTCGATCACTCAAGAATAGGTACTGGGATCTTGGAGCATTTGTTCAAACACAGCGAAGGTACTTGCAGTGATGTTATCAAGCTGGGAGGTTTAGACGCCGTTCTGTTTGAATGTAGAAAAAATGACGTGGAAACTCTGAGGCACTGCGCAACAGCTCTGGCGAACTTATCACTATACGGCGGCGCTGAAAACCAGGAAGCGATGATAAAAAGAAAAGTACCCATGTGGCTGTTCCCTCTAGCCTTCCACAACGACGACAACATCAAATACTACGCGTGTTTAGCCATCGCTGTTTTGGTAGCCAACAAAGAAATAGAAGCAGCCGTCTTGAAATCCGGAACCTTGGATCTGGTTGAACCCTTTGTTACTTCACACAACCCGTCGGAGTTCGCCCGATCAAACCTAGCGCACGCTCACGGTCAGAGTAAGAACTGGCTTCAAAGATTAGTCCCGGTTTTGAGTTCAAAGAGGGAAGAAGCGAGGAACCTGGCCGCCTTCCACTTCTGTATGGAGGCTGGTATTAAAAAGCAGCAAGGGAATACAGAGATATTTAGAGAAATAGGAGCTATAGAATCCTTAAAGAAAGTAGCCAGCTGTCCGAATGCTGTTGCGTCGAAATACGCAGCGCAGGCTTTAAGACTAATTGGAGAAGAGGTACCACATAAACTGTCCCAACAAGTACCTTTGTGGTCGATAGAGGACGTCAGGGAGTGGGTCAAACAAATAGGCTTCTCTGAATACGCGAACAATTTCTATGAAAGTAGAGTAGATGGTGACCTTTTGTTACAAATAACTGAAGCTAATCTCAAAGAAGACATAGGTTTAAATAACGGAATCAAACGTAAAAGATTCACGCGAGAACTTCAGCAATTAAAAAAAATGGCGGACTACAGTTCACGTGACACGGGGAGCCTTAACGAATTTCTACAGAGCATTGGTCCAGAATACACGATATACACGTATTCAATGTTGAATGCTGGTGTCGACAAGGAATCCATCCGTGGCCTGAGTGACGAACAGCTGGAAAATGAATGCAGAATAGGCAACAGTATACACCGGCTACGAATACTGAACGCTATACGAGCCTATGAAAGCACATTGCCTAGCAAAGGCGAAGAGAATATGGAGAAGAATTTGGACGTTTTCGTTAGTTACCGGAGATCAAACGGCTCACAGTTGGCCAGTTTGTTGAAAGTTCACCTACAACTGCGAGGTTTCACCGTTTTCATAGACGTGGAGCGATTAGAAGCTGGGAAATTCGATAATAATCTCCTCCAGAGTATACGCCAGGCGAAGCATTTCCTTCTAGTGTTAACCCCAAACGCACTGGAGAGGTGCAAACATGATAATGAACAAAAAGACTGGGTCCATCGGGAGATAGTGGCAGCATTGCAGTCACAGTGCAATATAGTTCCAATTATCGACAACTTCCAATGGCCGGAACCGGAAGAGTTACCGGAAGACATGCGAGCCGTTTGTCACTTCAATGGCGTCAGGTGGATACATGATTACCAGGACGCCTGTGTCGAGAAACTTGAAAGTTTCCTACGCGGCAAGTCGAACTTAGCAACTCGTCTGGAGGGTCCGCTCCGCGGTCGGGACGTGCCCACTCCCGGGACAGCCGCCATGCGACCACCAAACTATCAACGTATGGTCTCCACTGAGAGCAGGGGCAGTGATAAAGATTGA

Protein sequence:

>DPOGS208117-PA
MASRLVAWTSRIFRRGGSPGAVSSLSQSGYRLPHHARVSHRLTAVRASTRKSIIAHAPLGTRIDGFKYRNGMSNGAGSAPWPVHRNVLSRFPPKPTYPSEKRSLQAGEVSAQEANNMSATSSRLQTEAFSAEKKAMASSQARQTFTSSGIFSHKEHSSVAHSNMTISSKNLSTKSTLLSSQMSQLLNGTVKPGDEDLSNLTFEDLDKLDAKSNQKDVDLAIQKYSHRMNAFITAIKNNQIDMKNACVHFMKLNEMVKRAWAVPTYGHELGYSLCNTLRSSGGLDILMANCLESNNPDLQFCSAKLLEQCLTTENRDHVVQNGLEKVVNVACVCTKHSNSVDHSRIGTGILEHLFKHSEGTCSDVIKLGGLDAVLFECRKNDVETLRHCATALANLSLYGGAENQEAMIKRKVPMWLFPLAFHNDDNIKYYACLAIAVLVANKEIEAAVLKSGTLDLVEPFVTSHNPSEFARSNLAHAHGQSKNWLQRLVPVLSSKREEARNLAAFHFCMEAGIKKQQGNTEIFREIGAIESLKKVASCPNAVASKYAAQALRLIGEEVPHKLSQQVPLWSIEDVREWVKQIGFSEYANNFYESRVDGDLLLQITEANLKEDIGLNNGIKRKRFTRELQQLKKMADYSSRDTGSLNEFLQSIGPEYTIYTYSMLNAGVDKESIRGLSDEQLENECRIGNSIHRLRILNAIRAYESTLPSKGEENMEKNLDVFVSYRRSNGSQLASLLKVHLQLRGFTVFIDVERLEAGKFDNNLLQSIRQAKHFLLVLTPNALERCKHDNEQKDWVHREIVAALQSQCNIVPIIDNFQWPEPEELPEDMRAVCHFNGVRWIHDYQDACVEKLESFLRGKSNLATRLEGPLRGRDVPTPGTAAMRPPNYQRMVSTESRGSDKD-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: