MonarchBase - Protein-coding gene

DPOGS214451
Transcript	DPOGS214451-TA	1050 bp
Protein	DPOGS214451-PA	349 aa
Genomic position	DPSCF300441 - 28913-31530
RNAseq coverage	2235x (Rank: top 5%)

Annotation
*Heliconius*	HMEL007793	2e-53	69.87%
*Bombyx*	BGIBMGA009619-TA	2e-154	72.77%
*Drosophila*	Socs36E-PB	5e-76	75.45%
EBI UniRef50	UniRef50_E3XBE5	1e-77	74.58%	Putative uncharacterized protein n=1 Tax=Anopheles darlingi RepID=E3XBE5_ANODA
NCBI RefSeq	XP_001605682.1	1e-76	67.49%	PREDICTED: similar to suppressors of cytokine signalling [Nasonia vitripennis]
NCBI nr blastp	gi\|312372886	4e-77	74.58%	hypothetical protein AND_19522 [Anopheles darlingi]
NCBI nr blastx	gi\|156544712	9e-74	67.49%	PREDICTED: hypothetical protein LOC100122078 [Nasonia vitripennis]

Group
Gene Ontology	GO:0005515	5.7e-33	protein binding
	GO:0035556	4.9e-10	intracellular signal transduction
KEGG pathway	nvi:100122078	4e-76
	K04700 (SOCSN)	maps->	Jak-STAT signaling pathway
InterPro domain	[177-301] IPR000980	5.7e-33	SH2 motif
	[288-331] IPR001496	4.9e-10	SOCS protein, C-terminal
Orthology group	MCL13892		Single-copy universal gene

Nucleotide sequence:

>DPOGS214451-TA
ATGGGACAGCAGACGTCGAGGAAGAGCGGGGAGTGTAGCTGCGGCTGCGGCGCCTGGGAGAGACGGAGAGAGGGAGACTCGCCCAGCAGTGTTCATAGATACGTGAGTGCAGTCACGGACAGATGGAGCGGGCGAGAGTGCGCGTGTCGCCGGAGACGGTGGAGGCGCCCGGCCTGTGTGTGCACCGCCTACAGACGAGTCAGCGACGCCTGCCACGACGATAGACTAGCGGCCGTCCTTACACTGGGAGCGAGAGATCTCAGGAGAGAGCTGGACGCCATAGTCATTAACACAGACGGTGACACTGGCAGAGACCATGGGGAGCCCACAGCTGAGGTCTATGTCCTGTCCGTCGGTCCGAGGAGTGACACAGACTCCACCCCCGAGGGTCGAGCTACTGAGCTGGTGCAGGCCAGCGATCAGTCTATAAGGAGGTTCCAGGTGGTGTGTGGCGGCGAGCTCCGCGCGCTTCTCCTCCGCTGCCCGCTCCCGCCCGCCCTCGTGCCGCCCACTGTACACACACAGGTCGACTACAAACACTGTCTAGTGCCGGACCTGCAGGAGATCACGGCTTGCTCGTTCTACTGGGGGAAGATGGACCGCTATGAGGCGGAGAGACTCCTGGAAAACAAGCCCGAGGGCACGTTCCTGCTCCGCGACTCGGCCCAGGAGGAGCACCTGTTCTCGGTGTCGTTCCGTAAGTACGGCCGGTCGCTCCACGCCCGCATCGAGCACTACCAACATCGGTTCAGCTTCGACTCTCACGACCCCGGGGTGTTCGCCGCCCCCACGGTCACCGGTCTCATAGAACACTACAAGGACCCGGCCTGCGTGATGTTCTTCGAGCCGATGCTGACGGCTCCTCTGCCGCGCAGCTCTCCTTTCTCTCTGCAGCAGTTGTCGCGGGCGGTGATCGTCTCTCACGTGAGCTACGACGGCGTGGAACACCTCCCGCTGCCGGCCCGCCTGAGGGCCTTCCTCAAGGAGTACCATTACCGGCAACGCGTCCGCGTCCGCCGCCTGGAGAGCGACTCGTACGAGCGAGCCTAG

Protein sequence:

>DPOGS214451-PA
MGQQTSRKSGECSCGCGAWERRREGDSPSSVHRYVSAVTDRWSGRECACRRRRWRRPACVCTAYRRVSDACHDDRLAAVLTLGARDLRRELDAIVINTDGDTGRDHGEPTAEVYVLSVGPRSDTDSTPEGRATELVQASDQSIRRFQVVCGGELRALLLRCPLPPALVPPTVHTQVDYKHCLVPDLQEITACSFYWGKMDRYEAERLLENKPEGTFLLRDSAQEEHLFSVSFRKYGRSLHARIEHYQHRFSFDSHDPGVFAAPTVTGLIEHYKDPACVMFFEPMLTAPLPRSSPFSLQQLSRAVIVSHVSYDGVEHLPLPARLRAFLKEYHYRQRVRVRRLESDSYERA-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: