MonarchBase - Protein-coding gene

DPOGS207335
Transcript	DPOGS207335-TA	2184 bp
Protein	DPOGS207335-PA	727 aa
Genomic position	DPSCF300188 - 119367-125680
RNAseq coverage	218x (Rank: top 45%)

Annotation
*Heliconius*	HMEL002203	0.0	83.82%
*Bombyx*	BGIBMGA010110-TA	0.0	75.84%
*Drosophila*	Med-PA	4e-93	89.33%
EBI UniRef50	UniRef50_D6W7L5	3e-123	82.81%	Medea n=8 Tax=Coelomata RepID=D6W7L5_TRICA
NCBI RefSeq	XP_971429.2	1e-124	82.81%	PREDICTED: similar to Xsmad4a [Tribolium castaneum]
NCBI nr blastp	gi\|189233891	2e-123	82.81%	PREDICTED: similar to Xsmad4a [Tribolium castaneum]
NCBI nr blastx	gi\|198451145	0.0	57.32%	GA14643 [Drosophila pseudoobscura pseudoobscura]

Group
Gene Ontology	GO:0005515	3.4e-92	protein binding
	GO:0006355	2.9e-73	regulation of transcription, DNA-dependent
	GO:0005622	2.9e-73	intracellular
	GO:0007179	4.6e-59	transforming growth factor beta receptor signaling pathway
	GO:0005667	4.6e-59	transcription factor complex
	GO:0003700	4.6e-59	sequence-specific DNA binding transcription factor activity
KEGG pathway	tca:660074	3e-124
	K04501 (SMAD4)	maps->	Pancreatic cancer
			Colorectal cancer
			Pathways in cancer
			Wnt signaling pathway
			TGF-beta signaling pathway
			Adherens junction
			Cell cycle
			Chronic myeloid leukemia
InterPro domain	[1-723] IPR013790	0	Dwarfin
	[499-704] IPR001132	6.7e-113	SMAD domain, Dwarfin-type
	[494-720] IPR017855	5.1e-98	SMAD domain-like
	[463-719] IPR008984	3.4e-92	SMAD/FHA domain
	[27-136] IPR003619	1.1e-61	MAD homology 1, Dwarfin-type
	[10-138] IPR013019	4.6e-59	MAD homology, MH1
Orthology group	MCL13926		Single-copy universal gene

Nucleotide sequence:

>DPOGS207335-TA
ATGAATACGACGGCGCCAACCTCGGCAGATGCATGCCTAAGCATTGTCCACTCACTGATGTGCCATAGGCAAGGTGGTGAGAGTGAAGGCTTTTCAAAGCGGGCTATTGAGTCACTAGTCAAGAAATTGAAAGAAAAGAGAGATGAACTTGATTCTTTGATCACAGCAATCACCACAAATGGTGCCCATCCCAGTAAATGTGTTACTATTCAGAGAACTCTAGACGGTCGATTACAGGTTGCGGGAAGGAAAGGATTTCCCCATGTGATATATGCTCGCATATGGCGTTGGCCCGATCTACACAAGAATGAATTGAAACATGTTAAATTCTGTCAGTTTGCTTTTGATCTGAAATGTGACTCGGTGTGTGTTAATCCATACCATTATGAAAGAGTTGTATCTCCAGGTATTGATCTTTCTGGGCTGACTCTTCAGTCGGGTCCTAGTAGGTTAGTAAAAGATGAGTATACAGCTGGTCTGAGCGGGAATGGCATGGACATGGATACTGGAGAACTCGTAACAATCCAGCACCATGCCACAAGCCCCAGACATCATCACTCCACCATTCCCCATCACCATCAACAGTTCCAGACCTCTAACATTATAATAAATCAAGGACAAACGCCAGATGGCGTTGCCAATATGTTTTCTGCTACTCATGGACCTCGACCGCAAATTCGAGCTGGAGCACCTATGGTTCCACAAATGGTACATTCGCCAGGGGCGCAAATGATGGCTAATCATCAGGGACAAATGGCGGGCGCACCTCAAATGGGTCCGGGAAACCCACAAATGGGTCCCGTTAACCCACAAATGGGGCCTGGAACGCCACAAATGGGTCCAGGCACTCCTCAAATGGGGCCGGGAACACCTCAAATGGGTACAAACGTCCCACAAATGGCTTCACCAAGAATGGCGTCAGCTCCCACCCAAATGTCCCCAGGAACCCCACAAATACCAAATATAAGTCAGGGAATGTCAATACCGAGCCCACAACAAATGGCAATGGCACAACAAAGAACTATAGCCCCAAAACTAGAACCGCCCGATGCTATGGATGCAAGAGCTATGTGGCTGCCAAAGAGAATGAATCATCCTTCAATGCCTGTCAGTATGTCTCCCGGTGGGACGACGCCGTTAATAGACGGCTCCAATAATGCATTCTTTACAAACGAGCAGACTTCTACGGATACTCAAATGACTCAGACCATGCCAGCTGGGAGTCAATCGGTGTCAGCTGTGGTGCCAGTGACGTCATCAGCTATGCCAAGTGAAGCCCAGAATGGTTTCGCCGCGACCAGCCCACCACCACAACCCAGTCCTATACCACATCGCACCCAACATCAACAGGGCACCTGGACCGGGAACAACACCTTGACTTATACACAGAGCCTGGCGCCGCCGCCCGCCGCTCCTATGCAGGATGTACCCACTCACCACCATCACTACTATAATGGCAACCCAGGTGGTTTATTGTCAAGCCAGCCAGCTCCGGAGTATTGGTGTTCGGTGGCTTACTTTGAGCTGGATACTCAAGTGGGGGAAACATTCAAAGTGCCATCCAGCAGACCAAACGTTACGGTCGATGGTTATGTGGATCCGTCGGGTGGCAACAGATTCTGTTTGGGTGCTCTCAGTAATGTACACAGAACTGAACAGAGTGAAAGGGCTCGACTCCACATCGGCAAGGGTGTACAGTTGGATCTCCGTGGTGAAGGAGACGTGTGGCTGAGATGTCTCTCAGATCACTCGGTGTTTGTGCAGTCCTACTACTTGGATAGAGAGGCAGGCCGGGCCCCGGGAGACGCTGTTCATAAGATATACCCATCAGCATGTATCAAGGTGTTCGATCTCCGTCAGTGTCACCGTCAGATGCAAACGCAGGCGGCTACAGCCCAGGCGGCGGCGGCAGCGCAGGCTGCAGCTGTCGCAGGACACATACAGCCAGCACATCCGGGAATGAACAAATGTTTGTCAGCGGCGGCTGGTATCGGCGTGGATGATCTTCGGAGGCTGTGTATAGTCCGTCTGTCGTTCGTGAAGGGCTGGGGGCCAGACTACCCTCGCACCTCCATCAAGGAGACGCCCTGCTGGGTTGAGGTCCATTTACATAGGGCTCTACAGTTACTGGACGAGGTGCTCCACACTATGCCCATAGATGGTCCTCGGACTAGCATCGAGTAG

Protein sequence:

>DPOGS207335-PA
MNTTAPTSADACLSIVHSLMCHRQGGESEGFSKRAIESLVKKLKEKRDELDSLITAITTNGAHPSKCVTIQRTLDGRLQVAGRKGFPHVIYARIWRWPDLHKNELKHVKFCQFAFDLKCDSVCVNPYHYERVVSPGIDLSGLTLQSGPSRLVKDEYTAGLSGNGMDMDTGELVTIQHHATSPRHHHSTIPHHHQQFQTSNIIINQGQTPDGVANMFSATHGPRPQIRAGAPMVPQMVHSPGAQMMANHQGQMAGAPQMGPGNPQMGPVNPQMGPGTPQMGPGTPQMGPGTPQMGTNVPQMASPRMASAPTQMSPGTPQIPNISQGMSIPSPQQMAMAQQRTIAPKLEPPDAMDARAMWLPKRMNHPSMPVSMSPGGTTPLIDGSNNAFFTNEQTSTDTQMTQTMPAGSQSVSAVVPVTSSAMPSEAQNGFAATSPPPQPSPIPHRTQHQQGTWTGNNTLTYTQSLAPPPAAPMQDVPTHHHHYYNGNPGGLLSSQPAPEYWCSVAYFELDTQVGETFKVPSSRPNVTVDGYVDPSGGNRFCLGALSNVHRTEQSERARLHIGKGVQLDLRGEGDVWLRCLSDHSVFVQSYYLDREAGRAPGDAVHKIYPSACIKVFDLRQCHRQMQTQAATAQAAAAAQAAAVAGHIQPAHPGMNKCLSAAAGIGVDDLRRLCIVRLSFVKGWGPDYPRTSIKETPCWVEVHLHRALQLLDEVLHTMPIDGPRTSIE-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: