MonarchBase - Protein-coding gene

DPOGS214325
Transcript	DPOGS214325-TA	1821 bp
Protein	DPOGS214325-PA	606 aa
Genomic position	DPSCF300020 - 633597-645676
RNAseq coverage	430x (Rank: top 28%)

Annotation
*Heliconius*	HMEL005634	0.0	80.07%
*Bombyx*	BGIBMGA003997-TA	0.0	78.60%
*Drosophila*	Su(var)2-10-PI	2e-123	64.63%
EBI UniRef50	UniRef50_D6WTG2	6e-129	58.43%	Putative uncharacterized protein n=4 Tax=Neoptera RepID=D6WTG2_TRICA
NCBI RefSeq	XP_001647820.1	1e-129	62.22%	sumo ligase [Aedes aegypti]
NCBI nr blastp	gi\|157142113	2e-128	62.22%	sumo ligase [Aedes aegypti]
NCBI nr blastx	gi\|385259116	8e-138	79.68%	PIAS2 protein [Bombyx mori]

Group
Gene Ontology	GO:0008270	1.9e-18	zinc ion binding
KEGG pathway	tca:662854	3e-129
	K04706 (PIAS)	maps->	Small cell lung cancer
			Pathways in cancer
			Ubiquitin mediated proteolysis
			Jak-STAT signaling pathway
InterPro domain	[303-351] IPR004181	1.9e-18	Zinc finger, MIZ-type
Orthology group	MCL10734		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS214325-TA
ATGAGTAGATATTACGATTACGGTAACGCGATATCATGGAACAGCCAAGCGTTGTCTTCGGGCGGGCCCGGCAGCGCTCAGGGCAAGGATCCCCTGGCCCCGGCGATATCGGGTTCGAGAGCCATGTACCAACATCCGGCCGTCAGCGGATACAATCCACAAGACTCGCGATCACAGACCATGCCCGGCACGGCGCGGCAGAACCCTTTGTACGCGGGCAGTATGTACCACTACAGCGGCTCGGGCGCCACGCTGGCCCCCATGCCGTCCCCGTCACCCACCGCGCCACTGCCGCCCTTCCCAGTGCATCCTGACGTCAAGTTTAAGAAATTACCTTTCTACGATGTGTTGGCGGAACTGATGAAGCCGTCTACAATGATGCCGATGCAAGCTGGTCGCATGCAGGAGGGCACCTTCATCTTCCACCTCACGCCGCAGCAGGCCACTGAGATAGCATCAGGGAAAGACATCGTTGGCACCAGCAATAAACTCGATTATGTTATACAGGCGCAATTGAGGTTCTGCCTTCTAGAAACTTCATGCGAACAAGAGGATTATTTCCCACCTAGTGTTAATGTTAAAGTTAATAATAAGATGTGTCCGTTACCAAACCCAGTACCTACTAACAAACCTACTCCGGAGCCAAAGCGGCCGCCGCGGCCTGTGAATATATCGTCTCTCGTGAAGTTGTCTCCTACAGTAGCCAACACTATCCACGTGACGTGGGCGGCTGATTTCACACGAGCGTACGTCCTCAGCGTGTTCATGGTCAGGAAGCTAACGTCAGCGGAGCTGTTGCAGAGGCTGAAGAATAAGGGAACCAAGAACCCAGACTACACGAGATCTTTGATTAAAGAGAAACTATCAGAGGACTACGACAGCGAGATAGCGACGACATCCCTCCGCGTGTCCTTAATGTGTCCGCTGGGAAAGATGCGTATGTCGTGTCCGTGTCGACCAGCGAACTGTCCACACCTGCAGTGCTTCGACGCCTCACTCTTCCTTCAGATGAACGAACGGAAACCCACGTGGCTCTGTCCCGTCTGTGACAGACCGGCGCCTTACGACTCTCTAGTCGTTGATGGGTACTTCCAAGAGGTTCTAACGTCGCCTCGCCTGGCCAGCGAGTGTAACGAGATCCAGCTTCACGCGGACGGCAGCTGGTCCGCCCACGCGCCCCCGCCCCGCGCCCCGCCGCCCGCCGCGCCCGCCGCCGAGCCCGTCACTCTCATATCCGACGACCTTGAAGTCATACCCGTGGATGGGAACAATTCAGCCAAACGCGCAGCTGTAGGAGACAGTCGTACTCCAAAAACTGCTGAAGTATTGGTCGATCTGACATCAGACTCGGAAGATGAACTGCCACTTAAGAGGAAAATACCACAACCGAAGAGCACCCCGCCAGCCTTAGATAACATTAAGACAGACGACAACTACACTACATCCAGTGCGGAGGCGGTGACATCTAGCGGCTACCGTTCCCCGGGCGGCGGAGCGGTCATATCCCTGGACAGCCCGTCTCCGCCCGCCCCGGCCTCCCCTCACACACACTCCCACGTTACCCACACGACACACACGACATTAGACGCGGTGTCGCCGAGATCGCTCTCTAGCGACATATGTACAAGTAACAACATTGAACGCGAGGAAAACGACTCCGCGCCAACACACTGGGCACCGTATGCTGACGCAGAGAGGGAAACACATGACACATACAGAAGGGGACACGTAGCGTTCCTCGCTTTGAGCAAGTTCCGCGGTCGTCCGCCGACTCGTTGCGGCGCTGACGTGCGATACGCTGAACTAGTGTTTCCACCGTGA

Protein sequence:

>DPOGS214325-PA
MSRYYDYGNAISWNSQALSSGGPGSAQGKDPLAPAISGSRAMYQHPAVSGYNPQDSRSQTMPGTARQNPLYAGSMYHYSGSGATLAPMPSPSPTAPLPPFPVHPDVKFKKLPFYDVLAELMKPSTMMPMQAGRMQEGTFIFHLTPQQATEIASGKDIVGTSNKLDYVIQAQLRFCLLETSCEQEDYFPPSVNVKVNNKMCPLPNPVPTNKPTPEPKRPPRPVNISSLVKLSPTVANTIHVTWAADFTRAYVLSVFMVRKLTSAELLQRLKNKGTKNPDYTRSLIKEKLSEDYDSEIATTSLRVSLMCPLGKMRMSCPCRPANCPHLQCFDASLFLQMNERKPTWLCPVCDRPAPYDSLVVDGYFQEVLTSPRLASECNEIQLHADGSWSAHAPPPRAPPPAAPAAEPVTLISDDLEVIPVDGNNSAKRAAVGDSRTPKTAEVLVDLTSDSEDELPLKRKIPQPKSTPPALDNIKTDDNYTTSSAEAVTSSGYRSPGGGAVISLDSPSPPAPASPHTHSHVTHTTHTTLDAVSPRSLSSDICTSNNIEREENDSAPTHWAPYADAERETHDTYRRGHVAFLALSKFRGRPPTRCGADVRYAELVFPP-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: