MonarchBase - Protein-coding gene

DPOGS202447
Transcript	DPOGS202447-TA	5388 bp
Protein	DPOGS202447-PA	1795 aa
Genomic position	DPSCF300174 - 249562-266877
RNAseq coverage	3426x (Rank: top 4%)

Annotation
*Heliconius*	HMEL015647	0.0	46.16%
*Bombyx*	BGIBMGA009970-TA	0.0	50.40%
*Drosophila*	Zasp52-PF	9e-93	77.40%
EBI UniRef50	UniRef50_UPI0002063F43	3e-118	53.11%	UPI0002063F43 related cluster n=1 Tax=unknown RepID=UPI0002063F43
NCBI RefSeq	XP_001975468.1	7e-105	44.69%	GG22334 [Drosophila erecta]
NCBI nr blastp	gi\|350408295	2e-120	49.26%	PREDICTED: hypothetical protein LOC100744292 [Bombus impatiens]
NCBI nr blastx	gi\|350408295	8e-124	46.21%	PREDICTED: hypothetical protein LOC100744292 [Bombus impatiens]

Group
Gene Ontology	GO:0005515	4.1e-26	protein binding
	GO:0008270	2.9e-18	zinc ion binding
KEGG pathway	isc:IscW_ISCW009899	8e-35
	K05760 (PXN)	maps->	Chemokine signaling pathway
			Regulation of actin cytoskeleton
			Leukocyte transendothelial migration
			Bacterial invasion of epithelial cells
			Focal adhesion
			VEGF signaling pathway
InterPro domain	[1-101] IPR001478	4.1e-26	PDZ/DHR/GLGF
	[1740-1793] IPR001781	2.9e-18	Zinc finger, LIM-type
	[153-178] IPR006643	1.4e-09	ZASP
Orthology group	MCL25674		Lepidoptera specific

Nucleotide sequence:

>DPOGS202447-TA
ATGGCACAGTTGATAACTGTGCGACTGAACAAGTCCGATCAGCAGCCTCTTGGCTTCAGGCTGCAGGGCGGCAAGGATTTCGGCACTCCGCTGGTTGTACAGAAGGTGAACGGTGGGAGTGCGGCTGAGCGGGCGGGTTTGCAGGCTGGGGATGCGCTCATTCGAGTCAACAATACTGACGTGTACTCCCTGAGACATCAAGAGGCACAGGACGCTATACGCGCTGCTGGCGGGAATCTGGAACTGACTGTGCAAAGAGGTGGTGGTACGTGGCGTCCTACCGTCACTCCTACTGGAAGCCTCCCTCGCCCGGGATCTCGTCCACTGGGTGCCGCCCCCGCTCCAGTCACCAGCACCTCTCTGAAGGCGACCCCTCAACCTTCGAGGGCCTTCGGTTCTGGTCACAACAACGTCGCCAAGCCGTTTGGATATATGAATGGCAACGATTCAGTGAAGAGCATTGTCAACAAACAGTACAACACACCTGTTAGTATGTACAGCGACAAAACTATCGCTGAGACACTCTCCGCCCAGACCGAGGTTCTTGCGGGCGGTGTTTTGGGAGTGAACTTCAAGAAGAACGAAAAAACTTACGACGCTGAAAAAAGTGCTGTATTCAAGGTGTTGCAAGAGGCTGAAAACGATCCTGAGCCAGTATCTGAGGCGAGCCCGGGGGCGACGACCCCTGTGAGTGGTCTCCGTCACGTGTCCGCGCCCGTGGCCCGCGACACGCCCGTCAACACCGGGGGCCTGCCCACGGGACAGAACATCTGTGAGGACTGCGAGCGACTTATCACGTCAGCAGAGGCGCCTCGGTTCCTGCCGTCTTCGAGGCTGGCTCACTTGGCGCCCGAGGCCCCCCACCGGCCCAGCATCCCACTGGGCTGTTCTCGCGTGTTGTCGGACGGCCGCGTGGCGCTGGGCCCCCCCCAGCCGCCCCACGGTCCCCTCAACGCCCCCACCGAGGCCCCGCACTGCTCCGAATGTAACGGCCACATCGTGGGTGTGTTCGTACGTATCAAGGACAAGAATTTGCACGTGGAGTGCTTTAAGTGCGCCACGTGCGGTTCCTCGCTGAAGAACCAGGGTTACTACAACCTGAACGGGAAGCTGTACTGCGACATCCACGCCAAGCTGGTTGCGAGACAGAACCCGCCCGCACCGAACTTGGAACCCGTCACTGTAGCTCCCGGTGGCCGCGTGCCGACGAACGCTTACTCGACTCCGCTGCCACCGCTGTCCACCAACAACTACACCAACGGATCATCATCGATGTTTAGCCCATCTAGTAATCTGTCTGGTCCGAAGCCGTTCGGTTCGTCCCTGGGCACGTATTCTCCGTCGTCGTTGTCTCCTCGCTCGGCGCCGCTCTCTCCCCGGACACCAAACTCTGCACCTGCACCTGCACCTGCACCGGCCCCTGCACCACAACACGCGTTCGCACCAACCAAAAACGTCAAAAGCATTGTGTGGCCCCCTCCTAATCCCTCAGAAGATGAACCCGAAAGTGAACTTAATGTAAATTGTAATCAAACCTCATTACACAGTGATTTCACTTCTTTGTCTGAAGAAACAATAACACAAAATACCAACAATAGAAAAATAACTGCTAATGAAATAAAGACTACGGATTCATCTATAACTCCGTTGTTGCAAACAATGGAGTTTTCTTCAAACGCCTTATTTGATACGACGCAGATGGCGTCGTCTACCATAAAATCACAAACCGCTGTTCAGAAGCAACGATCTGAGATTAAACAAGAATTTTCAAGTTGCACCGTTCAATCGTACTCACAGCAAGCTTCTGATTGCAAACAATTTTCTGTCTATCAAAATGTTGTGGCACCAGAAGAAATGAATAAGAGAAATAACACCATGGAAAAATCACGACTTGAACATAGTTCAAATGTCGTGCAATCTAAATTTAAGACGGGAGAGAGTGTGTCTCAAAACTTTCCTCCTCTCAATGCAAATACTTCAAACACAAAAATGCAGCCATGTTGGAATAAAGTAAGCGATAATAAAATACAAACTAAAGAAAATCCAATGTCATCAAAAGTGACACAATCAGGTGTTAAGGCACCCGAATCTAAGAAGTCTATAAGTGGAAAACCCCTGGCTGGTACAGCAAAAACCAATACTTTGCAAAGAGGATCCCTGTTAGAAGCCCTTACTATAGCTCCAGATCGACCATACAGTCCATTATCGTTTCATATACCAACAGTGCATTACAATAAGTTTCAATCCGGAGAATACCAGCCTTTGTCATCTGAAGCTGTGCCATCACTATCGTTTTCGGAATGTAGTCAATCTAATCAATCAAATCAAACTTCAGAACAAAGTGCAATACAAAATTCTGGAATTTTGCAATCAACAGCAGCAACTTCAGCATTCAAACCGGTGTGCAAACAAACGTTTCCACCTCCAAAACCACAAGAATTATCGTCACAACCTTTTTCTAATTTAAGTAACCAAAGCAGTGGTTATAAAGATTTCTCTCAATCAAAACAGGAAACAGTACAGGAGTTTAAACTGTCACAAAATAAAATGCAACAACATGAATCCTCTATTTCTACAACTGCTTTACCCAGATCAGAGGGTATTCCACAATATCAACAAGTTCTAGTACCAGAAGTATATAACCCAGAGCAGCAAAAGTCTTTCACGCCATGCAACCCAACAAATAAAGTCGCTAAAACGGACAGACCGATGACTTTCCAACCAGTTGTAGATGAAACATCGCTTAGAATATCACCTGCTCGGAGCCGTCCAACAACACCAGGTATGATCAATAAGCCGGCTCCCATAATACCTCATTATCAAATGAATTTAGTTTCTATTGAGCATCAAGCTCCAGAAAGCCGTTTATACAAACCTGGTAGTGCTGAAGTCAGTCGTTCTTCAACTCCCATAGCACGATGTCATTCTCCGGCACCTGGGCCTCCAGCTAATCCTCTAAAGGCACAAGCTCCCAGAATAAAACAAACATCTCAATCTACCTTTGAACAAGCACAATCTTGCAATAAGCAATTGTCAAACATCCGAAAAGAACACGAGATGTCAGGACCAGAGTTACAATCTCAGATGTCATCGTTTAGTCCTTCAGATTTAAAAACTTATAACCCGAATCAACCCACGGTTATAAAAGACGAAAGACAAGCAAATGTAGAATATCGCACGGAAAATTATAGTCAAGGTGATCTGAATATAAAAGAAGACTCTATGTTAAATCAGAACTACGGCGAAAAACAAACAGAATTTCAAAATATAAGTGAATATGGCGACACTACCGTTCAGACTACAAAAAAAACCTTCGAAGAATACGAAAGCTCACAATCCGCTAAGGTTATAGAAATTCACAAGGGCGATTCACAAACTTACTGTTTAAATCAGCCGATTGATTCTAATACGCAACCATATAATTCTAACTCCAAGCAGGTGTTCCCCCCTCCTCTTTCAACCATGACTCCAACCCAACAAAACTTACTTCGTACTAATGACAGTGTTGTCAATGCTAGTAAACGATCAGAAATGTATCAACCAACTCCTTTTATATCTGGTGCTAACCAAGGTCCAGTGTGTGATCCTACCCCATCAACAGGTTCCAGTGTAGGAGCTGCGGCTCGTGGTAAAGCTTTTGGCGTTTCATCAGCTCCAAAACGTGGCAGGGTTAATGAATGTCAAACAGCGAACAATCTACACCGAACCGATTATAAAAGTCCGGCTGAAGAACGGCTAATACGAAAAATGGCAAAAATGGCCCTCAACGGCTATGAAATTGGAATTCAGAGAAAAATAAAACCAGCCGACCATATACAGTCCATGGCTGACAAAATTCAAGATACGGTGGTTACAAAACATCCTCTCAACACCGACACCATACCTTCTGCTGATACTAGTCGTGATAATACTTTGAAACGATCAGTAAACAAGAAGTTTGAAAATAATTTGAAATCCATTGATTATACGCCTCTGAAACCAACCAATGGAAGCTACTTACCAAACAGTAACGGGACAAATAACACGTTCAACAATACACATACACCCATCCCTCCACCTCTTCCAACAACTCCGGTGCCAACATTTCAAGTGCACAGCACGCCTATCACAAATATATTGAATAGCATTGTACCACAGAATTCAGAGTACAATAACGCTATTAAGAACAATATCTATGACGAATCCACGTTTAATGAGAAAACTCAAAATGGTGGTTATTCAAGCAATGACGATTCAATTAAAAGCAAATCAGAAAATATTTTTGACAGCATCTCCAAAAAGAAAACGGCTTTCGAAAAAGTTACGGATGATTCGAATTCTTCAAATCATCATGATTTTAAAAATGAGTCTAAATCTGAAACAAATTATTCCAATACATTGAGCAAAAGAAGATTATTCGAGAGAAGCGACGCTTTCAATGAATCCTTGACAAAAAATACGCAGAGGAGTACGGAAAACAGTAAAATGTCACATCATGACAAAGAGATTCTAAATAAAAACAGTTACTCCAAAAATAATTTTACCCAAGAGTCCAAGATAACAAAGGAACAAGACGAGAACGACAAAAAACTACCGAATGATCTAATTGATGATTCTTTGTATAATTTTAAACCAGTGCTTAACGGAGGCGCTTCGTGTAGTAGCAGTAACAGTGGTTACAGTGGAAACAGTAGCGGGAGTCGGAGCAATGGGATCAGTAACAAACAGGAAAAGGATTCAGACGGTTACTGCGAAGAAGTTGTTGTAAAACGCAGACAGAAAAATAATAGAAACGACAACGGCCGTAGAGATTCCCGAATCGTCGCGAGACCATTGAGTACCATGACCTCAGAGGATGTGACCGACGGGCAATACATTTGTCATGTATGTGACAAGGCCATTACCAGGGGTCCGTTTATTACCGCGTTGGGTCGTATTTGGTGTCCTGAGCACTTCGTTTGTGTTAGCGCATCCTGCCGACGTCAGTTGCAAGACATTGGCTTCGTGGAAGAAAATGGCCAACTATACTGCGAGTTCTGCTTCGAGCAATACATCGCCCCTCCTTGCGACAAGTGTCATAACAAGATAAAACAGGACTGCCTGACCGCTATCGGCAAACGCTTCCATCCAGAATGCTTCAACTGTGTATACTGCGGCAAACTGTTCGGGAACAGTCCGTTCTTTGTAGAAGACGGTCTGCCATATTGTGAAGCAGATTGGAACGAGCTGTTTACGACCAAATGTTTCGCTTGCGGTTTCCCCGTGGAGGCCGGCGACAGGTGGGTGGAGGCGCTCAACAATAACTACCACAGTCAGTGCTTCAACTGCACGGTGTGCAAGAAGAACTTGCAAGGGCAGAGCTTCTTCGCCAAGGGAGGTCGACCTTTCTGCAAGTCTCACGCCCGCTAG

Protein sequence:

>DPOGS202447-PA
MAQLITVRLNKSDQQPLGFRLQGGKDFGTPLVVQKVNGGSAAERAGLQAGDALIRVNNTDVYSLRHQEAQDAIRAAGGNLELTVQRGGGTWRPTVTPTGSLPRPGSRPLGAAPAPVTSTSLKATPQPSRAFGSGHNNVAKPFGYMNGNDSVKSIVNKQYNTPVSMYSDKTIAETLSAQTEVLAGGVLGVNFKKNEKTYDAEKSAVFKVLQEAENDPEPVSEASPGATTPVSGLRHVSAPVARDTPVNTGGLPTGQNICEDCERLITSAEAPRFLPSSRLAHLAPEAPHRPSIPLGCSRVLSDGRVALGPPQPPHGPLNAPTEAPHCSECNGHIVGVFVRIKDKNLHVECFKCATCGSSLKNQGYYNLNGKLYCDIHAKLVARQNPPAPNLEPVTVAPGGRVPTNAYSTPLPPLSTNNYTNGSSSMFSPSSNLSGPKPFGSSLGTYSPSSLSPRSAPLSPRTPNSAPAPAPAPAPAPQHAFAPTKNVKSIVWPPPNPSEDEPESELNVNCNQTSLHSDFTSLSEETITQNTNNRKITANEIKTTDSSITPLLQTMEFSSNALFDTTQMASSTIKSQTAVQKQRSEIKQEFSSCTVQSYSQQASDCKQFSVYQNVVAPEEMNKRNNTMEKSRLEHSSNVVQSKFKTGESVSQNFPPLNANTSNTKMQPCWNKVSDNKIQTKENPMSSKVTQSGVKAPESKKSISGKPLAGTAKTNTLQRGSLLEALTIAPDRPYSPLSFHIPTVHYNKFQSGEYQPLSSEAVPSLSFSECSQSNQSNQTSEQSAIQNSGILQSTAATSAFKPVCKQTFPPPKPQELSSQPFSNLSNQSSGYKDFSQSKQETVQEFKLSQNKMQQHESSISTTALPRSEGIPQYQQVLVPEVYNPEQQKSFTPCNPTNKVAKTDRPMTFQPVVDETSLRISPARSRPTTPGMINKPAPIIPHYQMNLVSIEHQAPESRLYKPGSAEVSRSSTPIARCHSPAPGPPANPLKAQAPRIKQTSQSTFEQAQSCNKQLSNIRKEHEMSGPELQSQMSSFSPSDLKTYNPNQPTVIKDERQANVEYRTENYSQGDLNIKEDSMLNQNYGEKQTEFQNISEYGDTTVQTTKKTFEEYESSQSAKVIEIHKGDSQTYCLNQPIDSNTQPYNSNSKQVFPPPLSTMTPTQQNLLRTNDSVVNASKRSEMYQPTPFISGANQGPVCDPTPSTGSSVGAAARGKAFGVSSAPKRGRVNECQTANNLHRTDYKSPAEERLIRKMAKMALNGYEIGIQRKIKPADHIQSMADKIQDTVVTKHPLNTDTIPSADTSRDNTLKRSVNKKFENNLKSIDYTPLKPTNGSYLPNSNGTNNTFNNTHTPIPPPLPTTPVPTFQVHSTPITNILNSIVPQNSEYNNAIKNNIYDESTFNEKTQNGGYSSNDDSIKSKSENIFDSISKKKTAFEKVTDDSNSSNHHDFKNESKSETNYSNTLSKRRLFERSDAFNESLTKNTQRSTENSKMSHHDKEILNKNSYSKNNFTQESKITKEQDENDKKLPNDLIDDSLYNFKPVLNGGASCSSSNSGYSGNSSGSRSNGISNKQEKDSDGYCEEVVVKRRQKNNRNDNGRRDSRIVARPLSTMTSEDVTDGQYICHVCDKAITRGPFITALGRIWCPEHFVCVSASCRRQLQDIGFVEENGQLYCEFCFEQYIAPPCDKCHNKIKQDCLTAIGKRFHPECFNCVYCGKLFGNSPFFVEDGLPYCEADWNELFTTKCFACGFPVEAGDRWVEALNNNYHSQCFNCTVCKKNLQGQSFFAKGGRPFCKSHAR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: