MonarchBase - Protein-coding gene

DPOGS210910
Transcript	DPOGS210910-TA	2295 bp
Protein	DPOGS210910-PA	764 aa
Genomic position	DPSCF300045 - 76267-103682
RNAseq coverage	153x (Rank: top 53%)

Annotation
*Heliconius*	HMEL015815	3e-138	80.80%
*Bombyx*	BGIBMGA003093-TA	3e-128	70.79%
*Drosophila*	spir-PA	1e-70	39.09%
EBI UniRef50	UniRef50_B4KLF8	5e-111	36.31%	GI22759 n=8 Tax=Coelomata RepID=B4KLF8_DROMO
NCBI RefSeq	XP_002090799.1	1e-126	38.53%	GE13304 [Drosophila yakuba]
NCBI nr blastp	gi\|195484700	2e-125	38.53%	GE13304 [Drosophila yakuba]
NCBI nr blastx	gi\|223634699	5e-127	39.36%	RecName: Full=Protein spire

Group
KEGG pathway	dya:Dyak_GE13304	3e-126
	K02098 (SPIR)	maps->	Dorso-ventral axis formation
InterPro domain	[527-605] IPR011011	4.9e-11	Zinc finger, FYVE/PHD-type
Orthology group	MCL10622		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS210910-TA
ATGAGTGTGTTATTCCTGCAGCGTTGTATATGGCACTGCGGCGGTGGAAGTGGTCGTTTGGCTCGTGAGACGGCCGCTGGTCACTACCGCGCCGTCTGCCGGGCGCTGGTCGCCGAAGCCCTCGAGCTGGCCTCGTTCCTGGCCCGTGTTCGTGTCACAGGAGCCAGGGACCTCGGAGCCGCTGAGGACTCCGCCACTCATCTCGACACTCTGCAGTTCTCAGATTGGGCGCGGTTCTGGATGCAAGTTATCGGAGAGTTGCGAATGGGAGTGAAACTGAAGAAGGTTAACTACTCACGGACGCCAATAGAATATGAATTGACTCCATATGAAATCCTCATGGACGATATAAGGTCGAGGCGGTATACGTTAAGGAAAGTTGATGGCGCCATACCTCAGAATGTTAAGAAGGACGCACACGCAATGATACTCGAATTTATTAGAAGTAGACCGCCGCTCAAGAAGGCATCAGAACGCAAGTTGGCCCCGGTCCGTCGCGAGGTGACTCCAAGGGAACAGCTGCTAGCTTCCATACAACTCGGGAAACAGTTGCGACCTACGACGCAATCCAGGAGTATATTCAAGCTGCGGCGGTCGCGGGTTTCTCCGGCAGCTTTGCTGCTGGGGTCACGACCTGTCTCGGGGCTCGTAGAACCGATCCGGAGTCCCGAGGAGCCCGCGCTGGATGTGGCCCAGGACAAGTCTTATTGGGGCAGCGTCGCAACCGCTACGTCAACTACTAGTGGTTCAGGCAGCGGTGCCGGTGGTGGCGAGTCTCGTAGAGGAGATGTGACGCCACACGCACCGCCACAGAGACGACTCATTAAAGTTGATTTTGACAATCTCGAGGATGACGAAGACGAAGACGACACAGAGACTTGTGTCAGTCCTGAAACCTGCCCGCCCCAGCCCTTCCCGAGGCACACCATCAAACAGACACCGCCGAAACCATGGAAGAGAACCGGTTGGTATCACCACCTACGACCTGGCTACCCAATGTCCCTCCCGAAGAGCGTCCATGCGTCGCCACACAATAACACACGCACATGCGTGCCCCGCGACCGACGGCGCACAGTCACTGCCACATTCGAGGATGACGAAGACGAAGACGACACAGAGACTTGTGTCAGTCCTGAAACCTGCCCGCCCCAGCCCTTCCCGAGGCACACCATCAAACAGACACCGCCGAAACCATGGAAGAGAACCGTGTCCGTGGATACGCCGCGGGCTCCTCCCCGCGCGCGCATCTCACACGACGAGTACCATCAGTTTTTCGACGAGACCCTCGAATCCTACGACCTGGCTACCCAATGTCCCTCCCGTCGAGCGTCCATGCGTCGCCACACAATAACACACGCACACGCGTGCCCCGCGACCGACGGCGCACAGTCACTGCCACATTCGAGACCGGGTTCTCGTGCGTCCTGCGCAGGGGCGTCGCTCAGCAGTGACGACGCTCAGCTGAATGAGTTGTCGTGGTCCCGAGCCTCGCTCCAGGACGAGCTGATCAAGTCGGTTAGTGACAGCCCTACCAGCACGCATAAGCAATGGCAGGACGCGATTATATCAGACGAGCGTCTCTCGCTAACGCTAGAGGAGATCGTCCACATCAGATCTGTGCTGACGAAGGCTGAGCTAGAGGTTCTGCCGGTGGAGGGCAGGGTCAAAGAAGACGTGGAGAGACGACGGGTTTGTTTTCTGTGCCTGAAGACGAGGTTCGGCATCTTCGGTCCTTGGGGTCAGAAATGCAAACTGTGCAAGAAGACCGTCTGTCAGAAATGTTGTTCCAAGATGCGTATCCCGACGGAACACTTCGCGCACGTCCCCGTTGCGTTGTTGTCGCCGTCCTTGCTCCCCTCCCCCGACGAGGAGACCGCCTTCCCCCGCTCGCTGATGGCGCGGCTCGTGTTGCCCGAACACGCGGCGTCGGTAGAGAACAGTGTAGGCTCGGCCCCCAGCAGCCCGGGCTCGCGCCGCATCACGTCAGCCCCGGGCTCCCGCGGCGCCTCCGCCCTCGGTTTCTCGGACTCCTCCGGCGGCCCCGGCAGCATGCCCTGTGTCTCAACACCGCTATCCACATTCTCCACATTCGATCGCAGAGCGAGATACGGTCGCAGTGCGGGTTCGGGCGCGGCGGAGAGACTGCGAGGCGTGCAGATGGCAGTCTGTCACGACTGTAAGGCGATGGTGCTTCAGATCATAAAATCCTCGCGCGCCGCCCGCTCCGCTTCCCGCGACCGCGCGCTGCGACACCTCACCCTGGACCTGGCGCCCGTATACACCGCGGACTGCTAG

Protein sequence:

>DPOGS210910-PA
MSVLFLQRCIWHCGGGSGRLARETAAGHYRAVCRALVAEALELASFLARVRVTGARDLGAAEDSATHLDTLQFSDWARFWMQVIGELRMGVKLKKVNYSRTPIEYELTPYEILMDDIRSRRYTLRKVDGAIPQNVKKDAHAMILEFIRSRPPLKKASERKLAPVRREVTPREQLLASIQLGKQLRPTTQSRSIFKLRRSRVSPAALLLGSRPVSGLVEPIRSPEEPALDVAQDKSYWGSVATATSTTSGSGSGAGGGESRRGDVTPHAPPQRRLIKVDFDNLEDDEDEDDTETCVSPETCPPQPFPRHTIKQTPPKPWKRTGWYHHLRPGYPMSLPKSVHASPHNNTRTCVPRDRRRTVTATFEDDEDEDDTETCVSPETCPPQPFPRHTIKQTPPKPWKRTVSVDTPRAPPRARISHDEYHQFFDETLESYDLATQCPSRRASMRRHTITHAHACPATDGAQSLPHSRPGSRASCAGASLSSDDAQLNELSWSRASLQDELIKSVSDSPTSTHKQWQDAIISDERLSLTLEEIVHIRSVLTKAELEVLPVEGRVKEDVERRRVCFLCLKTRFGIFGPWGQKCKLCKKTVCQKCCSKMRIPTEHFAHVPVALLSPSLLPSPDEETAFPRSLMARLVLPEHAASVENSVGSAPSSPGSRRITSAPGSRGASALGFSDSSGGPGSMPCVSTPLSTFSTFDRRARYGRSAGSGAAERLRGVQMAVCHDCKAMVLQIIKSSRAARSASRDRALRHLTLDLAPVYTADC-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: