MonarchBase - Protein-coding gene

DPOGS208594
Transcript	DPOGS208594-TA	3642 bp
Protein	DPOGS208594-PA	1213 aa
Genomic position	DPSCF300052 - 429960-442567
RNAseq coverage	26x (Rank: top 77%)

Annotation
*Heliconius*	HMEL016591	0.0	62.29%
*Bombyx*	BGIBMGA013376-TA	0.0	56.95%
*Drosophila*	CG33978-PA	6e-30	49.52%
EBI UniRef50	UniRef50_D6WYX0	4e-134	43.13%	Putative uncharacterized protein n=2 Tax=Tribolium castaneum RepID=D6WYX0_TRICA
NCBI RefSeq	XP_001810762.1	9e-135	42.97%	PREDICTED: similar to CG33978 CG33978-PA [Tribolium castaneum]
NCBI nr blastp	gi\|270012570	1e-133	43.13%	hypothetical protein TcasGA2_TC006727 [Tribolium castaneum]
NCBI nr blastx	gi\|270012570	1e-132	42.97%	hypothetical protein TcasGA2_TC006727 [Tribolium castaneum]

Group
Gene Ontology	GO:0005509	1.6e-07	calcium ion binding
KEGG pathway	dpo:Dpse_GA28528	8e-07
	K02599 (NOTCH)	maps->	Dorso-ventral axis formation
			Notch signaling pathway
InterPro domain	[817-851] IPR013091	1.4e-08	EGF calcium-binding
	[817-865] IPR001881	1.6e-07	EGF-like calcium-binding
	[706-796] IPR000082	6.6e-06	SEA
Orthology group	MCL16585		Insect specific

Nucleotide sequence:

>DPOGS208594-TA
ATGGATGGATCTATTCCACATTCCACAACCGCCTCGGGAGCATTTAATACAAATGCTATAGTCTATGACAACTCGCCATGGAGACCGGGAAGAGATGTGGAACCGGAAAGAGGAGAAGATGAAAGGAAACTAAAAAATCTAGCTACCAGAATTATGTCCAACGGAGTAGAGGTTTTGGTTAAGGACAGAAGCGCAGAGGAGAAACAGGAACAGACAAGATACTCGGACGTGAAAACAATACAACCTTCAGCAGTTAGCAACAGTTTCGTAAATAATAATCCTAAAATTGATAAGAGAATTGACGATGATCATAATCATTTTGATCTGATAGAGCCGTCAGAGATGAGTCATACTTCATGCTCGACCTCTTGTACGTGCAGTCATATACAAACAGAAAGTTTAAAAACCAAATACACAAATGTTAAATCAAAGAGCACGAAATATAGCGGAACGAAAATTGATGTACCGCCTACCCATCTTTCATCTTACGATCATACAAAGTATCATCCTTACGAATATGAAACTAGTTCGCATGGACCACCCACTGATAAAGTTGTAGAAAAATACACACAAGTTACTGATTACTCTGATGAAAACGATAGTAATTCATTGGACATGAGCGATTTGCTTACTAATGAACAAGCTCCTGAACCACCGAAAACTAAAAGCACAACATCAAAACCACCAGAAAAAAGCAAACCTGATAAGCCTCAGAAAGTTAATAAAAACAAGTTTGTTGTGGCTGAACTTATAAAATTAGGTTCACTGGGAATAAAAGGTTTATCACAATTAGCACCTGTGATCGAAAAAATGACCGGTGGATTCATGAGACGGCAGGAAACAAATAGAACGACTTCTACCACAACTACAGTGAAACCGATAAATAAAGTAGTAGGTTACAGTGCTAATAAGAGAGTGGATAATGAGGTAGAATCTAAACACAATAATTTTCCAATATATATTCCTGTTGATGAAATGGAAATGGCAGAATCTCAGATTGGTTACACTAATGTTACATTGCAACAAAATATTGCATGGGCTGCAGACCATAAAAATTCTAAAGTAAATCTTATGAAATCTAAAATAGTGCATGAAAGCCCTTTAGTTAATGGAGGTATACCTATAAGTCCAGGGGAAATAATTACCACCAATTCTGATGTAATTGTGGGAAAGCCTGCAGTTGGAGGTCCAGTATCTTTAGTAGGCACTGGAATGAAGTTACAAAATCAGGCACAGGCCCCAGACAATGCCGTTGCACACAGTGATATGTATAGCATTAAAGAGAAACCTCTAAATGATTACCCTATGGTCGGTACAAAAATCGATGATTCCTATGATTTAAGGCCACCAGAGTTACCCAAGCCTAATGCAATGGTAACTAAAAATGCAATACGACCACACGGAGCTCATTTTTCTCCACCTAATATTCATATTCCTTTACGGAACTCTGGAAATCTATATAAATCTAGCGAACATAGTGGTCAAATAAGTTATAGTAAGGATAAATCACCCAATTTAGTTTATCATGGACGTCCATCTATTTTAGATTATAAACCATCTTTCACAAATAGTGTGAAAAAACCTTTTGAAAATAAATCAACAAATAAAGAAAACGATCAACAAGAAATACCTGATAATAATCCTAGCTCCTCAGAAATCGTCAGTACTCATATTATGACGGATGGACAAGGGACCGATTTCGAAATTGTAGGTGCAATGAATAAACCTTTATTAGTCGATATACAGCCTTCAAAAGTTGCTAATGTACTGATACCTCATGGCAGTTCAACCGCACTAGTATTTGCGGGATCTGCAGAGCCCCATAAAACTGGTGATTATGTTGATGATCCTTTACCATATCCAGAACCTGGTTATTTTGGAAGTTTTAGCATAGATGCACCTCATATGACAAATGTACATAATGTTGCAAGCTACGGAAAAGAATGTCAACCAGATTGTAAGGCTTCGAGAAATGAAAGATGCCAGAGGATCGATAGTGTTATGAAGTGCGTGTGCAGACCAGGCTTCGCTAGAATGTTCCCAGATCGACCGTGTAAACCAACGTATACGTACTCCGTAAGATTAGGACTGGGGTCTAGAGATAACAAGGTGCTCAAATTCCATAAAAGTCTATCGGACAATTCTACTAAAGAATATGAGAGTTTGTCATTGGCTACTCATGAAGGAATAAATCGAATGATTATGCAATCAGACTTAAGGGATGTTTATCACGGAGTCCACATAACAGGATTCCATCCTATTGAGATGAGAACAAAAGACGGAGCCTATCAGGGTGTTATCAATGATTTCTACGTCCAGCTTTCCGATAACGCCCATGAAAGTAGACTGAAGGAAGTGATAGAGAAATATCTACGGAATAATAACTATAGCCTTGGTGGAACAGAAGTTTATGCATCTGAAGAATTTATTGAAAGCCTTAATGTCAGCGATTTCGACGAATGCACGAGCACTCAGTTCAATGACTGTTCCGAACACGCCCGCTGTTTCAACCTTCGCGGAACTTACACTTGCAGTTGTTTAGAAGGTTTTGCGGACCTCAGTGTCAACACTCTATACCCTGGGAGGATATGTTCTTCTGACGCAATAGGCTGTGCAGGCTGCAACTATCATGGCACGTGCTTCGATCGTGAGAACGCGATGATTTGCGAATGTTTCAAGTGGTACGCGGGACGAACTTGCCAGGTCAATTTGAAAGCTGTTTTGATAACAGTCACCGTGGTAGGGGCGCTGGTCATCATAGTGGTGACGATCTGGGCGTCGAAGAGATGCTGCAGTCAGAAGAATCCCACGAATCAAACGTTTGTTATAGGTTGCATGCAAGGAATGCCAAGTTTACATCAGGGTAACGTACCATCAAAGCAGAGAGCTGACAGACGAGCATTAATTGCTGAAAGAAATGAAACAGCAGAGACATGTAGCGTGCAAAATGCTTCACTACCTTACGCGCCGTCAAAATCTCGGTCGCGATCACACAGTAAGCAGGCGCCGGAGCCTCCTCCTCACTCCCCACCTCCGCCGCCCGCCCTAATGATACCACGTGCAAGACTACATCCACTACATGACAGTCGCGATAATTTGTCACGTAGGAAGAGTAGCGAAGTGTGTAACGAAGCTAAACTTATCAGTTACTTGGAATCGGGAGCGACAAACACTCAGGAGATGCGGAGAAAACACAGCATTGAATCATCGTACAGTGTAAATAAAGAGAGAGCTAATAAACAAGGTGCACTTGTATCAGCTGGTTATAAAGTTTCAACGACCATTCGTCCAGACGAGAACTCAATCAAATGTGAAAGGGACGACACTTCGTCCATCAACAAAAATGATTTAGAAGCCGAGCTGTCACGCTTCGACACACTTCGCAAGTCTTATAGTCAAGAAGATATGTCAGAATGGACGGATGCTGAACGTCGTATTGGGGAGTTGACTTTATCTGAAGCTAGATCGGTCGGGGGAACTCTTCCAGCGAGCACTGGCAGAGCTGCTTCATCCACCAGACTCACGCATCAGGAAGCCAACACCATGGCGGAACGAGACTTAGGCTCCACTTTTCTCCTGCCGCACGTGCACCTCTATAAACCAGACCTTACCAGTGACGTGTCCGAGTTCGACTCCCTGTGA

Protein sequence:

>DPOGS208594-PA
MDGSIPHSTTASGAFNTNAIVYDNSPWRPGRDVEPERGEDERKLKNLATRIMSNGVEVLVKDRSAEEKQEQTRYSDVKTIQPSAVSNSFVNNNPKIDKRIDDDHNHFDLIEPSEMSHTSCSTSCTCSHIQTESLKTKYTNVKSKSTKYSGTKIDVPPTHLSSYDHTKYHPYEYETSSHGPPTDKVVEKYTQVTDYSDENDSNSLDMSDLLTNEQAPEPPKTKSTTSKPPEKSKPDKPQKVNKNKFVVAELIKLGSLGIKGLSQLAPVIEKMTGGFMRRQETNRTTSTTTTVKPINKVVGYSANKRVDNEVESKHNNFPIYIPVDEMEMAESQIGYTNVTLQQNIAWAADHKNSKVNLMKSKIVHESPLVNGGIPISPGEIITTNSDVIVGKPAVGGPVSLVGTGMKLQNQAQAPDNAVAHSDMYSIKEKPLNDYPMVGTKIDDSYDLRPPELPKPNAMVTKNAIRPHGAHFSPPNIHIPLRNSGNLYKSSEHSGQISYSKDKSPNLVYHGRPSILDYKPSFTNSVKKPFENKSTNKENDQQEIPDNNPSSSEIVSTHIMTDGQGTDFEIVGAMNKPLLVDIQPSKVANVLIPHGSSTALVFAGSAEPHKTGDYVDDPLPYPEPGYFGSFSIDAPHMTNVHNVASYGKECQPDCKASRNERCQRIDSVMKCVCRPGFARMFPDRPCKPTYTYSVRLGLGSRDNKVLKFHKSLSDNSTKEYESLSLATHEGINRMIMQSDLRDVYHGVHITGFHPIEMRTKDGAYQGVINDFYVQLSDNAHESRLKEVIEKYLRNNNYSLGGTEVYASEEFIESLNVSDFDECTSTQFNDCSEHARCFNLRGTYTCSCLEGFADLSVNTLYPGRICSSDAIGCAGCNYHGTCFDRENAMICECFKWYAGRTCQVNLKAVLITVTVVGALVIIVVTIWASKRCCSQKNPTNQTFVIGCMQGMPSLHQGNVPSKQRADRRALIAERNETAETCSVQNASLPYAPSKSRSRSHSKQAPEPPPHSPPPPPALMIPRARLHPLHDSRDNLSRRKSSEVCNEAKLISYLESGATNTQEMRRKHSIESSYSVNKERANKQGALVSAGYKVSTTIRPDENSIKCERDDTSSINKNDLEAELSRFDTLRKSYSQEDMSEWTDAERRIGELTLSEARSVGGTLPASTGRAASSTRLTHQEANTMAERDLGSTFLLPHVHLYKPDLTSDVSEFDSL-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: