MonarchBase - Protein-coding gene

DPOGS212884
Transcript	DPOGS212884-TA	3669 bp
Protein	DPOGS212884-PA	1222 aa
Genomic position	DPSCF300333 - 55732-130026
RNAseq coverage	185x (Rank: top 49%)

Annotation
*Heliconius*	HMEL007553	6e-157	77.43%
*Bombyx*	BGIBMGA004844-TA	1e-133	69.95%
*Drosophila*	CG42843-PB	3e-46	35.76%
EBI UniRef50	UniRef50_D6X1A8	5e-54	24.52%	Putative uncharacterized protein n=3 Tax=Tribolium castaneum RepID=D6X1A8_TRICA
NCBI RefSeq	XP_001812113.1	5e-62	24.62%	PREDICTED: similar to CG31714 CG31714-PB [Tribolium castaneum]
NCBI nr blastp	gi\|345485727	3e-105	28.93%	PREDICTED: hypothetical protein LOC100123035 [Nasonia vitripennis]
NCBI nr blastx	gi\|345485727	2e-103	28.76%	PREDICTED: hypothetical protein LOC100123035 [Nasonia vitripennis]

Group
KEGG pathway	dre:30718	2e-12
	K02599 (NOTCH)	maps->	Dorso-ventral axis formation
			Notch signaling pathway
InterPro domain	[446-519] IPR013783	1.2e-10	Immunoglobulin-like fold
	[445-534] IPR013098	3e-07	Immunoglobulin I-set
Orthology group	MCL16382		Insect specific

Nucleotide sequence:

>DPOGS212884-TA
ATGTATTACGATGAATCGTATAAATTGGGTGAACGGAAAGCACTCACCGTTACGGAGGAGAACATCACTAGGAATAACTGGTTACAGGTACAAAGTCCAGTTCTCGTCGTCGAGCTTACCTTGAATAGACTAGAAGGTACGCAGCTGAGAGCTCTGGGTCTCCTCTCAGTTTTTGGGTTCAATATGACCTACATGGTGAGAGGACCCAATGATGAACCTGGTCCAAAGGCCTGCAGTACAATAGAATGTCGCCTTCTAGGACACTGTTATGCTAGATATGATTACAAGGAATTCTACTGCGATTGTTTTGAGGGTTACTCGGGAGCCGATTGCGGAGTTGGGCCTTTATGTCCGAAGACCCCCAACATGTGCAAAAATGGAGGCACCTGCGGTCAAATGGGTCCAGCTGCAGTAAGTTGCATCTGCGCGCCGGGTTTCACGGGTGATCTTTGCGAGTCTCAGATCGAAGCACCTGAGTCACCACCCCTGGCTGCTCTCTTGAATGAAGTGTTGCAAGGGGTTTTGGGGCAGTTTCTTGTACAAAGTCCAGTTCTCGTCGTCGAGCTTACCTTGAATAGACTAGAAGGTACGCAGCTGAGAGCTCTGGGTCTCCTCTCAGTTTTTGGGTTCAATATGACCTACATGGTGAGAGGACCCAATGATGAACCTGGTCCAAAGGCTTGCAGTACAATAGAATGTCGCCTTCTAGGACACTGTTATGCTAGATATGATTACAAGGAATTCTACTGCGATTGTTTTGAGGGTTACTCGGGAGCCGATTGCGGAGTTGGGCCTTTATGTCCGAAGACCCCCAACATGTGCAAAAATGGAGGCACCTGCGGTCAAATGGGTCCAGCTGCAGTAAGTTGCATCTGCGCGCCGGGTTTCACGGGTGATCTTTGCGAGTCTCAGATCGAAGCACCTGAGTGTGGCATAGAAGAATGTTCTGAAGGCTGCACGACAGGCGCTTGTGATTGCAATCCCAAAGATACCGACGTCTCTTCCGCTCGTTTTGAAACAAGGCTGCAAATAGTGGACCAAGGAAGTATAAACATATCTCAAGAAATTATAAAACAGATGACTAACTATTTAAGAGCTTCCAATATAACTTTACACGATGAAATTGAAGTTTTAAACATTAGTGCCCCTGACGCGCTGGGTGCACGTACAGTGTGGCTTCGTGTGTGGGCGGAACGGCGAGATGCAGGAGCGTTAAGGACTGCTCTAGCACGTTTAGCTGCCACTCGCACACGCACTGACAGGCTGCGCTTGCTGCCTGCTATGCTGCATTTCGATATGCAACCTGCTCTTAGTTTACACGCACTGATCGTTAACCAGCGTCAGGAAGTGTGGGAAGGATCTGAATTTATATTGAGCTGCATGGCGTATGGGTCCCCTGACATAACATTTACTTGGTATAAAGATGGGGTTAAAATAAACTTTAATGGAACTACAAGAGATATTTGGACTCGAACGGTAGCAGAAGATGCATTAGGAAGGCGTATGTCAGTATTGGGTATTTCTGAAGCTAAGAAACCTGATAGTGGTCGGTGGTCTTGTTCCGCTGATGATGCTGGGAGGAGACGGTGCAGTGCCCTGAGACTATCCATACTACGTCCTCCCGATATAAGACTAGTGCCTTCCATGTTAACTGTAAACAAGAGAGATAATGTAAGCATCACATGTCTTGCTGGTGCGAGTCGTGTACACGGTGTATTGGGATTTAGTTGGGCCCGAGAACGATCTCTGTTGCCACAGGCGCCCGGTCGCGAGGTTTGGGAGGATCTTTACCCAGCGGGAAGCGTGCTTAAGCTATATAATGTACAGAAATCTGGAGAATTCCGTTGTCAAGTATCGTCAGTAGCGGGTACGAATACTAAAGCCGTAACAATGTGGACTCTCGGTTCTAAAGACGAGGCGTGTCCGAGTGAAGCATCCCACGGTCTACGATGGCCCAAAACTGCACCAGGAGCTCACGCTGCAACAACCTGTCCACCTGGACATACTGGGGAATCAATTAGATTCTGCGAACCTAAAACTACCCAACACGGTGTGAAATGGGTCATACCGGATTTTTCTGGTTGTGTTGCGGATTCCTTAAACGACATTTATGAGCAGTTTACTAAAATCTCTTACGGTTATTCGTGGGCTAATGTTTCTCATGTGGCACATCAATACGGAGCAGTTCTCCGTTCACTTCCCGCTCAACCTGGAGAGGGTACTATTCCCTTAAAACATGCTAAGAATATGCTTAACTATCTCCTCTCCAATGCTGGTAAATTGAAGGATAGAAGGGAAAGTGTGAACCATCTACTCATTATATATGATACGTTGCTAAAGCATCCTGACGCTTTTTTAGATGAAGAAAAAATATACGATCTTCAAAATGCTATAGTTGAAACAGCAGGAATGCGTGATAACCTGGTTTCCGTGTACAAGGAGTTTGCCATAAATACTAAGCAAGCTAGAGAAGATGGCGCTGCTCACTTTAGTTTCACGCCAATTCCAGGATCTGAAGAATGGTTACTAACATCCGCTGGTGTAGAACTGGTTGGACGAAATGGAAATACGTCTGTGGTCGTTGTACAGTATCGAAACTTAGCTGCACGACTGCCATCATTGAGAAGATCTATTGAATTCAACTCATCGTCTTCTAGGGGTGGTCGAGAAGTGGAGTATGAGCTGGCGTCCGCACAAACACAACTTCACGCGCCAGGTTATGCTCACAACGGACATTCCACCACGTTGCTGTTTGTGCATTCAAAAAATTATTCAGCAATAGCATCAAAATTAGCCTGCGCATTAAGAACCCCATCAGAACCGCGGGTCTGGATAACGAAGGCTTGTGAGGTTCGTGTACCTGAGCCAACGCACGTGGCGTGTCGGTGTCGAGGTCTTGGTACTTTTGCGTTATTCACTATCGCCAGGTCTACCCTTTCAGACACAGAAAAAGACCTTCGCGGAATTGTCAAGATCACAGTAGGATTGAGTGGTACGATGAGCCTGGTGGCTGCTGCATTGCAGCTTCTCAGTCTTTTACCGGGGAAACGAGCACGGTTGCCCGTCTTGTTGCGAGCTGTCACTGCGGGCACCCATTCAGCAGCCATGCTTACCCTCCTAGAGTGTGACACCAGACAAGAGGAGGCTTGTCCTGGAGCCTTAGGGTGGGTATGCGCAGCATGCTGGTGCGCTGGTTGTGCAGCACTGTGTGCACAGCCACTGCTACTTCAAGCTGAGCTAGCAGGTCGGCGACAAAATGCTCCTTCTGTCGCACTTCTTGGAGGTGTATGCACCCTTGCTTGGTTGACTGCGCGGCTGTGGGGTGGGGCTCCTCTCCAGATCGGAGCGGCAGCGCAGGCCGTGTGCGCGGCCGGTTGCACGCTATTAGCCGTGTTGTGTTTCGCTCTAGCAATTTGTGCTGCTGTAAGATTGAGGACTATAACGCATAAAGTTCCAGTCGAAAGACGGACATATTTGAGAGATCGGCGGCGTGTTGTACGACATACAATTGCGGTATTAGTGACGACTAGCGCAGCGCAAGCGGCCGGTGTTTGGTGGGCACAACCGGGACCTCGGACCCTTGCTCTCGTTTTAACACTCTCTATCACCGCTCTTCTTAACGATCAATTTGGGAATATAATTTCTAGTATATATAAAACAAGGCGGTGA

Protein sequence:

>DPOGS212884-PA
MYYDESYKLGERKALTVTEENITRNNWLQVQSPVLVVELTLNRLEGTQLRALGLLSVFGFNMTYMVRGPNDEPGPKACSTIECRLLGHCYARYDYKEFYCDCFEGYSGADCGVGPLCPKTPNMCKNGGTCGQMGPAAVSCICAPGFTGDLCESQIEAPESPPLAALLNEVLQGVLGQFLVQSPVLVVELTLNRLEGTQLRALGLLSVFGFNMTYMVRGPNDEPGPKACSTIECRLLGHCYARYDYKEFYCDCFEGYSGADCGVGPLCPKTPNMCKNGGTCGQMGPAAVSCICAPGFTGDLCESQIEAPECGIEECSEGCTTGACDCNPKDTDVSSARFETRLQIVDQGSINISQEIIKQMTNYLRASNITLHDEIEVLNISAPDALGARTVWLRVWAERRDAGALRTALARLAATRTRTDRLRLLPAMLHFDMQPALSLHALIVNQRQEVWEGSEFILSCMAYGSPDITFTWYKDGVKINFNGTTRDIWTRTVAEDALGRRMSVLGISEAKKPDSGRWSCSADDAGRRRCSALRLSILRPPDIRLVPSMLTVNKRDNVSITCLAGASRVHGVLGFSWARERSLLPQAPGREVWEDLYPAGSVLKLYNVQKSGEFRCQVSSVAGTNTKAVTMWTLGSKDEACPSEASHGLRWPKTAPGAHAATTCPPGHTGESIRFCEPKTTQHGVKWVIPDFSGCVADSLNDIYEQFTKISYGYSWANVSHVAHQYGAVLRSLPAQPGEGTIPLKHAKNMLNYLLSNAGKLKDRRESVNHLLIIYDTLLKHPDAFLDEEKIYDLQNAIVETAGMRDNLVSVYKEFAINTKQAREDGAAHFSFTPIPGSEEWLLTSAGVELVGRNGNTSVVVVQYRNLAARLPSLRRSIEFNSSSSRGGREVEYELASAQTQLHAPGYAHNGHSTTLLFVHSKNYSAIASKLACALRTPSEPRVWITKACEVRVPEPTHVACRCRGLGTFALFTIARSTLSDTEKDLRGIVKITVGLSGTMSLVAAALQLLSLLPGKRARLPVLLRAVTAGTHSAAMLTLLECDTRQEEACPGALGWVCAACWCAGCAALCAQPLLLQAELAGRRQNAPSVALLGGVCTLAWLTARLWGGAPLQIGAAAQAVCAAGCTLLAVLCFALAICAAVRLRTITHKVPVERRTYLRDRRRVVRHTIAVLVTTSAAQAAGVWWAQPGPRTLALVLTLSITALLNDQFGNIISSIYKTRR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: