MonarchBase - Protein-coding gene

DPOGS214264
Transcript	DPOGS214264-TA	4785 bp
Protein	DPOGS214264-PA	1594 aa
Genomic position	DPSCF300014 + 1586228-1598746
RNAseq coverage	30x (Rank: top 76%)

Annotation
*Heliconius*	HMEL006399	6e-56	46.24%
*Bombyx*	BGIBMGA005982-TA	2e-142	47.78%
*Drosophila*	eys-PC	4e-166	34.20%
EBI UniRef50	UniRef50_D6WKS5	0.0	40.04%	Putative uncharacterized protein n=3 Tax=Tribolium castaneum RepID=D6WKS5_TRICA
NCBI RefSeq	XP_001658690.1	0.0	39.50%	crumbs [Aedes aegypti]
NCBI nr blastp	gi\|270006587	0.0	40.04%	hypothetical protein TcasGA2_TC010461 [Tribolium castaneum]
NCBI nr blastx	gi\|270006587	0.0	40.95%	hypothetical protein TcasGA2_TC010461 [Tribolium castaneum]

Group
Gene Ontology	GO:0005509	1.8e-10	calcium ion binding
	GO:0005515	3.3e-07	protein binding
KEGG pathway	bta:513730	3e-57
	K02599 (NOTCH)	maps->	Dorso-ventral axis formation
			Notch signaling pathway
InterPro domain	[567-782] IPR013320	2.8e-26	Concanavalin A-like lectin/glucanase, subgroup
	[825-1047] IPR008985	1.1e-24	Concanavalin A-like lectin/glucanase
	[896-1017] IPR012680	1.2e-11	Laminin G, subdomain 2
	[63-99] IPR001881	1.8e-10	EGF-like calcium-binding
	[879-1020] IPR001791	1e-09	Laminin G domain
	[66-99] IPR006210	3.3e-07	Epidermal growth factor-like
	[67-97] IPR006209	1.4e-06	EGF
Orthology group	MCL14729		Insect specific

Nucleotide sequence:

>DPOGS214264-TA
ATGTTTAAACTACTTAACAGAGGACATTTAAAGAGTACGTGGTGGTTACTAATTGTAATACCTATCGCATCCGCCGGCTTTGCCTGCCTTAATAATCCTTGCGTACATGGGATATGTATTGATGATATTAATAGCACATATTTATGTTATTGTATTGATGGATATACGGGTGTTCAATGCCAAACAAATTGGGACGAATGCTGGTCAAACCCTTGCCAAAACGGTGGCACTTGCATAGATGGTGTGGCATCTTACAACTGTTCTTGCCCGGATGGCTTCATTGGCGATAATTGTGAGACAAATTACAACGAATGCGATTCAAACCCCTGTTACAACAATGGCACATGCATTGACATGACTAACGAGTACGTATGTCACTGCATCCCCGGCTTCTCTGGAGATCACTGTGAGTTAGATGTAGCAGTGTGCAACTCGACGGGGGAGGTCAGGTGTCACAATGGAGGCGAGTGCATCGAGGGTCCCGGGTTCAAATTTTATTGCAAATGTGCCGCAGGATGGACTGGACACAAATGTGAAGACCAGATCGATGAATGCGAGTCGAATCCATGCAGGAATGGTGGCATATGCATCGACGCTCATGCTGATTACATGTGCGCGTGCACATACGGTTTCACTGGTAAAAGCTGCGAGGTAGCGATAGAGTTCTGCTCTCAGGATTCCTGCAGCGAGAAGGCGCTGTGTGTTCTGGAAGACGTGTTGCGAGTCTGCTACTGTGTGCCCGACTATCACGGGGAACGATGTGAACTACAGTACGACGAGTGCGCACTAGGACCAAGATGCCTGAACGGCGGGACGTGTATAGATGGCGTTGACAATTTCACATGCTCATGTCCACCAAGACTTACAGGACTTCTCTGCGAGTGTCTTATTTTGGATGACGGAAATTATGATTGTGAATATATTCGTCCAACTCTTCTACCAGACCATAGTACAGCCACTTCTTCCTTTACTGAAACCATAATAATAGACACAAGTACCATGGAATCGAAGTATAATTCAAGCACTACCACCACCAGCCTCAGTACTATCGATAGCGGCACCAGTATTGATGTCATTACTACGGACATGGCAATTTATACGAAACTAGATAATGTAACGGACATACCAATAACCGCTTCCAGTACAGACACAATAGTAACAGAAAATCTAACAACAAGCACAGAAATATCTGATATGACAACTGATTCATTGACTTCAACATCAATTTCAACATCTCGATCAACAACGAAAGAAGATTCGGTTACTGAAATAGTTACGATTCTGATAGAAACGAAAGGTACTATAGGAGCTGATGATTCTAAGACAGAAATAACAACAGAATGTAGTGGATCGTGTCCAAAAGGAAATTTTTCCACTAGTGATTTACCACCAACCACTATAACTTCAATAGAAACAACTGAAGGAATCACTACTTCCACAGAAATTACTAAACAAACAGCAACAGACACAACAGTTCAGACAACCGTTGATCTTAAAGAAACAACAAAGCAAATGACGTCAGATACCACAGAATATACTCATCAAGCACAAGACATGACAACAGAAAGAATGTTCACCGACAGTCCTGTTGAAACAACAGAACTTGCAACCGAATTAACCCATCCAATGACCGAAATCGAAACAAGTACAGGTTATAATCAAATTTCAACAGCACACTCAGATTGTACCGACGTCATCTGTAACAATCACGGCAGTTGTATAAACACTCTTCATGGCGTTAGATGTCACTGTTTGTTCAATTACGAAGGAAGATTTTGTGAGAGTAAAATTATTGTTAACTCGGCCGCCTTTGATGGCACTTCTTATATAGCGCATCATATAAAAAATTCTACCAGCATATCTATAGCATTCAAAGCCAAAACTCTAATCCTTGACGGGCAAGTTATGTACGTGGATATAGCTAAGGGCGCTTACATGAAATTGTATATGAATTCTGGCTTGTTGAGATTCGAATTCTCCTGTGGCTATCAGACAATGCTGCTAAGCGAACTTAAAACTCACCTTAACAAAGGATATATTATGAAAATTGAAACAAGATTAGATATATTCTTACCGGAAAATCATTGCAACGGAACCCTGAGACTTAACGACACTGTGGCTATGAGCGGCGGCCAGTTTGCAAATATTAGCTCTCCCGAGTATAATTCGATTCTCTATTTCGGGAACATACCTAATGCTAATAGAAATAACTCTAATGAGAAGTCTTTTATTGGATGTATCAAGGACTTAATTATAAACGACGAGAGACGTGAAATATTTAGCGACGCTTACGAAGCGTCTGAGGTGAGGGAATGCTCTTCTTTGTCTTGTTTGTCGTCGCCGTGTGTGAACGGTGGTACTTGCAATGATGACGACGATACATACTCCTGTGCTTGTGCCAATGGTTGGACCGGCGCCACTTGCAACGACTCCGTCTGCGACCACAACCCTTGTCAGTCCGGTGGAAGTTGTGTCCATCACCCCGGGAGCGGATTCCTGTGCCTCTGTCCATATGGCAGGCACGGCATATTCTGTGAATATAACGTGGAAATAACACGTCCGTCTTTATCGCCTATATCCCCTGGAAGGTCTTCCTACGTCTTGTATCCGATGTCACAGTCCGCAGCGAATTCTGATCGGTTTGAAATGCGTTTGCGTTTTCAAACGTCGGACATGGATCAGATAGCGTTGCTCGCGTTCGTTGGACAAAGAGGAAGACACGATGCCAGGAGTCAACATTTAGCTTTGACCTTTGTGAAGGGTTACGTTATGCTGACGTGGAACATGGGCGCTGGACCCCGACGTATTTTCACGTCCCGTCCTCTGGGTCCACGGCGCGGGGGACACACGGTGCGGGTCTGGAGACGAGGAAGAACAGCCGGCCTCGTGGTCGACGGGCGATACAATGTATCAGGGAACGCACCCGCCCACACCAACAACATGACTTTACTACCATACATCTATATTGGCGGTCACCCATCCGATGACTTCCGCGACCTGCCCCATGACCTGCCCCTGCACAGCGGGTGGTCGGGGTGCGTGTTGGAGGTCACGGGTCAGTCAGGGGGAGGACGGGGGGTCGGCGGCCGGGGCGTGGGCCAGTGCGGGGTCACTCAGTGCACCGCCAAGTCCTGTAACGCACCCCGCGGCGTCTGTATACACTCCCCCGCCACTTACGGATGCATCTGTAACGAAGGCTGGTTCGGTGCGACCTGCGCCAGCCCTCGCAGTCCGTGCGATCGATCGCACTCTCGCTGCCAAGGTGCCTGTGTCATTACACTCACTGACGCACACTGTGACTGCCCTTACGGCAAGTCTGGACCTAACTGCGATCAAGAATTAATACCAATCGATGTTCTATTCACCGGCGCTAGATCCTATCTGAAGCTGAAAGCTAGATCTATTTCTAGTGTGAGCTTAGCTCTGGAAGCGGAAATTAAACCTCAAAAGGAGAGGGGATTGATTGTATTCGTCGAAACGCCGCATTTCTATACGTCGCTTTCGCTTCAGGGTGGTTTGTTGGAGTATAGATGGACGGATAATTTGTCCGGTCTGACGTCACTGGTCCGCTCGGGGGTGGTGGTGTCGGTGTCACAATGGCACGGCGTGAGGGCGGGTCGCTATGGCAACCGGCTGTATGTGTGGGTAGACGGCGCCCTCAGTGGTATGAGAGATCTGTCTCGGTTACCGTTGGATGTTATGTCCGGCCCTCCTGAATCCTACAGCGGCTGCTTTAGGAACTTCCATCTAAATAATATATTGTTACCTCTCGAACAACAAAATATAGAAGAGGGTCAAAACGTGCTAGCGTGTGAAGGGTCTAGTTGCGGCGCTCGTTGTAGACGAGCGGCATGTTCCCGCGACACGTGTGCGGGGAGGTGTCGGCGCGGACGCTGCGTGTGTCCGGCGGGACGGGCGGGTGTTACTTGCAGGGAACATATAAACATAACGATACCTCAATTCGGAGGGGACGCCATGTTGACACTCAGTCGGAGCGATCGTCGAGAACAATTGATTGAAGCGTCACCCGCTCGAATAAAACTCAACTTCAACACCGCGGACCCGAACGGGCTCATAGTTTGGATCAATACGGGTATAGACTACTTCGGCGTTGGTCTCGAGAACGGATATATTAAACTTAGTTGGTCTGTACATTGTAACAATTCAAGTGGTCAAACTACGAGAGACTATTTTCCGTTACCACCAAAACTAACTCCGACTCTGGTCAGTGCGGGCTTCTTGGCGGACGGAGAGTGGCATTCGATTGCATTGACCCTAAGACATAACATCTCTTTGTCTATCGACGAAAAGTTATTCGTTGATCAAGAATGCATTCAAATTGAAGACGATGATGACACTGAGTTATTTATAGAATTAATACCAATCGATGTTCTATTCACCGGCGCTAGATCCTATCTGAAGCTGAAAGCTAGATCTATTTCTAGTGTGAGCTTAGCTCTGGAAGCGGAAATTAAACCTCAAAAGGAGAGGGGATTGATTGTATTCGTCGAAACGCCGCATTTCTATACGTCGCTTTCGCTTCAGGGTGGTTTATTGGAGTATAGATGGACGGATAATTTGTCCGGTCTGACGTCACTGGTCCGCTCGGGGGTGGTGGTGTCGGTGTCACAATGGCACGGCGTGAGGGCGGGTCGCTATGGCAACCGGCTGTATGTGTGGGTAGACGGCGCCCTCAGTACGGAACCCATGCTGGCGCACGCCTACCCGCATACAGCCAGCGAAGCATCCATCGTTATAGGCACGGATCACAATCAATCTATTTAA

Protein sequence:

>DPOGS214264-PA
MFKLLNRGHLKSTWWLLIVIPIASAGFACLNNPCVHGICIDDINSTYLCYCIDGYTGVQCQTNWDECWSNPCQNGGTCIDGVASYNCSCPDGFIGDNCETNYNECDSNPCYNNGTCIDMTNEYVCHCIPGFSGDHCELDVAVCNSTGEVRCHNGGECIEGPGFKFYCKCAAGWTGHKCEDQIDECESNPCRNGGICIDAHADYMCACTYGFTGKSCEVAIEFCSQDSCSEKALCVLEDVLRVCYCVPDYHGERCELQYDECALGPRCLNGGTCIDGVDNFTCSCPPRLTGLLCECLILDDGNYDCEYIRPTLLPDHSTATSSFTETIIIDTSTMESKYNSSTTTTSLSTIDSGTSIDVITTDMAIYTKLDNVTDIPITASSTDTIVTENLTTSTEISDMTTDSLTSTSISTSRSTTKEDSVTEIVTILIETKGTIGADDSKTEITTECSGSCPKGNFSTSDLPPTTITSIETTEGITTSTEITKQTATDTTVQTTVDLKETTKQMTSDTTEYTHQAQDMTTERMFTDSPVETTELATELTHPMTEIETSTGYNQISTAHSDCTDVICNNHGSCINTLHGVRCHCLFNYEGRFCESKIIVNSAAFDGTSYIAHHIKNSTSISIAFKAKTLILDGQVMYVDIAKGAYMKLYMNSGLLRFEFSCGYQTMLLSELKTHLNKGYIMKIETRLDIFLPENHCNGTLRLNDTVAMSGGQFANISSPEYNSILYFGNIPNANRNNSNEKSFIGCIKDLIINDERREIFSDAYEASEVRECSSLSCLSSPCVNGGTCNDDDDTYSCACANGWTGATCNDSVCDHNPCQSGGSCVHHPGSGFLCLCPYGRHGIFCEYNVEITRPSLSPISPGRSSYVLYPMSQSAANSDRFEMRLRFQTSDMDQIALLAFVGQRGRHDARSQHLALTFVKGYVMLTWNMGAGPRRIFTSRPLGPRRGGHTVRVWRRGRTAGLVVDGRYNVSGNAPAHTNNMTLLPYIYIGGHPSDDFRDLPHDLPLHSGWSGCVLEVTGQSGGGRGVGGRGVGQCGVTQCTAKSCNAPRGVCIHSPATYGCICNEGWFGATCASPRSPCDRSHSRCQGACVITLTDAHCDCPYGKSGPNCDQELIPIDVLFTGARSYLKLKARSISSVSLALEAEIKPQKERGLIVFVETPHFYTSLSLQGGLLEYRWTDNLSGLTSLVRSGVVVSVSQWHGVRAGRYGNRLYVWVDGALSGMRDLSRLPLDVMSGPPESYSGCFRNFHLNNILLPLEQQNIEEGQNVLACEGSSCGARCRRAACSRDTCAGRCRRGRCVCPAGRAGVTCREHINITIPQFGGDAMLTLSRSDRREQLIEASPARIKLNFNTADPNGLIVWINTGIDYFGVGLENGYIKLSWSVHCNNSSGQTTRDYFPLPPKLTPTLVSAGFLADGEWHSIALTLRHNISLSIDEKLFVDQECIQIEDDDDTELFIELIPIDVLFTGARSYLKLKARSISSVSLALEAEIKPQKERGLIVFVETPHFYTSLSLQGGLLEYRWTDNLSGLTSLVRSGVVVSVSQWHGVRAGRYGNRLYVWVDGALSTEPMLAHAYPHTASEASIVIGTDHNQSI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: