MonarchBase - Protein-coding gene

DPOGS210251
Transcript	DPOGS210251-TA	3792 bp
Protein	DPOGS210251-PA	1263 aa
Genomic position	DPSCF300196 + 732208-746046
RNAseq coverage	269x (Rank: top 40%)

Annotation
*Heliconius*	HMEL021350	0.0	40.52%
*Bombyx*	BGIBMGA002383-TA	2e-45	36.76%
*Drosophila*	eater-PB	1e-135	36.66%
EBI UniRef50	UniRef50_B4JHF9	4e-143	36.27%	GH18950 n=10 Tax=Drosophila RepID=B4JHF9_DROGR
NCBI RefSeq	XP_001989724.1	8e-144	36.27%	GH18950 [Drosophila grimshawi]
NCBI nr blastp	gi\|195036532	2e-142	36.27%	GH18950 [Drosophila grimshawi]
NCBI nr blastx	gi\|195036532	0.0	36.00%	GH18950 [Drosophila grimshawi]

Group
KEGG pathway	ssc:445520	3e-29
	K06252 (TN)	maps->	Focal adhesion
			ECM-receptor interaction
InterPro domain	[146-343] IPR009030	1.5e-08	Growth factor, receptor
Orthology group	MCL11207		Insect specific

Nucleotide sequence:

>DPOGS210251-TA
ATGCGTTTCATTATTTTCATCTTCATAGTGTTGTGTTCCGCTAGTGCCTTTGAAGCTTTGAAAGCTCATGATCCTGGTGTATGCGTTGTTTCCCGAAGTGTACGCAAAACTAGACTCAAATATTACAAAGTGAGAAGCATGTGCAAAGGCAAGAGGTGCATTATAAAGAAGAGCAAAGTCGAGAGCTATAAAGTTAATCAAAATGAAAGTGTATGCTGTACTGGTTGGGCCTACTCCGCCGTGCTGGACGCCTGTTCTCCAAGCTGCAGCATGGGTTGTGTTGGAGGTCGATGTGTCTCTCCGGAGGTCTGTCAATGCGATCCCCCTGCCACATTGCATCCATTACATAACAACGTGTGCGTCACCTGCGAGCCGGCATGTGAAAACTCCAAATGCGTTAACAACACCTGCATCTGCTTTGAGGGTTATCAGAAAATAAATAACACTTGCCAACCGGTTTGTGACTCCTGTGTTCACGGATTGTGTGTGGCGCCGAACAGTTGCCGGTGTCATCCTGGTTACGGTGGTGAGAATTGCGAGCCCCTGTGTGATAACTGTGATAACGGTGTTTGCGGTGAACCCAACGTGTGTTCGTGTAGGGAGGGGTATCTACGAAACGCTAGCGGCTGTCATAAACCTTGCCCGGCGGACTGCAAATCTTGCGATAGTCAAGGCCAGTGTCAGGACGGGGTTTGCCACGGATTCATGATGAAGGGAAGACTATTAGAGCGATGCTGTGACGGTTGGGAATATGACAACCGAATGCGTCGCTGCAAGCCTTCCTGTTTAAGCGGCTGTGGAGATGGCGAATGTGTGGCGCCTCAGAGATGCGAATGTAAACCACCGCTTATACTAGACAGCAGTAAAAAGTGCGTCCATCCGAAACCACGTTGTGATTTACCTTGCACGAACGGTGCCTGCACAGCGGACAATGTATGCACATGTGATGCGGGTTATACACAGAAAGATACGTACACTTGCGTGCCAAAGTGTGGACAGTCCTGTATAAACAGTGTTTGCGTTGCACCTGACACTTGCCAATGTCTGGATGGGTTTGAATCTCAAGGAAAATGGAAATGTGATCCGGTATGTGACGATTGTAAAGATGGTAAATGTGTCGCACCGAACACGTGCCATTGTAATAGTGGATACTCTAAAGTGAACGGCAAATGCGTACCAGTATGTGAGGGCGAATGCCAAAACGGATTTTGCGCAGGACCAAATAAATGCGAGTGTAATTTGGGATACGAGATTGATCCTTTAGATAGATTCACTTGCCGCCCGGTCTGTAATCCGGCTTGCGTGAACGCGTCATGTGTGTTCCCAGGCACATGTTCCTGCTATCCAGGATATGAATCACTTACTGCAAATATTTGTAAGCCAAAATGTGATGACTGTTTGAATGGAGATTGCATTGGACCAAACGAATGTCGTTGTCAAGAAGGTTATGAATTGATCGGAACAAAATGCAAGCCTGTATGTAGTCAGATATGTGTCAACGGATATTGTTCAACACCAGACACCTGTAGCTGTAATAATGGTTACGAATTGGATGCTCGCGATAAGTTTACTTGTAATCCAATTTGTAAAGAAAAATGTATTAATGGAACGTGTGTAAGTCCTGATATATGCCAATGCTTTGAAGGCTACGAAAAAACTAGCAACGACAATTCTTGTAAACCGAAATGTTTAAGTTGTGAAAATGGGATTTGTATAAGACCTGACGTTTGTTCGTGCGATGACGATTATGTTTTATATAATGGAACATGTGTCCCCGTTTGCTCGAGTTTATGTATCAATGGGTATTGTAAATCACCAAATGAATGTGGCTGCCTGGATGGTTATATTAGAAATTCCTCGAATCCCGCAGCATGTTACAAGCCTTGTTCTGGCCTCTGCAACAACGGCATCTGTAACATAGATGGCAACTGCATTTGTGATCCCGGCTACGAGTTACATCAAAATGGATCCTGTGTTGCCATAACCATGGTGCATTGTGAGAATTGCAATGGTACTTGCGGAGACGACGGTCATTGTAAGTGTTGGGATGGAATCACGTGTTCCAATATCACCTTCATCGAGCCAGCAAGTGTGAAGTCAGCTGAAGTGTTAGCAGGTCTACAATTAACGTGGTTGCTGGGAGGTTGTATAAGTTTCCTTCTCCTCGTTCTGGTAATTGTGGTCATGGCACAAATGTGGCGGAAGAGACAAGAATTCGTCACGAAGTCCGTTGATGGTGTAGGAGGCAACCAGTACGGCAGTGTCGTTTACACGGTCCCAGACACTCTTATGAAACGAAATGTCAGCGACGAAGCCTGTAGTGATAATGATGAGGCCGAGGAAGTCACAGCCCAGGATAAACTTGAAGCGGCTGAACGTCTTCTAGCGAGATATAGAGAAACTGAAAACAATGTTTGTCAGCCCTACTGTTCTAAAGGATGTTTAAATGGTATTTGTACAAGTCCTGAAAATTGCACTTGCAATGATGGTTGGTATAAAGAGGAGGAAAAATGTAAACCATATTGTGAGTTCGACTGCGGTGGTGGCACATGTGTAGCCCCAAATAGTTGCGTATGTAATCCAAATTACATTAAGGCTGAAAACTTAACATGCGTACCTCATTGTTCCCAAGGATGTGCAAATGGAATTTGTGTTAGCCCAGAAAATTGTGTTTGTAACAAAGGATGGGCTAAGAGTAATGATCTAAACGTCTGTTTGCCACATTGTGAGTTTGAATGTGGCGGAGGTATTTGTGCCAGTCCAAATGTTTGCGAATGTTATGCTGGTTATATTATGTCTGCTAATGGAACATGTATACCCCATTGTCCTCAAGGCTGCCCACACGGTCAGTGTGTGCAACCAGGAAATTGTAGCTGTGAAAATGGATGGTATAAAAACGAGACTCATGACGAGTGCCGTCCTATTTGTGATAACAATTTTATAAATAGTGTTTGTGTTGCACCAAATACATGCGAGTGTTTATCTAACTACACTAAGGCTGAGAATGACTCATGTGTACCTTATTGCTCTTCGGGATGTCCAAATGGCACATGTGTTAATCCAGAAGAATGTGAATGCAATGATGGCTGGCAAAATAATGAGAATGGTATTTGTGAACCAAAATGCAATAGCCCATGTGGAAATGGAAAATGTATAGAACCTGATGTTTGTGAATGCTTTCCTGGATACAAGTTCAATATTGACAATGATGTGAAATACTCGAATGGTCTATGCATCCCTGAATGTACGGGATGCAATGGAACTTGTATAGCACCAAATAATTGTGTCTGTGATAGTCCACTACAAGCTGTAAACGTAACAGAGGACGGACAAAAATGTGATTGCATCGATTTTTGTTTCGAAGGTCAAAATATATGCCGAGGTACTGCTTGTGTTTTGAACGATACTTATGTTTCTACATCTGACGGCTTGTACGATACGATGGAGAGTACAATCATCAGCACGATTACTGACGAGGTGAGAAGTGACGGCATGACAACTGATAATATTTTAGAAGAAACATCAAGTTCGTCTTTTGATTCGGATACTTTAAGCGGAAGCCAAGGAATTTACCAGATACCATACTGGGCCTATTTTGCAATTCCGTCTATAACAATAGTTTTAATAGTATCCAGTATCCTTATCTGTAATCGACGAGCCATATCACAATATTGTAAGGGCAGCAGTTATGTTGTTGAAGATGACAAAACATTACATGGAAGTGTTTCTTTCAACAATGTCCGTTCAAATCCCTTAAAACCCGAACCTGAACTGATCTCAGGAGATATTTAG

Protein sequence:

>DPOGS210251-PA
MRFIIFIFIVLCSASAFEALKAHDPGVCVVSRSVRKTRLKYYKVRSMCKGKRCIIKKSKVESYKVNQNESVCCTGWAYSAVLDACSPSCSMGCVGGRCVSPEVCQCDPPATLHPLHNNVCVTCEPACENSKCVNNTCICFEGYQKINNTCQPVCDSCVHGLCVAPNSCRCHPGYGGENCEPLCDNCDNGVCGEPNVCSCREGYLRNASGCHKPCPADCKSCDSQGQCQDGVCHGFMMKGRLLERCCDGWEYDNRMRRCKPSCLSGCGDGECVAPQRCECKPPLILDSSKKCVHPKPRCDLPCTNGACTADNVCTCDAGYTQKDTYTCVPKCGQSCINSVCVAPDTCQCLDGFESQGKWKCDPVCDDCKDGKCVAPNTCHCNSGYSKVNGKCVPVCEGECQNGFCAGPNKCECNLGYEIDPLDRFTCRPVCNPACVNASCVFPGTCSCYPGYESLTANICKPKCDDCLNGDCIGPNECRCQEGYELIGTKCKPVCSQICVNGYCSTPDTCSCNNGYELDARDKFTCNPICKEKCINGTCVSPDICQCFEGYEKTSNDNSCKPKCLSCENGICIRPDVCSCDDDYVLYNGTCVPVCSSLCINGYCKSPNECGCLDGYIRNSSNPAACYKPCSGLCNNGICNIDGNCICDPGYELHQNGSCVAITMVHCENCNGTCGDDGHCKCWDGITCSNITFIEPASVKSAEVLAGLQLTWLLGGCISFLLLVLVIVVMAQMWRKRQEFVTKSVDGVGGNQYGSVVYTVPDTLMKRNVSDEACSDNDEAEEVTAQDKLEAAERLLARYRETENNVCQPYCSKGCLNGICTSPENCTCNDGWYKEEEKCKPYCEFDCGGGTCVAPNSCVCNPNYIKAENLTCVPHCSQGCANGICVSPENCVCNKGWAKSNDLNVCLPHCEFECGGGICASPNVCECYAGYIMSANGTCIPHCPQGCPHGQCVQPGNCSCENGWYKNETHDECRPICDNNFINSVCVAPNTCECLSNYTKAENDSCVPYCSSGCPNGTCVNPEECECNDGWQNNENGICEPKCNSPCGNGKCIEPDVCECFPGYKFNIDNDVKYSNGLCIPECTGCNGTCIAPNNCVCDSPLQAVNVTEDGQKCDCIDFCFEGQNICRGTACVLNDTYVSTSDGLYDTMESTIISTITDEVRSDGMTTDNILEETSSSSFDSDTLSGSQGIYQIPYWAYFAIPSITIVLIVSSILICNRRAISQYCKGSSYVVEDDKTLHGSVSFNNVRSNPLKPEPELISGDI-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: