MonarchBase - Protein-coding gene

DPOGS206586
Transcript	DPOGS206586-TA	3099 bp
Protein	DPOGS206586-PA	1032 aa
Genomic position	DPSCF300108 + 683312-704285
RNAseq coverage	290x (Rank: top 38%)

Annotation
*Heliconius*	HMEL004372	2e-88	52.77%
*Bombyx*	BGIBMGA013748-TA	7e-63	79.58%
*Drosophila*	mim-PF	4e-47	43.26%
EBI UniRef50	UniRef50_D6WQ04	4e-88	42.15%	Putative uncharacterized protein n=2 Tax=Tribolium castaneum RepID=D6WQ04_TRICA
NCBI RefSeq	XP_973999.2	6e-88	42.08%	PREDICTED: similar to CDNA sequence BC060632 [Tribolium castaneum]
NCBI nr blastp	gi\|270009701	2e-87	42.15%	hypothetical protein TcasGA2_TC008993 [Tribolium castaneum]
NCBI nr blastx	gi\|270009701	1e-128	35.96%	hypothetical protein TcasGA2_TC008993 [Tribolium castaneum]

Group
Gene Ontology	GO:0046847	2.1e-43	filopodium assembly
	GO:0007165	2.1e-43	signal transduction
	GO:0017124	2.1e-43	SH3 domain binding
	GO:0008093	2.1e-43	cytoskeletal adaptor activity
KEGG pathway
InterPro domain	[9-191] IPR013606	2.1e-43	IRSp53/MIM homology domain (IMD)
Orthology group	MCL15631		Insect specific

Nucleotide sequence:

>DPOGS206586-TA
ATGTATGTTTGTTTATTTGTTACAGGAGCCACAAAGGAAATAGGAACCGCCTTGACAAGGGTCTGCCTCAGACACAGGGCTATAGAGACTAGAATGAAGACGTTTATCAGCACGTTGATGGAGCGTCTTATAGCTCCACTATCGGAACGAGCTGATGAATGGCGTCGCGGTTGTAATGTTACCGGCGCATTGAGCCGAGAACACGCACGTGAGTGTAAACGCGCCAGGGCTGAGCTGCGCAGGCGGGTCCATGATGCTCAGAGACACGCTAGGAAAGCGAGGCGGACGAATCCGGATGTTAAGCGGAGAGCTGACGTTTGTTTGCAGGATATCCAAGAACGAAAGCAGCAATTGGAGGAGATGGAAGAGAAGGCGGTGAAGGCCGCTCTGATAGAAGAACGGAGCCGGTTCTGTAACTTCGTGTCTCTTCTCAGTCCTGTTGTGGAGAGTGAAGTGGCAATGCTAGCAGAGGTCAGTCACCTTCAAGAGGGAACAGAACAGTTGTCGAGGCAGATTTCGGAACCTCGGAGTTTACCCCCTGGGAGTCTACAGGTGATTTGCGATATAAAGTCTTGCTACAGTGGTTGGGCGGAAGGTGGCTCGGTTCCGCCCTCGCCCTCTACATCACGACTTGGCAGTCGCAAGTCATCTTTGACATCTATATCGTCTCTTAGCAGCCAATGCTCCGATCAACATGGTGTGTCAGGCTCAACAGTGAGCTGTTCAACTCCTATATCAACTGGATCGTCTATAGCACCAGCTTTGGACTCCCAGCGTGGACAGTCCACGTCTCGTCTGGCGAGCGTCTGTAGCAGTGACTCTGGTTTTCGTTCCCAAGACACTCTCCAGCGACCCTCTCTATACGTTGACAATGGTTCAGACAATCAAAGCATTAACAGCGAATGCGCGACACCGTCTAAGACAAATGACGAGAATGACTCCAACGATCTCACGTCCAACTCGGCTTCAGCCACGTGGCCAGATCTCAAAGACACGGCGCAGTTCGAGAGAGCGGCCTCCGCTATAATGGGGGGCAGACCGCATACTATATCAGCTGGTACGGATCGCTCGTTCCAACGGCCGGCGTTGAGTGTTCATACATTCAGCGAGAACGCCCGCGAGGGTATATACGCCAGGCCGCCTCTACCCACTGGTTCAGACAATCAAAGCATTAACAGCGAATGCGCGACACCGTCTAAGACAAATGACGAGAATGACTCCAACGATCTCACGTCCAACTCGGGTACGGATCGCTCGTTCCAACGGCCGGCGTTGAGTGTTCATACATTCAGCGAGAACGCCCGCGAGGGTATATACGCCAGGCCGCCTCTACCCACTCGCTGTTCATCGTTGGAGCGTCCCAGTGTGCCGGCGAGGAATTCCAATTCAACAAGAGCTGAGTTCAAACCAAATAAACCTACGAGCCTTCCGCCGCACCTCGCTAAAGAAGTACCACAAGCTTTGTACGTGAATATGTCAGAGTTGGCGACTATGGCGGCGTCACGAGCACAGCAACAGAACAGTACGGAGTATCCTCAACAGGAGAAGCGCTGTTCATCGTTGGAGCGTCCCAGTGTGCCGGCGAGGAATTCCAATTCAACAAGAGCTGAGTTCAAACCAAATAAACCTACGAGCCTTCCGCCGCACCTCGCTAAAGAAGTACCACAAGCTTTGTACGTGAATATGTCAGAGTTGGCGACTATGGCGGCGTCACGAGCACAGCAACAGAACAGTACGGAGTATCCTCAACAGGAGAAGGTATGTTCAGAGAGCAGTGCCAGCGAATCGTCCCTAGAATCATCGAGCGGCTATGGAAGTCAGGGCGCGTTCGCCGGCGAAGATCACTCTCATCTCATACACCCAGACGTGTCGTCGGAAATAGTGACACTACGTCACAGCGATTCCGTTGTGATCGCACGCGAGAATTTCTCGATATCACTTGGAAGTCTCGAGGAGGCCGTGAGATGTTTGGACGAGGCGTCTGAATCACCGACCTTCGCTACTATAGGCAAAAAACCAACCGTCCCAAAAAGAAGACCTGTATCAATGACAGGTGATATGCTTTGTGCTTATATACTGATGTGTTTGTACAACACAGTGTTGAGTGTCGTGAACTCGTCTGATGTTGACAACCTGCCTCCGCCGCCGGCCTTCCTCCTGCAGCCGGACGATGGGAACGCTCATCCAGGTATCAACGTAGCTGAGACGGTCAAACAGTTGACGGAATTGAAGCACATGCCGGCCTCGCCCGGTCTAGTGCGAAGGACGGTCCAAAACCAGAACGAGAACCAATCACCGATATACGGAACCCAGAAACAGTTGTACGGGACCCACAACCAGAATACGCCGATATATGGAACCCAGAATCAAAATCTCAGCTCGTTCCAGCAAGCTAAAAGCAATTTCTCATCCAGCATGAGCTTGAACAGCGGCAACCTGAACCCTATATACTCGCAGACAGGAAACAGAATGTTCGAGAACTCGCTGTTCGTTAGGAAGAACAGTTTGAACAGTTCTAACACAGATATATACGGCGGTAATACGGGTATATATGAAACTAAATCACCCCACGGCTCCACTCCATCAACACCGAGCTATTCTGAAACCAATACCTTCTCCAGCTTTGGGCCGAGGGTAACAAATGAATCTCATTACGGACAGACGGGTGTGAAGCTTCAAGATCAAAGCGGTATATACGCAGCGCCGTCGCTCGTTAGGAGGCTGACCCCGCGGGCTCACTCCGCTGAGAGAAACGCTAAAGAACACGGAGGTCTTATAGCGACTCTAAGTGCTAAGTTAGCACCACAACTATCTCCGAGGAGTCCGAGACGAGCCAATCCTAATGTCACTGAATCACCCGCTAAAGGGAAAGGTGTTCCAGCTACAGTACAGCCAGCGTTCTTGGACAAACTGTCAGCTACCTTACAACATCAGAGAAGGATGCAGTCTAGAGCGAACACAGTCAGAGATCTCATTAATGCGCATGCACAGCCGGATCCGAGGGTATGTCACACATCACTCATGGAACAAATCAAAAGAGGTGCGACACTCAGAAGAAATAAATATTGCAACGACAGATCAGCGCCCAAAATACGTTAA

Protein sequence:

>DPOGS206586-PA
MYVCLFVTGATKEIGTALTRVCLRHRAIETRMKTFISTLMERLIAPLSERADEWRRGCNVTGALSREHARECKRARAELRRRVHDAQRHARKARRTNPDVKRRADVCLQDIQERKQQLEEMEEKAVKAALIEERSRFCNFVSLLSPVVESEVAMLAEVSHLQEGTEQLSRQISEPRSLPPGSLQVICDIKSCYSGWAEGGSVPPSPSTSRLGSRKSSLTSISSLSSQCSDQHGVSGSTVSCSTPISTGSSIAPALDSQRGQSTSRLASVCSSDSGFRSQDTLQRPSLYVDNGSDNQSINSECATPSKTNDENDSNDLTSNSASATWPDLKDTAQFERAASAIMGGRPHTISAGTDRSFQRPALSVHTFSENAREGIYARPPLPTGSDNQSINSECATPSKTNDENDSNDLTSNSGTDRSFQRPALSVHTFSENAREGIYARPPLPTRCSSLERPSVPARNSNSTRAEFKPNKPTSLPPHLAKEVPQALYVNMSELATMAASRAQQQNSTEYPQQEKRCSSLERPSVPARNSNSTRAEFKPNKPTSLPPHLAKEVPQALYVNMSELATMAASRAQQQNSTEYPQQEKVCSESSASESSLESSSGYGSQGAFAGEDHSHLIHPDVSSEIVTLRHSDSVVIARENFSISLGSLEEAVRCLDEASESPTFATIGKKPTVPKRRPVSMTGDMLCAYILMCLYNTVLSVVNSSDVDNLPPPPAFLLQPDDGNAHPGINVAETVKQLTELKHMPASPGLVRRTVQNQNENQSPIYGTQKQLYGTHNQNTPIYGTQNQNLSSFQQAKSNFSSSMSLNSGNLNPIYSQTGNRMFENSLFVRKNSLNSSNTDIYGGNTGIYETKSPHGSTPSTPSYSETNTFSSFGPRVTNESHYGQTGVKLQDQSGIYAAPSLVRRLTPRAHSAERNAKEHGGLIATLSAKLAPQLSPRSPRRANPNVTESPAKGKGVPATVQPAFLDKLSATLQHQRRMQSRANTVRDLINAHAQPDPRVCHTSLMEQIKRGATLRRNKYCNDRSAPKIR-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: