MonarchBase - Protein-coding gene

DPOGS210814
Transcript	DPOGS210814-TA	3381 bp
Protein	DPOGS210814-PA	1126 aa
Genomic position	DPSCF300027 - 637130-650596
RNAseq coverage	304x (Rank: top 37%)

Annotation
*Heliconius*	HMEL003500	76.81%
*Bombyx*	BGIBMGA007130-TA	87.33%
*Drosophila*	Myo10A-PD	64.13%
EBI UniRef50	UniRef50_D6WX09	68.33%	Putative uncharacterized protein n=4 Tax=Pancrustacea RepID=D6WX09_TRICA
NCBI RefSeq	XP_969646.2	68.33%	PREDICTED: similar to AGAP005213-PA [Tribolium castaneum]
NCBI nr blastp	gi\|270012327	68.33%	hypothetical protein TcasGA2_TC006465 [Tribolium castaneum]
NCBI nr blastx	gi\|270012327	68.33%	hypothetical protein TcasGA2_TC006465 [Tribolium castaneum]

Group
Gene Ontology	GO:0005856	2.8e-27	cytoskeleton
	GO:0005515	6.4e-09	protein binding
KEGG pathway
InterPro domain	[118-226] IPR000857	2.8e-27	MyTH4 domain
	[441-535] IPR011993	6.4e-09	Pleckstrin homology-type
Orthology group	MCL10077		Multiple-copy universal gene

Nucleotide sequence:

>DPOGS210814-TA
ATGTCGGCGAGTGCGGAGTTCGCCGACATGTCGGACGACAGTCTTTCGGACAGCGACTCGATTGACCGACACGCCGACGTATGTCACTGTGAGGAAGTTAAAGGCAATTTACTATTGGAAATCTTAAAAGCGGACTCGTCACTCAAGAGTAAGGCGAAGCGCAACGAGTGGACGTGGAAGGCTCAGACAGATGTGGTCAAGTGGCAAGCGACGCCGCTGCGGGCTCCGCTCCTGCGCCTCCCGGCGGCGCTCGCCCCGCCCGCCCTGGAGTGCTTCACCTGCATCCGAGCCTACTGCGGGGACCTGCAGCCTCCCGAGCGAGCCATGCATCAGGATTTGACGGAAGTGAAATGTGTCTATACTGTTCTCATGCACTGCCACTCGGTGGCGGAGCTCCGTGACGAGGTGTACTGCCAGCTGATGAAGCAGACCACCTCCAACCGCTCGCACGCGCCCGACTCGTGCCAGCGAGCCTGGAGGCTCATGTCTATACTGTCCTCATACTTCACCTGCTCTGAGACGCTCAGACCGTTCCTGGTGGAGTATCTGTCGGCGGCGGCGGCGGACAGGCGGAGGCCGTGCCAGGGGACCGCGGCCGTGTGTCTCGCCAACTTCAGGAAGACCATGAGGTGCGGAGGCAGGAAGAACGTACCCAGCGTCGAGGAGGTGACGGCTGTGTCAGCTGGTCGGTCGGCTCGCCGGCAGCTGTACCGCCTGCCGGGAGGAGCGGAGAGGGTCGTCAACACCAGGTGCGCGACAGTCGTCCAGGACATAGTGGACGACCTGTGCGAACTGATCGGCGTGTGCAACCCGGCGGAGCGCGCGGAGTTCTCCCTGTACTGCATCGTGGCGGGCGACTCCCTCACCATGCCGCTGGCGGGCGACGAGTACGTGCTGGACGTCACCACGGAGCTGCAGCGCGCTCAGCATCCCTTCTACCTCATCTTCTGCCGCTCCGTGTGGCACCACCCGCTCAGGACCGACGCTCCGCCGTTGTACACTGAAGTGCTCTTCAATCAGGTTGCCCCAGACTATCTAGAAGGACTCCTGCTAGTGTTGCCAGGGGGAGGCGCTCCCGCGGCGGGGGTGCTTCGTGACGCAGCAGTGGTGGCAGCCCTGCTACACCGCGCGGCAGGCCTGCCAGACGCACCACACCCCAGGGACCTCAAGTTCCTTCTGCCGAAGCCTCTCCTAGCTCTGAAAGAGCCGCGTCCCAACAAGTGGGCGTCGTGGGTCGGCAACGAGTGGCCGACTGTGCGGACTCTGTCGCCTGCCGCAGCTAAATCCAAAGTTTTACAAGTATTATCTCGCTGGTCCCTGTTCGGGTCGTCTTTCTTCGCGGTGCGGCGCGTGCAGGGCGGCGAATGGCGCGAGCACGTGCTGGCTCTCAACAGGCGAGGCCTGCACCTGCTGCACCCCGCCACGCACGACACGGACGCTCACTGGCCCTACGCCGACCTCATCTCCACTAGGAAGGTCCGTTCCGAAGACGGGACTCTGTTCCTGGACGTGAAGTGCGGTTCCCTTCTGCAGCAGCGAGTGACGCGGCTCCAGGCGGAACAAGCTCACGAGATAGCGAGACTCATCAGGCAGTACATCGCCCTGCAGAGAGATAACAGGGAGGGAGATTCGAGGCACTCACCAGGCAAGGTTGCTGGTAACGTGACCCCGTCCGCCGCCGCTTGGAATCATATTTGTAAATCACAGAGTCATATCGGCGTGTGTAACCCGGCGGAGCGCGCGGAGTTCTCCCTGTACTGCATCGTGGCGGGCGACTCCCTCACCATGCCGCTGGCGGGCGACGAGTACGTGCTGGACGTCACCACGGAGCTGCAGCGCGCTCAGCATCCCTTCTACCTCATCTTCTGCCGCTCCGTGTGGCACCACCCGCTCAGGACCGACGCTCCGCCGCTGTACACTGAAGTGCTCTTCAATCAGAAAGGCATCACTGATTGGATGTCATTGGAAATCTTAAAAGCGGACTCGTCACTCAAGAGTAAGGCGAAGCGCAACGAGTGGACGTGGAAGGCTCAGACGGATGTGGTCAAGTGGCAAGCGACGCCGCTGCGGGCTCCGCTCCTGCGCCTCCCGGCGGCGCTCGCCCCGCCCGCCCTGGAGTGCTTCACCTGCATCCGAGCCTACTGCGGGGACCTGCAGCCTCCCGAGCGAGCCATGCATCAGGATTTGACGGAAGTGAAATGTGTCTATACTGTTCTCATGCACTGCCACTCGGTGGCGGAGCTCCGTGACGAGGTGTACTGCCAGCTGATGAAGCAGACCACCTCCAACCGCTCGCACGCGCCCGACTCGTGCCAGCGAGCCTGGAGGCTCATGTCTATACTGTCCTCATACTTCACCTGCTCTGAGACGCTCAGACCGTTCCTGGTGGAGTATCTGTCGGCGGCGGCGGCGGACAGGCGGAGGCCGTGCCAGGGGACCGCGGCCGTGTGTCTCGCCAACTTCAGGAAGACCATGAGGTGCGGAGGCAGGAAGAACGTACCCAGCGTCGAGGAGATCGGCGTGTGTAACCCGGCGGAGCGCGCGGAGTTCTCCCTGTACTGCATCGTGGCGGGCGACTCCCTCACCATGCCGCTGGCGGGCGACGAGTACGTGCTGGACGTCACCACGGAGCTGCAGCGCGCTCAGCATCCCTTCTACCTCATCTTCTGCCGCTCCGTGTGGCACCACCCGCTCAGGACCGACGCTCCGCCGTTGTACACTGAAGTGCTCTTCAATCAGGTTGCCCCAGACTATCTAGAAGGACTCCTGCTAGTGTTGCCAGGGGGAGGCGCTCCCGCGGCGGGGGTGCTTCGTGACGCAGCAGTGGTGGCAGCCCTGCTACACCGCGCGGCAGGCCTGCCAGACGCACCACACCCCAGGGACCTCAAGTTCCTTCTGCCGAAGCCTCTCCTAGCTCTGAAAGAGCCGCGTCCCAACAAGTGGGCGTCGTGGGTCGGCAACGAGTGGCCGACTGTGCGGACTCTGTCGCCTGCCGCAGCTAAATCCAAAGTTTTACAAGTATTATCTCGCTGGTCCCTGTTCGGGTCGTCTTTCTTCGCGGTGCGGCGCGTGCAGGGCGGCGAATGGCGCGAGCACGTGCTGGCTCTCAACAGGCGAGGCCTGCACCTGCTGCACCCCGCCACGCACGACACGGACGCTCACTGGCCCTACGCCGACCTCATCTCCACTAGGAAGGTCCGTTCCGAAGACGGGACTCTGTTCCTGGACGTGAAGTGCGGTTCCCTTCTGCAGCAGCGAGTGACGCGGCTCCAGGCGGAACAAGCTCACGAGATAGCGAGACTCATCAGGCAGTACATCGCCCTGCAGAGAGATAACAGGGAGGGAGATTCGAGGCACTCACCAGCCTTCATCAGCCAATGA

Protein sequence:

>DPOGS210814-PA
MSASAEFADMSDDSLSDSDSIDRHADVCHCEEVKGNLLLEILKADSSLKSKAKRNEWTWKAQTDVVKWQATPLRAPLLRLPAALAPPALECFTCIRAYCGDLQPPERAMHQDLTEVKCVYTVLMHCHSVAELRDEVYCQLMKQTTSNRSHAPDSCQRAWRLMSILSSYFTCSETLRPFLVEYLSAAAADRRRPCQGTAAVCLANFRKTMRCGGRKNVPSVEEVTAVSAGRSARRQLYRLPGGAERVVNTRCATVVQDIVDDLCELIGVCNPAERAEFSLYCIVAGDSLTMPLAGDEYVLDVTTELQRAQHPFYLIFCRSVWHHPLRTDAPPLYTEVLFNQVAPDYLEGLLLVLPGGGAPAAGVLRDAAVVAALLHRAAGLPDAPHPRDLKFLLPKPLLALKEPRPNKWASWVGNEWPTVRTLSPAAAKSKVLQVLSRWSLFGSSFFAVRRVQGGEWREHVLALNRRGLHLLHPATHDTDAHWPYADLISTRKVRSEDGTLFLDVKCGSLLQQRVTRLQAEQAHEIARLIRQYIALQRDNREGDSRHSPGKVAGNVTPSAAAWNHICKSQSHIGVCNPAERAEFSLYCIVAGDSLTMPLAGDEYVLDVTTELQRAQHPFYLIFCRSVWHHPLRTDAPPLYTEVLFNQKGITDWMSLEILKADSSLKSKAKRNEWTWKAQTDVVKWQATPLRAPLLRLPAALAPPALECFTCIRAYCGDLQPPERAMHQDLTEVKCVYTVLMHCHSVAELRDEVYCQLMKQTTSNRSHAPDSCQRAWRLMSILSSYFTCSETLRPFLVEYLSAAAADRRRPCQGTAAVCLANFRKTMRCGGRKNVPSVEEIGVCNPAERAEFSLYCIVAGDSLTMPLAGDEYVLDVTTELQRAQHPFYLIFCRSVWHHPLRTDAPPLYTEVLFNQVAPDYLEGLLLVLPGGGAPAAGVLRDAAVVAALLHRAAGLPDAPHPRDLKFLLPKPLLALKEPRPNKWASWVGNEWPTVRTLSPAAAKSKVLQVLSRWSLFGSSFFAVRRVQGGEWREHVLALNRRGLHLLHPATHDTDAHWPYADLISTRKVRSEDGTLFLDVKCGSLLQQRVTRLQAEQAHEIARLIRQYIALQRDNREGDSRHSPAFISQ-

Monarch geneset OGS2.0

Nucleotide sequence:

Protein sequence: