将分子结构转换成声音,可深入了解蛋白质结构,并创造出新变化!
想要创造一种全新蛋白质,有用的性质?没有问题!麻省理工学院研究人员将科学与艺术惊人地结合起来,开发出一套系统,可以将蛋白质的分子结构(所有生物基本组成部分)转换成类似于音乐段落的可听声音。
然后,通过逆转这一过程,可以在音乐中引入一些变化,并将其转化为自然界中从未见过的新蛋白质,虽然这并不像哼唱一种新蛋白质存在那么简单,但这个新系统已经很接近了。
它提供了一种将蛋白质氨基酸序列转换成音乐序列的系统方法,利用分子的物理特性来确定声音。虽然这些声音是为了让人类能够听到而被调换的,但是这些音调和它们之间的关系是基于每个氨基酸分子本身实际振动频率,这些振动频率是用量子化学理论计算出来。该系统由麻省理工学院(MIT)土木与环境工程系系主任、McAfee工程学教授马库斯•比勒(Markus Buehler)、博士后迟华宇(Chi Hua Yu)和另外两人共同开发。
该系统将20种氨基酸转化成20个音调的音阶,氨基酸是组成蛋白质链的组成部分,任何蛋白质的氨基酸长序列都会变成音符序列。对于习惯了西方音乐传统的人来说,这样的音阶听起来并不熟悉,但是当听众熟悉了这些声音之后,很容易就能辨别出它们之间的关系和区别。在听了这些旋律后,现在能够分辨出特定的氨基酸序列,这些氨基酸序列与具有特定结构功能的蛋白质相对应,这是一个贝塔表,或者是一个阿尔法螺旋。
研究蛋白质的语言
整个概念是为了更好地理解蛋白质及其大量的变异,蛋白质构成了皮肤、骨骼和肌肉的结构材料,同时也是酶、信号化学物质、分子开关和许多其他功能材料,构成了所有生物的机械。但是它们的结构,包括折叠成决定蛋白质功能的形状方式,是极其复杂的。蛋白质有自己的语言,而我们不知道它是如何运作的,不知道是什么使丝蛋白成为丝蛋白,也不知道什么样的图案反映了什么样酶的功能。
通过将这种语言翻译成人类特别熟悉的另一种形式,并允许信息的不同方面以不同的维度编码(音高、音量和持续时间)布勒和团队希望能收集到关于不同蛋白质家族之间关系和差异及其变化的新见解,并以此作为探索蛋白质结构和功能的许多可能调整和修改的一种方式。与音乐一样,蛋白质结构也是分层的,在不同的长度或时间尺度上有不同的结构层次,然后,研究小组使用人工智能系统来研究由多种不同蛋白质产生的旋律。
让人工智能系统在音乐序列中引入微小的变化,或者创造出全新序列,然后将声音翻译回与修改过或新设计版本相对应的蛋白质。通过这个过程,能够创造出现有蛋白质的变体(例如在自然界最强物质之一蜘蛛丝中发现的一种蛋白质)从而制造出不同于任何进化产生的新蛋白质。尽管研究人员自己可能不知道潜在的规则,人工智能已经学会了蛋白质是如何设计的语言,它可以对其编码,创造现有版本的变体,或全新的蛋白质设计,有“数万亿种”潜在的组合。
合成“新蛋白质”
通过使用这样一个系统,用一组特定种类蛋白质的数据来训练人工智能系统可能需要几天的时间,但它可以在几微秒内设计出一种新蛋白质变体,没有其他方法能与之媲美,缺点是这个模型没有告诉我们里面到底发生了什么,只知道它管用。这种将结构编码到音乐中的方式确实反映了更深层次的现实,当你在教科书上看到一个分子,它是静态的,但它根本不是静止的。它在运动和振动。每一点物质都是一组振动,我们可以用这个概念来描述物质。
该方法还不允许任何形式的定向修改——任何性质的变化,如机械强度、弹性或化学反应性,本质上将是随机的。但仍然需要做这个实验,当一种新的蛋白质变异产生时,没有办法预测它会发生什么。该团队还创作了由氨基酸声音发展而来的音乐作品,这些氨基酸定义了这种新的20音音阶,艺术品完全由氨基酸产生的声音组成。目前还没有使用合成或天然的乐器来证明这种新声音来源可以被用作一个创造性的平台。