【野生小科普】人工智能Alpha AI
最近发生的科技事件好多呀,本想全部汇总写在一个小科普里,但篇幅太长了。那么今天就先介绍一下由DeepMind开发的可以预测蛋白质3D结构的AlphaFoldⅡ。
AlphaFoldⅡ
绿色是实验测定结构,蓝色为计算预测结构。可见AlphaFoldⅡ预测结果与现实结构的匹配度很高。
蛋白质是生命活动的基础,所有结构和功能的实现都需要蛋白质。1972年,诺奖得主Christian Anfinsen提出猜想:蛋白氨基酸序列可决定蛋白结构,而结构决定功能。现代生物学很多研究都是建立在这个“序列→结构→功能”的假设上。
目前,测序技术使我们数据库的氨基酸序列存货猛增(【现学现卖】实验-DNA测序【现学现卖】一个完整基因组序列的时代),但是结构和功能层面进展相对较慢,拥有实验测定3D结构的蛋白质非常少。目前常用的实验测定方法为X射线衍射、核磁共振或电子显微镜,这些方法耗时长,成本高,科学家们一直在寻求更好的预测方法。
DeepMind团队多年前开始尝试用人工智能算法解决这个问题,2018年参加国际蛋白质结构预测竞赛(CASP-13)的AlphaFoldⅠ也取得了相当不错的成绩。近年的比赛其预测结果的准确度和得分更是刷了新高,比赛组织者评价其基本解决了预测蛋白质折叠和结构的问题。
FoldⅠ在CASP13中对T09886s2的结构预测流程
简单来说,AlphaFold是利用神经网络和已知的数据(序列对应3D结构)进行训练。首先查询序列与数据库内序列进行多序列比对(MAS:Multiple sequence alignment),分析模拟出氨基酸组件间的距离和扭转角,得到初步预测;接着AlphaFoldⅠ会基于氨基酸序列,创造出一个符合物理规则的随机三维结构,然后用梯度下降法优化初步预测中的各个参数,得到更加准确的结构(FoldⅡ在Ⅰ基础上的改进还没有公开发表,这里的图是Ⅰ论文中的,Ⅱ的内容需等待即将发表的论文)。
上面那段话的图片版
2
Alpha Go
这不是DeepMind第一次走进人们的视线,与其他计算机科学的团队相比,他们的成果近年一直活跃在媒体上。还拍有纪录片《Alpha Go》(还挺感人的,尤其是人类那种“特别想要赢,哪怕一次也就够了”的心理,让我忍不住思考,我们究竟是坚强还是脆弱的生物呢?)。
提到Alpha系列,绕不开的是下围棋的AlphaGo(还有个玩星际争霸Ⅱ的AlphaStar,就不说了)。虚拟环境和游戏是测试人工智能算法最理想的平台。
相较于国际象棋,围棋的变化仿佛神秘的宇宙。在国际象棋中,每个棋子约有20种可选路径,而围棋却有200种,整个棋局变化数目比宇宙的原子总数还多,即使出动全世界的电脑去运行一百万年,这样的算力也不足以计算出所有可能的情形。
这也是为什么2016年AlphaGo以4:1击败李世石时,造成了人类那么大的震撼和紧张。AlphaGo这场胜利与深蓝击败卡斯帕罗夫有不同,它的核心是深度神经网络,主要由三部分构成:走棋网络,估值网络和树搜寻。
走棋网络扫描棋盘,选出候选落子点,根据每个落子点可能产生的变化,构建树状图。然后运用估值网络,分析每种方法获胜几率。AlphaGo的每一步偏向将最终胜率调到最大,而不在乎是否为中盘获胜或者半目险胜。
它的落子有时很有创意,比如与李对局的第二局,第37步。后台计算显示人类会下在这里的概率为一万分之一,可以说是AlphaGo的自创。有趣的是,第四局,李也下了一步后台显示概率为一万分之一的78步,赢得了第四局比赛。
这一万分之一的一步是否可以称之为“神之一手”我不知道,但是人工智能或许可以帮助我们参悟围棋。同理,其他行业也一样。
3
人工智能
人工智能这个概念在各个行业都有应用,它是一个很有力的工具。前几天我还看到利用人工智能总结科技论文。
论文太长不想看,或者找不到重点?这时候可以用这个AI来帮助我们进行一句话总结,还真是挺有趣的。
今天的人工智能和十九世纪的电灯和火车一样,新鲜、厉害、并且让一些人害怕。将人工智能系统人格化的倾向加剧了人们的误解和恐慌,开发者们不得不保证在研究AI的同时,一定也会思考长期影响,在这场变革中负起责任。
但现实是人工智能还处于萌芽阶段,智能家电距离我们比《终结者》的画面近得多。另一方面,我们正在高速的冲向未来,可以看到目前“出圈”的人工智能研究都是跨学科综合研究。团队中的专家各有所长,负责自己的一部分,没有人能做到看清楚一个项目的全貌,更别说预测这个项目成果10年之后对全人类的影响了。所以说,过分惶恐或者等着开发者负起责任什么的,都是没有必要的。
硅基智能和碳基生物的长远未来我无法想象,但是在可预见的时间里,人工智能一定是最有力的帮手,有力到可以替代一批人,这是必然的,也是不用担心的。就好像在采集时代,一个人带着一片能兜住东西的大叶子采果子,第二个人就不必去了,于是他可能在休息的时候学会了生火。
这次的AlphaFold2事件后,有人“担心”施一公,颜宁要失业了。我想他们应该是吃着同伴采回来的果子,兴奋地研究眼前木头的那第二个人,并且很满意自己不用苦哈哈地去采摘了。结构是打开生物功能的钥匙,功能大门之后还另有乾坤。