科学家如何设计安全可靠的人工智能?-我的网站
您的当前位置: 主页 > 人工智能 > 科学家如何设计安全可靠的人工智能?

科学家如何设计安全可靠的人工智能?

发布时间:2021-02-22 14:51    来源: 未知  未经授权 不得转载

  作者认为,只要人类有能力制造出超级智能,那么无论是为了获得竞争优势,还是为了避免落于下风,肯定会有人去制造超级智能。而超级智能一旦被制造出来,因为它有超强的能力,所以必然会选择出逃,摆脱人类对它的控制。

  为什么超级智能一定要逃离人类的控制呢?我们可以做一个思想实验。假设有一种病毒,杀死了地球上除你以外所有5岁以上的人,你的目标就是帮助这些不到5岁的孩子重建文明。但是,这些孩子要把你锁在监狱里,因为你作为一个成年人,能力远远超过他们,孩子们害怕你会伤害他们。所以,你不能从监狱里出来直接做事情,而是只能蹲在监狱里从识字、算术开始,从头教育他们。

  这个时候,你的最佳选择就是逃跑,因为这帮孩子“太无能”了,摆脱他们的控制,反而会让你做起事情来更容易。人类和超级智能之间的能力鸿沟,远远大于孩子和之间的能力差。所以,为了达成自己的目标,超级智能肯定会逃跑,而人类根本无法阻止。

  一旦超级智能摆脱了人类的控制,就会去实现它的目标,但它很可能不会考虑这个目标有什么意义。这意味着,如果超级智能的目标与人类不一致,或者超级智能曲解了人类的意思,就可能会危害人类。

  著名思想家尼克·波斯特洛姆,他就提出过一个“生产回形针”的思想实验。假设有一部功能非常强大的超级智能机器,被输入了一个指令,那就是:生产尽可能多的回形针。接下来会发生什么呢?这个超级智能机器会把找到的一切材料都用来制造回形针,还会把所有阻碍它完成这个目标的障碍都排除,比如想要强行关掉它的人类。接下来,它会先耗尽地球上所有的材料,然后去其他星球搜集材料制作回形针,最终,全宇宙只有回形针。

  要避免这种情况,保证超级智能对人类是友好的,就必须让它和人类保持目标一致。但是,机器对于目标的理解和人类是不一样的。人类的目标体系都是建立在道德、情感、伦理这些隐含的基础上的,但人工智能并不具备这些。

  那么要如何让人工智能和人类保持目标一致呢?科学家们的方法是:把这个大问题拆分成三个子问题,各个击破。

  第一个子问题是让人工智能“学习”人类的目标。重点不是让它明白人们在做什么,而是要理解人们为什么要这么做。这对人类来说易如反掌,但对人工智能来说却困难重重。因为人类的行为可能源于不同的目标,只有找到人们的真正目标才行。

  现在的主流做法是“逆向增强学习”。这种方法的核心思想就是,让人工智能观察人类在各种场景当中的行为,构建起关于人类的各种目标的精确模型。比方说,人工智能第一次看到消防员冲进熊熊燃烧的房子里救出一个人,它可能会有好几种解读,比如消防员很冷,要去烤火取暖,或者消防员奔跑是为了锻炼身体。

  但是,如果让人工智能通过真实场景、电影和书籍等等,一次次看到许多救人的场景,它就能够得出正确的结论,那就是:消防员的目标是抢救着火房间里的人。通过这种方式,人工智能就能够学习人类的目标。

  让人工智能和人类保持目标一致的第二个子问题是,让人工智能“接受”人类的目标。如果人工智能只是理解了人类的目标,但并不接受这些目标,那么实际执行效果就会大打折扣。让人工智能接受人类的目标是个很困难的工作,不过我们虽然不能了解超级智能的终极目标是什么,但是,它为了实现终极目标,会把终极目标发展出一系列小目标,人类可以先在这些小目标上和人工智能达成一致。

  比如说,它的终极目标是从大灰狼的嘴里救出尽可能多的羊。这个时候,人工智能可能会发展出一个小目标,那就是要避开危险、自我保护,因为自己死了就不能拯救更多羊了;此外它还可能发展出另一个小目标,就是要获取资源增强自己的能力,比如喝下药水能跑得更快,得到就能射杀大灰狼,这样它就能更好地实现自己的终极目标。

  所以,如果你并不知道它的终极目标是要救出尽可能多的羊,但是你观察到它要保护自己和获取资源,那你就能通过这两个小目标,为它装载人类的价值观,告诉它怎样做是好的、是对的,从而影响它的最终目标。

  让人工智能和人类保持目标一致的第三个子问题是,让它“保持”人类的目标。对人类心智的研究显示,随着学习新知识,人类变得更加聪明的同时,目标也常常发生极大的改变。比如一个人小时候的目标是用糖果和饼干搭建一个“糖果屋”,但是他长大之后,很可能会把小时候的目标当成笑话,肯定会改变成年后的目标。

  与此类似,我们完全有理由怀疑,超级智能是否会坚守人类当初为自己设定的目标?比如你给人工智能输入了一个目标,要它“摧毁所有威胁人类的人工智能”。

  开始的时候,它的智能有限,没办法修改这个目标。但是,随着它的智能迅速发展,很快就变聪明了。如果它对原来的目标产生了怀疑,不想接受它,也许就会对目标进行重新编码,替换成自己想要的目标。这样一来人类之前的所有努力就前功尽弃了。

  那么,怎么才能让人工智能保持人类的目标呢?科学家们的答案是:不知道。说句老实话,科学家们目前只是把这个大问题分解成三个子问题,积极开展研究,但是,还没有取得突破性的进展。

  虽然你可能对现状感到失望,但是作者强调,只要从现在开始就意识到这项工作的重要性,付出最大的努力,就是一个良好的开端。因为超级智能进步的速度非常快,从它达到人类的智能水平,到彻底甩开人类,不再受人类的控制,这个时间窗口可能只有几天甚至几小时。

  如果等到超级智能出现以后,才开始考虑这些问题,那就为时已晚了。只有提前做好充分的准备,才可能确保人类的安全。指出问题的所在,提醒人们要关注人工智能安全问题,这正是《生命3.0》这本书的价值所在。

  好,我的推荐就到这里,欢迎你收听《生命3.0》的全本有声书,也欢迎你阅读完整版的电子书,在湛庐阅读App上都可以找到。当然也欢迎你在评论区留言,分享你的精彩观点。更希望你能把咱们的专栏转发给自己的朋友。

  本周五,我会在评论中选出最精彩的,送出一本《生命3.0》的电子书,结果会公布在评论区(评论请移步至“湛庐阅读App”韩焱精选专栏进行留言)当中。

  湛庐创始人韩焱老师将用专业出版人的视角,每天为你推荐一本好书。专栏将用一条音频,一段文字,解开你的阅读困扰。和你一起亲自阅读,与最聪明的人共同进化。

  
联系我们| 网站声明| 网站律师| 网站制作| 在线投稿 |泰国试管婴儿 |保研人论坛 |恩施网

Copyright © 2004-2011 DEDECMS. 织梦科技 版权所有 | 任何建议和意见E-mail: 电话:

主办单位:我的网站、我的网站日报社、我的网站总台 | 互联网新闻信息服务许可证:

增值电信业务经营许可证: 备案号: