第640章 贪心并非全局最优解(2 / 2)

🎁美女直播

“这种‘贪心’策略的特点就是每次遇到一个新情况的时候,都从当前的角度出发,选择目前看来最好的选项。”李默然继续解释道,“就比如你在玩游戏的时候,每个关卡结束后都会爆出宝箱,你需要从大量的道具当中选择一个,而使用‘贪心’策略的玩家会始终选择目前自己最需要,或者所目前看来收益最大的道具。”

“在有些时候,这样的策略的确是可以得到不错的结果,但它并不是能适合一切情况。”

“一个简单的例子,比如在前面的关卡中会有一个非常没用的道具,它在前几关几乎不能给玩家带来任何收益,然而如果玩家没有这个道具,就会导致后期的关卡过不去……”

“这个时候,‘贪心’策略就失效了,因为每次都选择局部最优解,并不能在最后得到全局最优解!”

丁愿翔似乎明白了李默然的意思:“你是说,这个人工智能的策略其实是不完美的,战争在几年内或者几十年内对于帝国来说是收益最大的选项,但如果放到更长远的尺度……”

李默然点了点头:“这也和‘囚徒困境’很像,参与博弈的人每个人都贪心地去选择对自己最有利的方案的话,反而会导致整体结果都变差,形成‘双输’的局面。”

李默然看了一眼核心:“或许有什么办法可以修改这个人工智能的策略……让它的策略更加合理。”

但有一个问题摆在了李默然的面前,他应该怎么去修改这个人工智能的策略逻辑?这终究是一台冷冰冰的机器,它没有人类的感情,也不知道‘灵活变通’,只会按照预定的算法规则绝对理性地运行。

本小章还未完,请点击下一页继续阅读后面精彩内容!

将‘贪心策略’改为以一万年之后的结果为目标的‘深度优先搜索’?还是修改成动态规划算法,让这台算力接近无穷无尽的计算机去寻找那个全局最优解?

但无论李默然如何设置,冰冷的机器始终是冰冷的机器,即使是采用“动态规划”之类的算法,他也必须给对方提供价值函数或者目标,也就是告诉这台人工智能它要追求的最终目的是什么,他要去求什么的‘最大值’。

可这样的方法始终都会有漏洞的,就像新王给这台机器设置的目标是“帝国利益最大化”一样,在漫长的岁月中,指不定会出现什么问题。

他想起了以前看过的一部科幻电影,里面人类给人工智能设定的目标是“让地球更美好”,结果人工智能推算出来得到的策略是把人类全部干掉地球就美好了。甚至有公司会给人工智能设置“制造更多的马桶搋子”这样的生产目标,但人工智能执行到后面为了追求生产的最大化,就开始发动战争,侵略整个星系,然后用掠夺来的资源全部造马桶搋子。

听上去很离谱,但对于死板的机器就是会发生这样的事情的,即使李默然拼尽全力像一个律师一样把条款编得看上去滴水不漏,最后也会出问题出BUG。

庞大而复杂的机械系统,随着熵增,完全不出BUG的可能性几乎为零。新王真是给他出了个难题。

就在李默然苦思冥想之际,几个关键信息在他的脑海中交融,让他联想到了其他的事情。

死板的规则、灵活维持公平……

“这不是……和天道的情况一样吗……”李默然恍然大悟。

喜欢获得造物主系统,自创世界跑团请大家收藏:(www。aiquwx。com)获得造物主系统,自创世界跑团