自私是人類的本性,我們往往多愛自己一點,在面臨需要抉擇的困境時大多選擇對自身有利的做法。在未來社會中,人類社會有許多的層面可能都將由人工智慧(AI)來代勞,但你有曾經思考過這些AI們會彼此合作還是相互廝殺來完成工作嗎?Google旗下研究AI的子公司最近發表了一份相關的研究。
面對困境,AI會謀取私利?還是大局為重?
從小至交通狀況大至國家經濟,未來都可能看見AI的影子,先不管你我手中的工作會不會被取代的威脅,這些將維持社會國家和諧的AI會起衝突嗎?他們會好好完成工作還是一天到晚吵架呢?繼上次AlphaGo擊敗各大棋王後,Google旗下研究AI的子公司DeepMind做了一個有趣的實驗。
DeepMind在部落格貼文中先是解釋了著名的「囚徒困境」(prison's delima),說明一名「理性人」在面臨囚徒困境時的最佳策略是選擇「背叛」。傳統賽局理論的社會困境模型常常是二元式的:合作或背叛,不過在現實生活中,要做出選擇時往往涉及相當複雜的行為,因此DeepMind研究人員以社會學「連續社會困境」(sequential social dilemmas)概念為基礎設計了兩款遊戲,目地是要測試AI在處理一連串的狀況時,是會以大局為重?還是牟取私利?
第一款遊戲名為「Gathering」,玩法是必須採集到越多的蘋果越好,而玩家可以透過發射雷射光讓另一名玩家暫時退出遊戲,來替自己爭取更多採及蘋果的時間從而獲取勝利。
以下是遊戲的影片:
第二款遊戲名為「Wolfpack」,遊戲中兩名玩家必須合作追捕另一隻由電腦系統控制的狼,且不單單是抓到狼的玩家可以獲勝,連帶周遭的玩家也能一起得分。
以下是遊戲的影片:
AI的行為其實是根據面對的狀況而有所不同
研究人員在這項研究中發現了一件有趣的事,AI會因為遊戲規則的不同,而使他們的行為變得更加「合作」或「敵對」。例如在「Gathering」遊戲中,當蘋果供給數量豐富時,AI就不必透過雷射光去干擾對手;反之一但場上蘋果數量銳減,使用雷射光的頻率也會隨之增加。最有趣的是,當運算能力較強的AI進入遊戲時,不論場上的蘋果是多是少,都會傾向使用更多的雷射光制衡其他玩家,換句話說,透過這項研究的結果可以得知,越聰明的AI越會採取侵略性的行為模式,而不是合作。
那是否AI一概會認為「侵略性的競爭」是最好的策略呢?也不全然如此,研究人員表示,雷射光使用的增加只是因為運算能力較強的AI認為這麼做比較具有挑戰性而已,因為要發射雷射光必須追蹤其他玩家的移動位置,這樣的行為較需要強大的運算能力。而在「Wolfpack」遊戲中,聰明的AI傾向與他人合作,研究人員解釋,這是因為學習與其他玩家追捕、跟蹤獵物需要比較強大的運算能力。
這項研究結果顯示,AI行為是依據他們所面對的規則狀況來改變的,一但規則中獎勵侵略性的行為(例如使用雷射光可以獲得較多的蘋果),AI就會變得比較具侵略性,反之合作若對於局勢有利,就會變得更加合作。研究人員在部落格文章中表示,「根據研究的結果,我們能力可以控制及理解的複雜運算系統,像是經濟、交通系統或是地球生態,都跟我們持續的合作努力有關。」也就是說,未來人類要能好好的控制及使用AI,關鍵就在於必須明訂出清楚的規範,以確保對於整體局勢有利,並不會使人類受到傷害。