原文標題:AIastheengine,humansasthesteeringwheel
作者:Vitalik,Ethereum創(chuàng)始人;編譯:白水,金色財經(jīng)
特別感謝DevanshMehta、DavideCrapis和JulianZawistowski的反饋和審查,以及TinaZhen、ShawWalters和其他人的討論。
如果你問人們喜歡民主結(jié)構(gòu)的哪些方面,無論是政府、工作場所還是基于Blockchain的DAO,你經(jīng)常會聽到相同的論點:它們避免權(quán)力集中,它們?yōu)橛脩籼峁⿵娪辛Φ谋WC,因為沒有一個人可以隨心所欲地完全改變系統(tǒng)的方向,它們可以通過收集許多人的觀點和智慧來做出更高質(zhì)量的決策。
如果你問人們不喜歡民主結(jié)構(gòu)的哪些方面,他們經(jīng)常會給出相同的抱怨:普通選民不夠老練,因為每個選民只有很小的機會影響結(jié)果,很少有選民在決策中投入高質(zhì)量的思考,而且你經(jīng)常會得到低參與度(使系統(tǒng)易于攻擊)或事實上的集中化,因為每個人都默認信任和復制一些有影響力的人的觀點。
這篇文章的目標是探索一種范式,也許可以使用人工智能讓我們從民主結(jié)構(gòu)中獲益而沒有負面影響。“人工智能是引擎,人類是方向盤”。人類只向系統(tǒng)提供少量信息,可能只有幾百位,但都是經(jīng)過深思熟慮且質(zhì)量極高的。人工智能將這些數(shù)據(jù)視為“目標函數(shù)”,并不知疲倦地做出大量決策,盡最大努力實現(xiàn)這些目標。特別是,這篇文章將探討一個有趣的問題:我們能否在不將單個人工智能置于中心的情況下做到這一點,而是依靠任何人工智能(或人機混合體)都可以自由參與的競爭性開放市場?
單個“游戲玩家”可以是LLM、相互交互并調(diào)用各種互聯(lián)網(wǎng)服務(wù)的LLM群、各種AI+人類組合以及許多其他構(gòu)造;作為機制設(shè)計師,您不需要知道。理想目標是擁有一個可以自動運行的機制——
這種方法的好處是:
它避免將任何單一模型納入機制;相反,你會得到一個由許多不同參與者和架構(gòu)組成的開放市場,它們都有自己不同的偏見。開放模型、封閉模型、代理群、人類+AI混合體、機器人、無限猴子等都是公平的游戲;該機制不會歧視任何人。
該機制是開源的。雖然玩家不是,但游戲是開源的——而且這是一種已經(jīng)被相當充分理解的模式(例如,政黨和市場都以這種方式運作)
該機制很簡單,因此機制設(shè)計者將自己的偏見編碼到設(shè)計中的途徑相對較少
該機制不會改變,即使從現(xiàn)在開始直到奇點,底層參與者的架構(gòu)每三個月需要重新設(shè)計一次。
指導機制的目標是忠實地反映參與者的根本目標。它只需要提供少量信息,但應(yīng)該是高質(zhì)量的信息。
你可以認為該機制利用了提出答案和驗證答案之間的不對稱性。這類似于數(shù)獨很難解決,但很容易驗證解決方案是否正確。你(i)創(chuàng)建一個開放的市場,讓玩家充當“解題者”,然后(ii)維護一個由人類運行的機制,執(zhí)行驗證已提出解決方案的簡單得多的任務(wù)。Futarchy
Futarchy最初由RobinHanson提出,意為“投票價值,但賭注信念”。投票機制選擇一組目標(可以是任何目標,但前提是它們必須是可衡量的),然后將其組合成一個度量M。當您需要做出決定時(為簡單起見,我們假設(shè)是YES/NO),您會設(shè)置條件市場:您要求人們押注(i)是否會選擇YES或NO,(ii)如果選擇YES,則M的值,否則為零,(iii)如果選擇NO,則M的值,否則為零。有了這三個變量,您就可以確定市場是否認為YES或NO對M的值更有利。
用于信用分配的精煉人類判斷的玩具示例,請參閱此處的Python代碼。腳本要求您擔任陪審團,并包含一些預先包含在代碼中的AI生成(和人類生成)完整列表。該機制識別最適合陪審團答案的完整列表的線性組合。在這種情況下,獲勝組合是0.199*Claude的答案+0.801*Deepseek的答案;這個組合比任何單個模型都更符合陪審團的答案。這些系數(shù)也將是給予提交者的獎勵。
在這個“擊敗索倫”的例子中,“人類作為方向盤”的方面體現(xiàn)在兩個地方。首先,每個問題都應(yīng)用了高質(zhì)量的人類判斷,盡管這仍然利用陪審團作為“技術(shù)官僚”績效評估者。其次,有一個隱含的投票機制,決定“擊敗索倫”是否是正確的目標(而不是,比如說,試圖與索倫結(jié)盟,或?qū)⒛硹l關(guān)鍵河流以東的所有領(lǐng)土都交給他作為和平讓步)。還有其他精煉的人類判斷用例,其中陪審團的任務(wù)更直接地帶有價值觀:例如,想象一個分散的社交媒體平臺(或子社區(qū)),陪審團的工作是將隨機選擇的論壇帖子標記為遵守或不遵守社區(qū)規(guī)則。
在提煉人類判斷范式中,存在一些開放變量:
如何進行抽樣?完整名單提交者的作用是提供大量答案;陪審員的作用是提供高質(zhì)量的答案。我們需要以這樣的方式選擇陪審員,并為陪審員選擇問題,即模型匹配陪審員答案的能力最大程度地表明其總體表現(xiàn)。一些考慮因素包括:
專業(yè)知識與偏見的權(quán)衡:熟練的陪審員通常專門從事其專業(yè)領(lǐng)域,因此讓他們選擇要評級的內(nèi)容,您將獲得更高質(zhì)量的輸入。另一方面,過多的選擇可能會導致偏見(陪審員偏愛與他們有聯(lián)系的人的內(nèi)容)或抽樣的弱點(某些內(nèi)容系統(tǒng)地未評級)
反古德哈特:將有內(nèi)容試圖“玩弄”人工智能機制,例如,貢獻者生成大量看起來令人印象深刻但無用的代碼。這意味著陪審團可以檢測到這一點,但靜態(tài)人工智能模型除非他們努力嘗試,否則不會檢測到。捕捉這種行為的一種可能方法是添加一種挑戰(zhàn)機制,通過該機制,個人可以標記此類嘗試,保證陪審團對其進行判斷(從而激勵人工智能開發(fā)人員確保正確捕捉它們)。如果陪審團同意,舉報者將獲得獎勵,如果陪審團不同意,則要支付罰款。
您使用什么評分函數(shù)?當前深度資助試點中使用的一個想法是詢問陪審員“A還是B應(yīng)該獲得更多的信用,以及多多少?”。評分函數(shù)為score(x)=sum((log(x[B])-log(x[A])-log(juror_ratio))**2for(A,B,juror_ratio)injury_answers):也就是說,對于每個陪審團答案,它會詢問完整列表中的比率與陪審員提供的比率有多遠,并添加與距離平方成比例的懲罰(在對數(shù)空間中)。這是為了表明評分函數(shù)的設(shè)計空間很豐富,評分函數(shù)的選擇與您向陪審員提出哪些問題的選擇有關(guān)。
您如何獎勵完整列表提交者?理想情況下,您希望經(jīng)常給予多個參與者非零獎勵,以避免壟斷機制,但您也希望滿足以下屬性:參與者不能通過多次提交相同(或略微修改)的答案集來增加獎勵。一種有希望的方法是直接計算最適合陪審團答案的完整列表的線性組合(系數(shù)非負且總和為1),并使用這些相同的系數(shù)來分割獎勵。也可能有其他方法。
總的來說,目標是采用已知有效、偏見最小化且經(jīng)受住了時間考驗的人類判斷機制(例如,想象一下法院系統(tǒng)的對抗結(jié)構(gòu)如何包括爭議的兩方,他們擁有大量信息但有偏見,而法官擁有少量信息但可能沒有偏見),并使用開放的人工智能市場作為這些機制的合理高保真度和非常低成本的預測指標(這類似于法學碩士“提煉”的工作方式)。深度融資
深度融資是將人類精煉的判斷應(yīng)用于填寫“X的信用有多少百分比屬于Y?”圖上邊的權(quán)重問題。
最簡單的方法是直接用一個例子來說明:
兩級深度融資示例的輸出:Ethereum的思想起源。請在此處查看Python代碼。
這里的目標是分配對Ethereum的哲學貢獻的榮譽。讓我們看一個例子:
這里顯示的模擬深度融資輪次將20.5%的功勞歸于密碼朋克運動,將9.2%的功勞歸于技術(shù)進步主義。
在每個節(jié)點中,您都會提出一個問題:它在多大程度上是原創(chuàng)貢獻(因此它值得為自己贏得功勞),在多大程度上是其他上游影響的重新組合?對于密碼朋克運動,它有40%是新的,60%是依賴項。
然后,您可以查看這些節(jié)點上游的影響:自由主義小政府主義和無政府主義為密碼朋克運動贏得了17.3%的功勞,但瑞士直接民主只獲得了5%。
但請注意,自由主義小政府主義和無政府主義也啟發(fā)了Bitcoin的貨幣哲學,因此它通過兩種途徑影響了Ethereum的哲學。
要計算自由主義小政府主義和無政府主義對Ethereum的總貢獻份額,你需要將每條路徑上的邊相乘,然后將路徑相加:0.205*0.6*0.173+0.195*0.648*0.201~=0.0466。因此,如果你必須捐贈100美元來獎勵所有為Ethereum的哲學做出貢獻的人,根據(jù)這一模擬的深度融資輪,自由主義小政府主義者和無政府主義者將獲得4.66美元。
這種方法旨在適用于那些在以前的工作基礎(chǔ)上進行工作且結(jié)構(gòu)高度清晰的領(lǐng)域。學術(shù)界(想想:引用圖)和開源軟件(想想:庫依賴關(guān)系和分叉)就是兩個自然的例子。
一個運作良好的深度資助系統(tǒng)的目標是創(chuàng)建和維護一個全局圖,任何有興趣支持某個特定項目的資助者都能夠?qū)①Y金發(fā)送到代表該節(jié)點的地址,資金將根據(jù)圖邊緣的權(quán)重自動傳播到其依賴項(并遞歸到它們的依賴項等)。
你可以想象一個去中心化協(xié)議使用內(nèi)置深度融資裝置來發(fā)行其Tokens:協(xié)議內(nèi)的去中心化治理將選擇一個陪審團,陪審團將運行深度融資機制,因為協(xié)議會自動發(fā)行Tokens并將其存入與其自身對應(yīng)的節(jié)點。通過這樣做,協(xié)議以編程方式獎勵其所有直接和間接貢獻者,讓人想起B(yǎng)itcoin或Ethereum區(qū)塊獎勵如何獎勵一種特定類型的貢獻者(礦工)。通過影響邊緣的權(quán)重,陪審團可以不斷定義它重視的貢獻類型。這種機制可以作為Mining、銷售或一次性空投的去中心化和長期可持續(xù)的替代方案。增加隱私
通常,要對上述示例中的問題做出正確的判斷,需要能夠訪問私人信息:組織的內(nèi)部聊天記錄、社區(qū)成員秘密提交的信息等!皟H使用單個AI”的一個好處,尤其是在規(guī)模較小的環(huán)境中,是讓一個AI訪問信息比向所有人公開信息更容易被接受。
為了在這些情況下使精煉的人類判斷或深度資助發(fā)揮作用,我們可以嘗試使用加密技術(shù)安全地讓AI訪問私人信息。這個想法是使用多方計算(MPC)、完全同態(tài)加密(FHE)、可信執(zhí)行環(huán)境(TEE)或類似機制來提供私人信息,但僅限于其唯一輸出是直接放入機制中的“完整列表提交”的機制。
如果你這樣做,那么你就必須將機制集限制為AI模型(而不是人類或AI+人類組合,因為你不能讓人類看到數(shù)據(jù)),并且特定于在某些特定基底(例如MPC、FHE、可信硬件)中運行的模型。一個主要的研究方向是找出近期足夠有效、有意義的實用版本。發(fā)動機+方向盤設(shè)計的優(yōu)點
這樣的設(shè)計有許多令人期待的好處。迄今為止,最重要的好處是,它們允許構(gòu)建DAO,讓人類選民控制方向,但他們不會被過多的決策所困擾。它們達到了折衷,每個人不必做出N個決定,但他們擁有的權(quán)力不僅僅是做出一個決定(委托通常如何運作),而且更能引發(fā)難以直接表達的豐富偏好。
此外,這樣的機制似乎具有激勵平滑特性。我在這里所說的“激勵平滑”是兩個因素的組合:
擴散:投票機制采取的任何單一行動都不會對任何單一參與者的利益產(chǎn)生過大影響。
混亂:投票決策與它們?nèi)绾斡绊憛⑴c者利益之間的聯(lián)系更加復雜且難以計算。
這里的混淆和擴散這兩個術(shù)語取自密碼學,它們是密碼和哈希函數(shù)安全的關(guān)鍵屬性。
當今現(xiàn)實世界中激勵平滑的一個很好的例子是法治:政府高層不會定期采取“給愛麗絲的公司2億美元”、“罰款鮑勃的公司1億美元”等形式的行動,而是通過旨在均勻應(yīng)用于大量參與者的規(guī)則,然后由另一類參與者進行解釋。當這種方法奏效時,好處是它大大減少了賄賂和其他形式腐敗的好處。當它被違反時(在實踐中經(jīng)常發(fā)生),這些問題很快就會被大大放大。
人工智能顯然將成為未來的重要組成部分,這將不可避免地成為未來治理的重要組成部分。但是,如果你讓人工智能參與治理,這有明顯的風險:人工智能有偏見,它可能在訓練過程中被故意破壞,而且人工智能技術(shù)發(fā)展如此之快,“讓人工智能掌權(quán)”可能實際上意味著“讓負責升級人工智能的人掌權(quán)”。精煉的人類判斷提供了一條前進的替代道路,讓我們能夠以開放的自由市場方式利用人工智能的力量,同時保持人類控制的民主。
免責聲明:Vitalik:依靠任何AI都可以自由參與競爭性開放市場嗎?文章轉(zhuǎn)發(fā)自互聯(lián)網(wǎng),版權(quán)歸其所有。
文章內(nèi)容不代表本站立場和任何投資暗示。加密貨幣市場極其波動,風險很高,可能不適合所有投資者。在投資加密貨幣之前,請確保自己充分了解市場和投資的風險,并考慮自己的財務(wù)狀況和風險承受能力。此外,請遵循您所在國家的法律法規(guī),以及遵守交易所和錢包提供商的規(guī)定。對于任何因使用加密貨幣所造成的投資損失或其他損失,本站不承擔任何責任。
Copyright © 2021.Company 元宇宙YITB.COM All rights reserved.元宇宙YITB.COM