奇米超碰,男男激情网站,少妇无码免费专区,九色视频老

  • 元宇宙:本站分享元宇宙相關(guān)資訊,資訊僅代表作者觀點(diǎn)與平臺立場無關(guān),僅供參考.

Vitalik新文:未來治理新范式“AI引擎+人類方向盤”

  • 2025年3月03日 16:11

原文標(biāo)題:AIastheengine,humansasthesteeringwheel

作者:Vitalik,Ethereum創(chuàng)始人;編譯:白水,金色財經(jīng)

如果你問人們喜歡民主結(jié)構(gòu)的哪些方面,無論是政府、工作場所還是基于Blockchain的DAO,你經(jīng)常會聽到相同的論點(diǎn):它們避免權(quán)力集中,它們?yōu)橛脩籼峁⿵?qiáng)有力的保證,因?yàn)闆]有一個人可以隨心所欲地完全改變系統(tǒng)的方向,它們可以通過收集許多人的觀點(diǎn)和智慧來做出更高質(zhì)量的決策。

如果你問人們不喜歡民主結(jié)構(gòu)的哪些方面,他們經(jīng)常會給出相同的抱怨:普通選民不夠老練,因?yàn)槊總選民只有很小的機(jī)會影響結(jié)果,很少有選民在決策中投入高質(zhì)量的思考,而且你經(jīng)常會得到低參與度(使系統(tǒng)易于攻擊)或事實(shí)上的中心化,因?yàn)槊總人都默認(rèn)信任和復(fù)制一些有影響力的人的觀點(diǎn)。

這篇文章的目標(biāo)是探索一種范式,也許可以使用AI讓我們從民主結(jié)構(gòu)中獲益而沒有負(fù)面影響!癆I是引擎,人類是方向盤”。人類只向系統(tǒng)提供少量信息,可能只有幾百位,但都是經(jīng)過深思熟慮且質(zhì)量極高的。AI將這些數(shù)據(jù)視為“目標(biāo)函數(shù)”,并不知疲倦地做出大量決策,盡最大努力實(shí)現(xiàn)這些目標(biāo)。特別是,這篇文章將探討一個有趣的問題:我們能否在不將單個AI置于中心的情況下做到這一點(diǎn),而是依靠任何AI(或人機(jī)混合體)都可以自由參與的競爭性開放市場?

eX5akh6Nb0PMI4ABlb8cQ6j0g3hn4OcvTEyDbuKy.jpeg

單個“游戲玩家”可以是LLM、相互交互并調(diào)用各種互聯(lián)網(wǎng)服務(wù)的LLM群、各種AI+人類組合以及許多其他構(gòu)造;作為機(jī)制設(shè)計師,您不需要知道。理想目標(biāo)是擁有一個可以自動運(yùn)行的機(jī)制——如果該機(jī)制的目標(biāo)是選擇資助什么,那么它應(yīng)該盡可能地像Bitcoin或Ethereum區(qū)塊獎勵一樣。

這種方法的好處是:

它避免將任何單一模型納入機(jī)制;相反,你會得到一個由許多不同參與者和架構(gòu)組成的開放市場,它們都有自己不同的偏見。開放模型、封閉模型、代理群、人類+AI混合體、機(jī)器人、無限猴子等都是公平的游戲;該機(jī)制不會歧視任何人。

該機(jī)制是開源的。雖然玩家不是,但游戲是開源的——而且這是一種已經(jīng)被相當(dāng)充分理解的模式(例如,政黨和市場都以這種方式運(yùn)作)

該機(jī)制很簡單,因此機(jī)制設(shè)計者將自己的偏見編碼到設(shè)計中的途徑相對較少

該機(jī)制不會改變,即使從現(xiàn)在開始直到奇點(diǎn),底層參與者的架構(gòu)每三個月需要重新設(shè)計一次。

指導(dǎo)機(jī)制的目標(biāo)是忠實(shí)地反映參與者的根本目標(biāo)。它只需要提供少量信息,但應(yīng)該是高質(zhì)量的信息。

你可以認(rèn)為該機(jī)制利用了提出答案和驗(yàn)證答案之間的不對稱性。這類似于數(shù)獨(dú)很難解決,但很容易驗(yàn)證解決方案是否正確。你(i)創(chuàng)建一個開放的市場,讓玩家充當(dāng)“解題者”,然后(ii)維護(hù)一個由人類運(yùn)行的機(jī)制,執(zhí)行驗(yàn)證已提出解決方案的簡單得多的任務(wù)。Futarchy

Futarchy最初由RobinHanson提出,意為“為價值投票,但為信念押注”。投票機(jī)制選擇一組目標(biāo)(可以是任何目標(biāo),但前提是它們必須是可衡量的),然后將其組合成一個度量M。當(dāng)您需要做出決定時(為簡單起見,我們假設(shè)是YES/NO),您會設(shè)置條件市場:您要求人們押注(i)是否會選擇YES或NO,(ii)如果選擇YES,則M的值,否則為零,(iii)如果選擇NO,則M的值,否則為零。有了這三個變量,您就可以確定市場是否認(rèn)為YES或NO對M的值更有利。

exm0UEqPUEU7B2KRJfw4bHv5nv8GEhyRLMUSpQ04.jpeg

用于信用分配的蒸餾人類判斷的玩具示例,請參閱此處的Python代碼。腳本要求您擔(dān)任陪審團(tuán),并包含一些預(yù)先包含在代碼中的AI生成(和人類生成)完整列表。該機(jī)制識別最適合陪審團(tuán)答案的完整列表的線性組合。在這種情況下,獲勝組合是0.199*Claude的答案+0.801*Deepseek的答案;這個組合比任何單個模型都更符合陪審團(tuán)的答案。這些系數(shù)也將是給予提交者的獎勵。

在這個“擊敗索倫”的例子中,“人類作為方向盤”的方面體現(xiàn)在兩個地方。首先,每個問題都應(yīng)用了高質(zhì)量的人類判斷,盡管這仍然利用陪審團(tuán)作為“技術(shù)官僚”績效評估者。其次,有一個隱含的投票機(jī)制,決定“擊敗索倫”是否是正確的目標(biāo)(而不是,比如說,試圖與索倫結(jié)盟,或?qū)⒛硹l關(guān)鍵河流以東的所有領(lǐng)土都交給他作為和平讓步)。還有其他蒸餾的人類判斷用例,其中陪審團(tuán)的任務(wù)更直接地帶有價值觀:例如,想象一個分散的社交媒體平臺(或子社區(qū)),陪審團(tuán)的工作是將隨機(jī)選擇的論壇帖子標(biāo)記為遵守或不遵守社區(qū)規(guī)則。

在蒸餾人類判斷范式中,存在一些開放變量:

如何進(jìn)行抽樣?完整名單提交者的作用是提供大量答案;陪審員的作用是提供高質(zhì)量的答案。我們需要以這樣的方式選擇陪審員,并為陪審員選擇問題,即模型匹配陪審員答案的能力最大程度地表明其總體表現(xiàn)。一些考慮因素包括:

專業(yè)知識與偏見的權(quán)衡:熟練的陪審員通常專門從事其專業(yè)領(lǐng)域,因此讓他們選擇要評級的內(nèi)容,您將獲得更高質(zhì)量的輸入。另一方面,過多的選擇可能會導(dǎo)致偏見(陪審員偏愛與他們有聯(lián)系的人的內(nèi)容)或抽樣的弱點(diǎn)(某些內(nèi)容系統(tǒng)地未評級)

反古德哈特:將有內(nèi)容試圖“玩弄”人工智能機(jī)制,例如,貢獻(xiàn)者生成大量看起來令人印象深刻但無用的代碼。這意味著陪審團(tuán)可以檢測到這一點(diǎn),但靜態(tài)人工智能模型除非他們努力嘗試,否則不會檢測到。捕捉這種行為的一種可能方法是添加一種挑戰(zhàn)機(jī)制,通過該機(jī)制,個人可以標(biāo)記此類嘗試,保證陪審團(tuán)對其進(jìn)行判斷(從而激勵人工智能開發(fā)人員確保正確捕捉它們)。如果陪審團(tuán)同意,舉報者將獲得獎勵,如果陪審團(tuán)不同意,則要支付罰款。

您使用什么評分函數(shù)?當(dāng)前深度資助試點(diǎn)中使用的一個想法是詢問陪審員“A還是B應(yīng)該獲得更多的信用,以及多多少?”。評分函數(shù)為score(x)=sum((log(x[B])-log(x[A])-log(juror_ratio))**2for(A,B,juror_ratio)injury_answers):也就是說,對于每個陪審團(tuán)答案,它會詢問完整列表中的比率與陪審員提供的比率有多遠(yuǎn),并添加與距離平方成比例的懲罰(在對數(shù)空間中)。這是為了表明評分函數(shù)的設(shè)計空間很豐富,評分函數(shù)的選擇與您向陪審員提出哪些問題的選擇有關(guān)。

您如何獎勵完整列表提交者?理想情況下,您希望經(jīng)常給予多個參與者非零獎勵,以避免壟斷機(jī)制,但您也希望滿足以下屬性:參與者不能通過多次提交相同(或略微修改)的答案集來增加獎勵。一種有希望的方法是直接計算最適合陪審團(tuán)答案的完整列表的線性組合(系數(shù)非負(fù)且總和為1),并使用這些相同的系數(shù)來分割獎勵。也可能有其他方法。

總的來說,目標(biāo)是采用已知有效、偏見最小化且經(jīng)受住了時間考驗(yàn)的人類判斷機(jī)制(例如,想象一下法院系統(tǒng)的對抗結(jié)構(gòu)如何包括爭議的兩方,他們擁有大量信息但有偏見,而法官擁有少量信息但可能沒有偏見),并使用開放的人工智能市場作為這些機(jī)制的合理高保真度和非常低成本的預(yù)測指標(biāo)(這類似于大預(yù)言模型“蒸餾”的工作方式)。深度融資(deepfunding)

深度融資是將人類蒸餾的判斷應(yīng)用于填寫“X的信用有多少百分比屬于Y?”圖上邊的權(quán)重問題。

最簡單的方法是直接用一個例子來說明:

兩級深度融資示例的輸出:Ethereum的思想起源。請在此處查看Python代碼。

這里的目標(biāo)是分配對Ethereum的哲學(xué)貢獻(xiàn)的榮譽(yù)。讓我們看一個例子:

這里顯示的模擬深度融資輪次將20.5%的功勞歸于密碼朋克運(yùn)動,將9.2%的功勞歸于技術(shù)進(jìn)步主義。

在每個節(jié)點(diǎn)中,您都會提出一個問題:它在多大程度上是原創(chuàng)貢獻(xiàn)(因此它值得為自己贏得功勞),在多大程度上是其他上游影響的重新組合?對于密碼朋克運(yùn)動,它有40%是新的,60%是依賴項(xiàng)。

然后,您可以查看這些節(jié)點(diǎn)上游的影響:自由主義小政府主義和無政府主義為密碼朋克運(yùn)動贏得了17.3%的功勞,但瑞士直接民主只獲得了5%。

但請注意,自由主義小政府主義和無政府主義也啟發(fā)了Bitcoin的貨幣哲學(xué),因此它通過兩種途徑影響了Ethereum的哲學(xué)。

要計算自由主義小政府主義和無政府主義對Ethereum的總貢獻(xiàn)份額,你需要將每條路徑上的邊相乘,然后將路徑相加:0.205*0.6*0.173+0.195*0.648*0.201~=0.0466。因此,如果你必須捐贈100美元來獎勵所有為Ethereum的哲學(xué)做出貢獻(xiàn)的人,根據(jù)這一模擬的深度融資輪,自由主義小政府主義者和無政府主義者將獲得4.66美元。

這種方法旨在適用于那些在以前的工作基礎(chǔ)上進(jìn)行工作且結(jié)構(gòu)高度清晰的領(lǐng)域。學(xué)術(shù)界(想想:引用圖)和開源軟件(想想:庫依賴關(guān)系和分叉)就是兩個自然的例子。

一個運(yùn)作良好的深度資助系統(tǒng)的目標(biāo)是創(chuàng)建和維護(hù)一個全局圖,任何有興趣支持某個特定項(xiàng)目的資助者都能夠?qū)①Y金發(fā)送到代表該節(jié)點(diǎn)的地址,資金將根據(jù)圖邊緣的權(quán)重自動傳播到其依賴項(xiàng)(并遞歸到它們的依賴項(xiàng)等)。

你可以想象一個去中心化協(xié)議使用內(nèi)置深度融資裝置來發(fā)行其Tokens:協(xié)議內(nèi)的去中心化治理將選擇一個陪審團(tuán),陪審團(tuán)將運(yùn)行深度融資機(jī)制,因?yàn)閰f(xié)議會自動發(fā)行Tokens并將其存入與其自身對應(yīng)的節(jié)點(diǎn)。通過這樣做,協(xié)議以編程方式獎勵其所有直接和間接貢獻(xiàn)者,讓人想起B(yǎng)itcoin或Ethereum區(qū)塊獎勵如何獎勵一種特定類型的貢獻(xiàn)者(礦工)。通過影響邊緣的權(quán)重,陪審團(tuán)可以不斷定義它重視的貢獻(xiàn)類型。這種機(jī)制可以作為Mining、銷售或一次性空投的去中心化和長期可持續(xù)的替代方案。增加隱私

通常,要對上述示例中的問題做出正確的判斷,需要能夠訪問私人信息:組織的內(nèi)部聊天記錄、社區(qū)成員秘密提交的信息等。“僅使用單個AI”的一個好處,尤其是在規(guī)模較小的環(huán)境中,是讓一個AI訪問信息比向所有人公開信息更容易被接受。

為了在這些情況下使蒸餾的人類判斷或深度資助發(fā)揮作用,我們可以嘗試使用加密技術(shù)安全地讓AI訪問私人信息。這個想法是使用多方計算(MPC)、完全同態(tài)加密(FHE)、可信執(zhí)行環(huán)境(TEE)或類似機(jī)制來提供私人信息,但僅限于其唯一輸出是直接放入機(jī)制中的“完整列表提交”的機(jī)制。

如果你這樣做,那么你就必須將機(jī)制集限制為AI模型(而不是人類或AI+人類組合,因?yàn)槟悴荒茏屓祟惪吹綌?shù)據(jù)),并且特定于在某些特定基底(例如MPC、FHE、可信硬件)中運(yùn)行的模型。一個主要的研究方向是找出近期足夠有效、有意義的實(shí)用版本。發(fā)動機(jī)+方向盤設(shè)計的優(yōu)點(diǎn)

這樣的設(shè)計有許多令人期待的好處。迄今為止,最重要的好處是,它們允許構(gòu)建DAO,讓人類選民控制方向,但他們不會被過多的決策所困擾。它們達(dá)到了折衷,每個人不必做出N個決定,但他們擁有的權(quán)力不僅僅是做出一個決定(委托通常如何運(yùn)作),而且更能引發(fā)難以直接表達(dá)的豐富偏好。

此外,這樣的機(jī)制似乎具有激勵平滑特性。我在這里所說的“激勵平滑”是兩個因素的組合:

擴(kuò)散:投票機(jī)制采取的任何單一行動都不會對任何單一參與者的利益產(chǎn)生過大影響。

混亂:投票決策與它們?nèi)绾斡绊憛⑴c者利益之間的聯(lián)系更加復(fù)雜且難以計算。

這里的混淆和擴(kuò)散這兩個術(shù)語取自密碼學(xué),它們是密碼和哈希函數(shù)安全的關(guān)鍵屬性。

當(dāng)今現(xiàn)實(shí)世界中激勵平滑的一個很好的例子是法治:政府高層不會定期采取“給愛麗絲的公司2億美元”、“罰款鮑勃的公司1億美元”等形式的行動,而是通過旨在均勻應(yīng)用于大量參與者的規(guī)則,然后由另一類參與者進(jìn)行解釋。當(dāng)這種方法奏效時,好處是它大大減少了賄賂和其他形式腐敗的好處。當(dāng)它被違反時(在實(shí)踐中經(jīng)常發(fā)生),這些問題很快就會被大大放大。

AI顯然將成為未來的重要組成部分,這將不可避免地成為未來治理的重要組成部分。但是,如果你讓AI參與治理,這有明顯的風(fēng)險:AI有偏見,它可能在訓(xùn)練過程中被故意破壞,而且AI技術(shù)發(fā)展如此之快,“讓AI掌權(quán)”可能實(shí)際上意味著“讓負(fù)責(zé)升級AI的人掌權(quán)”。蒸餾的人類判斷提供了一條前進(jìn)的替代道路,讓我們能夠以開放的自由市場方式利用AI的力量,同時保持人類控制的民主。

特別感謝DevanshMehta、DavideCrapis和JulianZawistowski的反饋和審查,以及TinaZhen、ShawWalters和其他人的討論。

Copyright © 2021.Company 元宇宙YITB.COM All rights reserved.元宇宙YITB.COM

无码一区二区久久久| 四房激情综合五月| 99热这里都是精品| 亚洲色图88| 国精品伦一区一区三区有限公司| 天堂一二三不卡| 日韩高清无码免费视| 在线性aV| 蜜桃色影院| 熟妇人妻久久中文字幕按摩| 国内一区二区在线播放| 精品人妻九九| 精品少弄得99久久精品区别 | xxav.av| P2020国产精品久久精品| 国产热の有码热の无码| 亚洲操出白浆| 黄色av网址在线观看| 射精人妻在线播放| 久久网国产亚洲欧美精品| 美女乳汁多多久久久| 亚洲成人无码一级| 青青操国产视频91| 嗯美日韩二区3区| 久久久久亚洲精品无码系列| 无码中国字一区| 色悠悠高清综合| 园产一区二区三区天堂视频| 小蝌蚪国产精品午夜场| 亚洲色图欧美色图久久| 亚洲成人aⅤ精品无码| 一本久道综合在线无码人妻| 亚洲高清一二区二区三区| 亚洲一区 日韩 欧美| 三妻四妾免费观看完整版高清| 无码九九一本| 欧美日韩黑人麻豆| 国产精品毛片精彩视频| 亚洲中文无码AV永久伊人| 怡红院久久| 99国产免费观看|