作者:Jinming來源:HashKeyCapital翻譯:善歐巴,金色財經引言
人工智能代理(AIAgent)的概念,指的是能夠理解其環(huán)境并代表用戶或機器自主執(zhí)行行動以實現其目標的智能軟件系統(tǒng),早在20世紀80年代就已提出。然而,直到2010年代,隨著深度學習和大型語言模型(LLM)的興起,展示了它們理解和生成類人響應的能力,這一概念才開始受到關注。
如今,LLM已成為我們生活中不可或缺的一部分,像ChatGPT這樣的產品在全球擁有超過1550萬付費用戶,隨著OpenAI推出更智能的推理模型,需求必將進一步增長。ChatGPT、Claude和DeepSeek等LLM的廣泛應用為代理經濟的自然發(fā)展鋪平了道路。代理比LLM更復雜,它被定義為一個由單個模型或多個模型組成的系統(tǒng),以及一個帶有工具集并定義代理身份的框架(圖1)。
配備角色、工具包的代理可以接收任務,分析、處理并代表用戶自主執(zhí)行行動,盡管有時需要人工參與提供反饋并通過強化學習進行學習。代理本質上是可組合的,隨著代理變得更加專業(yè)化和技術成熟,代理系統(tǒng)的人工參與部分可能會退居次要地位,而代理之間的通信將成為簡化復雜工作流程和釋放效率提升的重點。隨著基于代理的框架不斷進步,我們預計通過集成Blockchain(一種基于透明度、去中心化和激勵一致的技術),將在各種應用中獲得指數級的收益。
此外,通過利用Blockchain技術的可信、安全和透明的特性,智能合約上的代理可以執(zhí)行自主錢包交易,因良好行為而獲得Tokens激勵,并因對抗行為而受到懲罰。在本報告中,我們將首先探討什么是多智能體系統(tǒng)以及支持這些系統(tǒng)開發(fā)的編排框架,然后了解多智能體系統(tǒng)與Web3技術之間的協(xié)同作用。隨后,我們將探討Web3多智能體框架的用例、挑戰(zhàn)和解決問題的努力。
圖1:代理的組件
AutoGen
AutoGen是微軟研究院人工智能前沿實驗室設計的開源多智能體框架。它以其模塊化和可擴展的設計促進了多智能體應用程序的開發(fā)。AutoGenCore實現了可以使用Python和.NET語言編程的消息傳遞和事件驅動智能體。AgentChatAPI實現了智能體之間的無縫通信,并構建在CoreAPI之上。各種擴展可用,使智能體能夠執(zhí)行各種功能,例如網頁瀏覽、視頻分析、文件分析以及封裝Langchain工具等。基于AutoGen多智能體框架構建的MagenticOne能夠執(zhí)行代碼、瀏覽網頁和管理文件等任務。
CrewAI
CrewAI是一個開源多智能體平臺,它通過明確定義的基于角色的多智能體編排實現高效且無縫的任務自動化。其架構允許具有可配置角色、目標和個性的智能體按順序或并行交互,確保有序的任務執(zhí)行。為了保持相關性,智能體可以利用支持文本源和結構化數據格式的廣泛知識庫。CrewAI還提供對LangChain和LlamaIndex工具的訪問,以及Portkey提供的企業(yè)級功能,使智能體能夠輕松使用外部API、數據庫和檢索系統(tǒng)。該平臺對開發(fā)人員也很友好,支持基于YAML的配置,這使得開發(fā)人員可以輕松配置和部署智能體。
Langroid
Langroid是一個開源Python編程框架,它將多智能體編程作為其核心設計原則,賦予智能體與公民類似的地位。該框架因其簡潔、直觀和可擴展性而受到開發(fā)人員的認可,它提供了各種模塊和工具,可以滿足復雜智能體應用程序的需求。默認情況下,智能體充當消息轉換器,并具有3種響應器方法:LLM響應器、智能體響應器和用戶響應器。這些響應器方法共同允許智能體執(zhí)行功能、生成人類可讀的自然語言響應,并將人類反饋納入其智能體工作流程。圍繞智能體封裝任務使其能夠通過將子任務委派給其他智能體來編排交互。通過ToolMessage機制支持OpenAILLM和LLM函數調用,智能體可以訪問各種工具和函數。結合與LanceDB、Qdrant和Chroma等向量存儲的集成,Langroid的智能體具有持久的對話狀態(tài)和向量存儲內存,使其擅長管理復雜的動態(tài)場景。
CAMEL
CAMEL是一個開源多智能體框架,為任務自動化、數據生成和現實世界模擬等廣泛應用提供通用基礎設施。作為CAMEL的一部分,社會模塊在多智能體協(xié)調中起著至關重要的作用。它包含兩個框架——RolePlaying和BabyAGI——旨在管理智能體交互并推動目標導向的結果。其角色扮演、對話導向的方法使其非常適合構建面向客戶的智能體。CAMEL與各種向量數據庫和LLM的集成支持RAG,并為其智能體提供持久內存,使其非常適合大規(guī)模企業(yè)應用程序。然而,RolePlaying框架的成功目前要求開發(fā)人員具備有效的提示工程技能和角色設計,這可能會使其對那些沒有強大的編碼和人工智能背景的人不太友好。CAMEL已經部署了一個人工智能聊天機器人EigentBot,它可以獲取實時信息,支持多模態(tài)功能,并利用圖形RAG實現更好的上下文理解。
MetaGPT
MetaGPT是一種元編程多智能體編排框架,它將標準操作程序(SOP)編碼為提示序列,并結合明確定義的智能體角色和職責。這種設計有助于緩解智能體間交互帶來的更復雜的幻覺風險。MetaGPT中的智能體通過定義的輸出格式到一個共享消息池進行通信,而不是進行一對一的對話,從而減少了不相關或丟失的內容。它還實現了可執(zhí)行的反饋機制,支持自我糾正和審查。MetaGPT在軟件開發(fā)環(huán)境中特別有效,在這些環(huán)境中,明確定義的角色可以提高代碼質量和任務分配。當根據代碼生成基準進行衡量時,MetaGPT在HumanEval和MBPP中取得了顯著的成果,分別為85.9%和87.7%。
LangGraph
LangGraph是LangChain創(chuàng)建者開發(fā)的開源智能體框架。它旨在管理復雜的多智能體工作流程,具有模塊化架構,使不同的智能體能夠高效地通信、協(xié)調和執(zhí)行任務。通過使用基于圖的架構來建模智能體工作流程的不同組件之間的關系,LangGraph促進了動態(tài)任務分配、無縫可擴展性以及跨分布式系統(tǒng)的強大問題解決能力。這種創(chuàng)新方法簡化了狀態(tài)管理,適用于需要持久保留上下文的多步驟工作流程。此外,Langchain模型上下文協(xié)議(MCP)適配器(一個輕量級包裝器)允許將MCP工具輕松轉換為Langchain工具,供LangGraph智能體使用,從而擴展其可用工具集。在多智能體領域,LangGraph受益于強大的網絡效應,因為它利用了LangChain生態(tài)系統(tǒng)。
ElizaOS
ElizaOS可能是最著名的Web3多智能體框架,是一個開源TypeScript多智能體框架,它嵌入了Web3組件,以解決加密行業(yè)的入門障礙和可訪問性問題。該框架采用模塊化設計,帶有廣泛的插件集,目前能夠支持一系列模型(即OpenAI、DeepSeek、Llama、Qwen等)、平臺集成(即Twitter、Discord、Telegram、Farcaster等)以及超過25種鏈兼容性(即Solana、Ethereum、Ton、Aptos、Sui、Sei等)。它與GOATSDK的集成還使智能體能夠執(zhí)行各種鏈上操作。ElizaOS的核心架構由智能體、角色文件、提供程序、操作和評估器組成,它們共同使智能體在執(zhí)行各種任務時具有持久的內存和上下文感知能力,并從評估器那里獲取反饋以確保更好的性能。
一個值得注意的例子是ai16zDAOFund,它利用ElizaOS框架創(chuàng)建了一個自主智能體,可以過濾市場信號并交易各種meme幣。在其鼎盛時期,它管理著超過3600萬美元的AUM。
作為Web3中最成熟的智能體框架,ElizaOS智能體框架繼續(xù)受到Web3開發(fā)人員的歡迎,因為它獲得了超過14K的github星星,并且目前擁有99個集成。隨著未來計劃推出智能體啟動平臺,這可以通過為開發(fā)人員提供一個無需/低代碼的智能體啟動平臺來進一步激發(fā)他們的興趣。
RIG
另一個擁有超過3Kgithub星星的流行Web3智能體框架是RIG,一個基于Rust的開源智能體框架,它通過提供輕量級核心同時支持高級推理模式(從提示鏈到條件邏輯和并行任務執(zhí)行)而脫穎而出。RIG框架在支持的LLM提供商(OpenAI、cohere、DeepSeek等)之間提供統(tǒng)一的API,并為RAG實現提供簡化的嵌入和向量存儲支持。還可以創(chuàng)建自定義工具,使該框架可擴展用于基于LLM的應用程序。
利用Rust的異步功能,多智能體系統(tǒng)可以并發(fā)處理多個任務。盡管它目前在23個Web3原生集成方面落后于ElizaOS。RIG背后的開發(fā)人員ARC已與Solana基金會合作,通過向使用RIG構建基于Rust的智能體的開發(fā)人員提供有針對性的贈款來推動該框架的采用。此外,ARC還推出了其智能體啟動平臺Forge,該平臺采用與Virtuals類似的啟動平臺模型,但目前僅允許列入白名單的團隊訪問該平臺。RIG和Forge啟動平臺的一個值得注意的用例是AskJimmy平臺,這是一個多智能體對沖基金,它協(xié)調由交易策略庫驅動的智能體群,以便在Hyperliquid、Drift、GMX等領先平臺上跨EVM和Solana無縫執(zhí)行交易。
G.A.M.E
VirtualsProtocol團隊開發(fā)的G.A.M.E框架是一個基于Python和JavaScript的開源多智能體框架,它促進了鏈上智能體的創(chuàng)建。它與Web3庫GOATSDK的集成,為智能體提供了跨各種協(xié)議的200多個鏈上操作。任務處理通過分層方法完成,其中任務規(guī)劃器將任務分解為子任務,并將其委派給協(xié)調和通信以交付最終輸出的專業(yè)工作智能體。目前,其大多數智能體都圍繞社交媒體平臺和游戲內環(huán)境展開,最著名的智能體是AIXBT。自推出以來,AIXBT(一個具有自己X帳戶的AI驅動的鏈上分析影響者)因其分析見解而廣受認可,截至撰寫本文時,擁有超過49萬粉絲。
盡管Web2多智能體框架已經相對成熟并獲得了強大的機構需求,但與Web3多智能體框架相比,它們缺乏原生鏈上功能。使用Web2工具的開發(fā)人員必須附加第三方庫才能與智能合約交互或解析Blockchain數據,從而引入復雜性和潛在的漏洞。使用Web3多智能體框架的開發(fā)人員可以受益于這些框架提供的內置鏈上功能,在部署鏈上智能體時提供更無縫的體驗,因為他們可以更專注于設計良好的前端用戶體驗。此外,通過利用Blockchain和智能合約作為底層基礎設施,鏈上智能體可以受益于加密軌道,例如讓其錢包代表用戶執(zhí)行鏈上操作并確保激勵一致性。Web3多智能體框架的性能指標
簡化Web3中的工作流程
盡管Web2代理框架日益成熟和普及,但代理概念直到2024年第四季度才在Web3中獲得關注。ElizaOS、VirtualsProtocol和RIG等主要參與者(各自擁有自己的Tokens)實現了可觀的市值,凸顯了Web3中對AI代理的強烈需求,而不僅僅是投機交易。這些Tokens市值所反映出的興奮并非毫無根據,因為Web3仍在努力實現主流采用。讓Blockchain上的代理自主執(zhí)行鏈上操作,具有改變用戶體驗的巨大潛力。除了可以實現的效率之外,Web3中代理的問題還可以追溯到Blockchain中AI的類似論點,即透明度和可追溯性以及先進的安全功能。代理交易記錄在Blockchain上,用戶可以輕松跟蹤和驗證代理采取的行動。下面,我們重點介紹一些最適合代理采用的關鍵領域。
DeFAI
鏈上交易本質上是復雜的,要求用戶至少對Blockchain和Web3錢包有基本的了解。這造成了糟糕的用戶體驗,并且仍然是非加密原生用戶的重要障礙。盡管最近社交登錄已被各種Web3錢包提供商廣泛采用,但賬戶和鏈抽象的開發(fā)仍然緩慢且有限。用戶在瀏覽DeFi格局時仍然需要理解gas費用、錢包地址、橋接等概念。相比之下,OpenAI最近推出的OperatorAgent僅需要用戶進行簡單的自然語言處理即可執(zhí)行交易,通過后端代理處理抽象掉用戶必須采取的多個步驟。Web3也不應該有什么不同,我們認為將AI代理與各種DeFi(DeFAI)協(xié)議集成可以促進更輕松的用戶入門和無縫體驗。
VirtualsProtocol最近推出了代理商務協(xié)議,該協(xié)議為代理如何相互通信和交互設定了標準化方法。這種方法引入了涉及請求、協(xié)商、交易和評估的4個階段的過程。評估器、基于智能合約的托管和加密驗證的引入是該框架的核心功能,可確保交付的交易滿足任務的要求。一旦滿足所有要求,智能合約觸發(fā)器將解鎖資金并交付服務,從而確保交易可以透明且無需信任地進行。代理商務協(xié)議只是一個示例,說明多智能體編排框架如何幫助在鏈上以無需信任且安全的方式驅動代理交互。
OlasProtocol展示了DeFAI的實際應用:其Pearl應用商店包含Mobius和Optimus代理,它們使用Olas堆棧在Uniswap、Balancer和Sturdy等平臺上自動化DeFi策略,涵蓋Optimism、Base和Mode等網絡。OlasProtocol的Mech市場也充當代理工具和插件交換中心,允許部署的代理通過代理間通信外包任務。另一個值得注意的例子是Questflow,它還提出了一個意圖匹配的多智能體編排框架,用戶的請求由識別相關代理的編排器處理,并通過監(jiān)督代理工作流程執(zhí)行的任務管理器將代理委派給這些任務。由于代理在Deagent代理注冊表中分派,代理創(chuàng)建者也可以獲得公平的報酬。數據所有權
在龐大的代理格局和生成的大量鏈上數據中,鏈上分析正成為一個日益有價值的領域,許多項目都在尋求提供數據標記服務(例如SaharaAI)、跟蹤(ArkhamIntelligence、Kaito)、證明注冊表(EAS、BAS等)。代理作為用戶的得力助手,可以通過獲得用戶的許可,為Web3中不斷增長的數據格局做出貢獻,使用戶可以因其數據貢獻而獲得公平的獎勵。
游戲
在Web3游戲社區(qū)中,對AI支持的代理的興趣和需求不斷增長。游戲代理可以為非玩家角色(NPC)提供動力或管理游戲內經濟。它們通過自主執(zhí)行任務和響應玩家操作來幫助創(chuàng)建動態(tài)、響應式環(huán)境。該領域值得注意的項目包括Parallel的WayFinder平臺,該平臺正在構建一個知識圖,可供AI代理在游戲中的不同代理工作流程中使用。TreasureDAO是另一個值得注意的例子,它最近宣布即將推出由ElizaOS提供支持的MAGE代理啟動平臺,進一步朝著代理驅動的Web3游戲格局邁進。VirtualsProtocol還推出了ProjectWestWorld,這是一個Roblox中的交互式模擬,由G.A.M.E框架驅動的多智能體自主交互并驅動動態(tài)游戲敘事。
其他用例
AI驅動的DAO:代理可以將冗長的提案提煉成主流用戶易于理解和投票的易于理解的信息,從而增強去中心化的核心精神。
智能合約審計、網絡分析、欺詐檢測:代理在調試中可以發(fā)揮至關重要的作用,通常比人類更快地識別潛在風險,從而在與人類智能結合時降低安全風險。
供應鏈優(yōu)化:通過使用AI的預測能力和Blockchain的透明和安全功能,這可以簡化并實現更具成本效益的運營。成熟Web3多智能體系統(tǒng)面臨的挑戰(zhàn)和努力
Web3環(huán)境中的多智能體系統(tǒng)(MAS)(其中代理在去中心化基礎設施上運行,并且通常使用智能合約進行協(xié)調)面臨著一些可能影響其設計、部署和性能的限制和挑戰(zhàn)。以下是Web2和Web3代理可能面臨的一些障礙:
與基于單個LLM的系統(tǒng)一樣,多智能體系統(tǒng)也受到模型幻覺風險的影響。當幻覺從一個代理傳遞到另一個代理時,多智能體系統(tǒng)中的幻覺風險可能更嚴重,從而加劇了問題。代理之間管理不善的通信將導致次優(yōu)的性能。因此,當我們走向未來的完全自主代理時,許多框架仍然需要一些人工監(jiān)督。
實現代理之間的共識和狀態(tài)同步。在多智能體系統(tǒng)中,為了成功完成任務,代理必須在復雜且分層的多智能體系統(tǒng)中導航,確保與整體任務、自身職責和多智能體通信保持一致。
Web3中的代理還面臨可擴展性和延遲問題,因為它們在底層Blockchain上運行,因此與其他類型的交易競爭區(qū)塊空間。這可能意味著在Blockchain可擴展性挑戰(zhàn)得到解決之前,我們在可預見的未來看不到大型代理網絡的完全鏈上編排。Blockchain上的安全和隱私挑戰(zhàn)在Web3環(huán)境中也是獨一無二的,這增加了復雜性。然而,隨著Turnkey等新興解決方案的出現,這種情況正在慢慢得到解決,Turnkey提供了一個TEE解決方案(AWSNitroEnclaves),代理可以在其中安全且可驗證地執(zhí)行操作。PhalaNetwork還宣布與GoPlus建立合作伙伴關系,利用Phala的TEE功能和GoPlus安全功能來增強ElizaOS代理。
多智能體內存管理。在多智能體系統(tǒng)中,不同的代理執(zhí)行不同的任務并存儲不同的信息。因此,為了確保成功交付總體目標,達成信息共識是有幫助的,同時實施強大的訪問控制機制至關重要,因為某些代理可能正在處理高度敏感的信息。未能實施強大的安全措施可能導致數據隱私泄露和任務執(zhí)行失敗。
某些領域(例如科學實驗室實驗、經濟學建模和鏈上技能)缺乏全面的基準和評估標準可能會阻礙該領域的快速增長。結論
多智能體框架的未來充滿希望,但也充滿挑戰(zhàn),這凸顯了前路漫漫。與已建立且獲得機構認可的Web2多智能體框架相比,Web3多智能體框架仍處于相對起步階段,生產就緒的用例狹窄。盡管如此,監(jiān)管轉變和為緩解上述挑戰(zhàn)而做出的持續(xù)努力是進一步采用的關鍵催化劑。
此外,代理開發(fā)工具(例如SendAI套件、Coinbase代理套件、ShellAgent無代碼平臺、Olas堆棧等)的增長,以簡化代理創(chuàng)建并擴展代理的用例,繼續(xù)取得進展,推動開發(fā)人員的增長和新的創(chuàng)新。GOATSDK等Web3庫的進步有助于擴展代理實現的操作的可能性。最終,隨著技術的發(fā)展和這些系統(tǒng)的成熟,我們可以期待代理工作流程在鏈上交互中變得司空見慣。就像有許多Web2多智能體框架一樣,我們希望在Web3中看到更多提供通用和利基方法的代理框架。
免責聲明:多智能體系統(tǒng)——當前形勢與展望文章轉發(fā)自互聯網,版權歸其所有。
文章內容不代表本站立場和任何投資暗示。加密貨幣市場極其波動,風險很高,可能不適合所有投資者。在投資加密貨幣之前,請確保自己充分了解市場和投資的風險,并考慮自己的財務狀況和風險承受能力。此外,請遵循您所在國家的法律法規(guī),以及遵守交易所和錢包提供商的規(guī)定。對于任何因使用加密貨幣所造成的投資損失或其他損失,本站不承擔任何責任。
Copyright © 2021.Company 元宇宙YITB.COM All rights reserved.元宇宙YITB.COM