Gemini 官網(wǎng):https://gemini.google.com
Google Gemini 是由 Google DeepMind 開(kāi)發(fā)的一系列多模態(tài)大型語(yǔ)言模型,被認(rèn)為是 LaMDA 和 PaLM 2 的后繼者。Gemini 包括三個(gè)模型:Gemini Ultra、Gemini Pro 和 Gemini Nano,分別針對(duì)不同的任務(wù)優(yōu)化。Gemini Ultra 設(shè)計(jì)用于處理高度復(fù)雜的任務(wù),Gemini Pro 旨在適應(yīng)廣泛的任務(wù),而 Gemini Nano 則專為端側(cè)設(shè)備上的任務(wù)設(shè)計(jì)。Gemini 模型是多模態(tài)的,能夠理解和操作文本、代碼、音頻、圖像和視頻等不同類型的信息。這些模型不僅在多種行業(yè)基準(zhǔn)測(cè)試中表現(xiàn)出色,而且還是首個(gè)在大規(guī)模多任務(wù)語(yǔ)言理解(MMLU)測(cè)試中超越人類專家的模型,顯示了其在多項(xiàng)選擇題上的卓越理解能力。
Gemini 1.0 的推出標(biāo)志著 Google 在 AI 領(lǐng)域的一個(gè)重要進(jìn)步,它不僅能夠提高開(kāi)發(fā)者和企業(yè)客戶使用 AI 構(gòu)建和擴(kuò)展應(yīng)用的能力,而且也展示了 Google 在負(fù)責(zé)任地推動(dòng) AI 發(fā)展方面的承諾。Google 還通過(guò)使用其 Tensor Processing Units (TPUs) v4 和 v5e 在 AI 優(yōu)化的基礎(chǔ)設(shè)施上進(jìn)行大規(guī)模訓(xùn)練,確保了 Gemini 的高效性和可擴(kuò)展性。此外,Gemini 在安全性和可靠性方面也進(jìn)行了廣泛的評(píng)估,包括偏見(jiàn)和毒性評(píng)估,以及對(duì)網(wǎng)絡(luò)攻擊、說(shuō)服力和自主性等潛在風(fēng)險(xiǎn)領(lǐng)域的創(chuàng)新性研究。
2023年12月6日,Sundar Pichai 和 Demis Hassabis 通過(guò)虛擬新聞發(fā)布會(huì)宣布了 Gemini 1.0。Gemini Pro 和 Nano 分別被集成到 Bard 和 Pixel 8 Pro 智能手機(jī)中,而 Gemini Ultra 則計(jì)劃在2024年初為軟件開(kāi)發(fā)者提供,并將被用于 Bard Advanced。Gemini 1.5 在2024年2月15日發(fā)布,提供了更快的性能和更高的效率,這得益于包括新架構(gòu)在內(nèi)的各種技術(shù)進(jìn)步。
Gemini 模型的技術(shù)規(guī)格包括基于解碼器的變換器,具有高效訓(xùn)練和推理的修改,以及長(zhǎng)達(dá)32,768個(gè)令牌的上下文窗口長(zhǎng)度。它的數(shù)據(jù)集是多模態(tài)和多語(yǔ)言的,包括網(wǎng)絡(luò)文檔、書(shū)籍、代碼以及圖像、音頻和視頻數(shù)據(jù)。Gemini 1.5 Pro 是一種稀疏的專家混合變換器,具有多達(dá)1000萬(wàn)個(gè)令牌的可變上下文長(zhǎng)度,但具體細(xì)節(jié)尚不清楚。
Gemini 的發(fā)布引發(fā)了廣泛的關(guān)注和討論,被認(rèn)為是 Google 在 AI 領(lǐng)域的一次重要突破。它不僅在多模態(tài)理解和生成方面展示了先進(jìn)的能力,而且在編程和科學(xué)領(lǐng)域內(nèi)的應(yīng)用潛力也引起了人們的興趣。此外,Gemini 的推出被視為 Google 與 OpenAI 之間競(jìng)爭(zhēng)的一個(gè)新篇章,展示了 Google 在構(gòu)建更復(fù)雜、更負(fù)責(zé)任的 AI 模型方面的持續(xù)投資和創(chuàng)新。