Gemini 簡介:
號稱我們最大、能力最強的人工智慧模型,Gemini 是我們迄今為止最靈活的模型– 能夠在從資料中心到行動裝置的所有裝置上高效運作。其最先進的功能將顯著增強開發人員和企業客戶利用人工智慧進行建置和擴展的方式。
針對三種不同的尺寸優化了Gemini 1.0(我們的第一個版本):
Gemini Ultra-我們最大、最有能力的模型,適用於高度複雜的任務。
Gemini Pro-我們可擴展各種任務的最佳模型。
Gemini Nano-我們最有效率的裝置端任務模型。
最先進的性能
我們一直在嚴格測試Gemini 模型並評估其在各種任務中的表現。從自然影像、音訊和視訊理解到數學推理,Gemini Ultra 的性能在大型語言模型(LLM) 研發中使用的32 個廣泛使用的學術基準中的30 個上超過了當前最先進的結果。
Gemini Ultra 的得分高達90.0%,是第一個在MMLU(大規模多任務語言理解)上超越人類專家的模型,該模型結合了數學、物理、歷史、法律、醫學和倫理學等57 個科目來測試知識和解決問題的能力。
我們新的MMLU 基準方法使Gemini 能夠利用其推理能力在回答難題之前更仔細地思考,從而比僅使用第一印像有顯著改進。
此圖表顯示了Gemini Ultra 在常見文字基準測試中與GPT-4 的效能比較(在報告數字缺失的情況下計算的API 數字)。
Gemini 在文字和編碼等一系列基準測試中超越了最先進的效能。
Gemini Ultra 也在新的MMMU基準測試中取得了59.4% 的最先進分數,該基準測試由跨越不同領域、需要深思熟慮的推理的多模態任務組成。
根據我們測試的圖像基準,Gemini Ultra 的性能優於以前最先進的模型,無需從圖像中提取文字以進行進一步處理的物件字元辨識(OCR) 系統的幫助。這些基準凸顯了雙子座天生的多模態性,並顯示了雙子座更複雜推理能力的早期跡象。
請參閱我們的Gemini 技術報告以了解更多詳細資訊。
這張圖表顯示了Gemini Ultra 與GPT-4V 相比在多模式基準上的效能,先前的SOTA 模型列出了GPT-4V 不支援功能的地方。
從圖中可見,Gemini 在一系列多模式基準測試中超越了最先進的效能。
下一代功能
到目前為止,創建多模態模型的標準方法涉及針對不同模態訓練單獨的組件,然後將它們拼接在一起以粗略地模仿其中的一些功能。這些模型有時擅長執行某些任務,例如描述影像,但難以處理更概念和複雜的推理。
我們將Gemini 設計為原生多模式,從一開始就針對不同模式進行了預訓練。然後我們使用額外的多模態數據對其進行微調,以進一步完善其有效性。這有助於Gemini 從頭開始無縫地理解和推理各種輸入,遠遠優於現有的多模式模型– 而且其功能幾乎在每個領域都是最先進的。
詳細了解Gemini 的功能並了解其工作原理。
複雜的推理
Gemini 1.0 複雜的多模式推理功能可以幫助理解複雜的書面和視覺訊息。這使得它在發現大量數據中難以辨別的知識方面具有獨特的能力。
其透過閱讀、過濾和理解資訊從數十萬份文件中提取見解的卓越能力將有助於在從科學到金融的許多領域以數位速度實現新的突破。
雙子座開啟了新的科學見解。
理解文字、圖像、音訊等
Gemini 1.0 經過訓練,可以同時識別和理解文字、圖像、音訊等,因此它可以更好地理解微妙的訊息,並可以回答與複雜主題相關的問題。這使得它特別擅長解釋數學和物理等複雜學科的推理。
雙子座解釋數學和物理推理。
進階編碼
我們的第一個版本的Gemini 可以理解、解釋和產生世界上最受歡迎的程式語言(如Python、Java、C++ 和Go)的高品質程式碼。它跨語言工作和推理複雜訊息的能力使其成為世界領先的編碼基礎模型之一。
Gemini Ultra 在多個編碼基準測試中表現出色,包括HumanEval(用於評估編碼任務性能的重要行業標準)和Natural2Code(我們內部保留的資料集),該資料集使用作者生成的來源而不是基於網路的資訊.
Gemini 也可以用作更高級編碼系統的引擎。兩年前,我們推出了AlphaCode,這是第一個在程式設計競賽中達到競爭效能水準的人工智慧程式碼產生系統。
使用Gemini 的專門版本,我們創建了更先進的程式碼產生系統AlphaCode 2,它擅長解決超出編碼範圍、涉及複雜數學和理論計算機科學的競爭性程式設計問題。
雙子座擅長編碼和競賽程式設計。
當在與原始AlphaCode 相同的平台上進行評估時,AlphaCode 2 顯示出巨大的改進,解決的問題數量幾乎是原來的兩倍,我們估計它的表現優於85% 的競賽參與者,而AlphaCode 的這一比例接近50%。當程式設計師透過為程式碼範例定義某些屬性來與AlphaCode 2 協作時,它的效能會更好。
我們很高興程式設計師越來越多地使用功能強大的人工智慧模型作為協作工具,幫助他們推理問題、提出程式碼設計並協助實施,這樣他們就可以更快地發布應用程式並設計更好的服務。
請參閱我們的AlphaCode 2 技術報告以了解更多詳細資訊。
更可靠、可擴展且高效
我們使用Google 內部設計的張量處理單元(TPU) v4 和v5e 在我們的 AI 優化基礎設施上大規模訓練Gemini 1.0。我們將其設計為最可靠、最可擴展的訓練模型,以及最高效的服務模型。
在TPU 上,Gemini 的運行速度明顯快於早期、較小且功能較差的型號。這些客製化設計的人工智慧加速器一直是Google人工智慧產品
的核心,這些產品為搜尋、YouTube、Gmail、Google地圖、Google Play 和Android 等數十億用戶提供服務。它們也使世界各地的公司能夠經濟高效地訓練大規模人工智慧模型。
今天,我們宣布推出迄今為止最強大、最高效且可擴展的TPU 系統Cloud TPU v5p,專為訓練尖端AI 模型而設計。這款新一代TPU將加速Gemini的開發,幫助開發者和企業客戶更快訓練大規模生成式AI模型,讓新產品和能力更快到達客戶手中。
以責任和安全為核心構建
在Google,我們致力於在我們所做的一切事情中推進大膽且負責任的人工智慧。基於Google 的人工智慧原則和我們產品中強大的安全政策,我們正在添加新的保護措施來考慮Gemini 的多模式功能。在開發的每個階段,我們都會考慮潛在的風險,並努力測試和減輕它們。
Gemini 擁有迄今為止所有Google AI 模型中最全面的安全評估,包括偏見和毒性。我們對網路攻擊、說服和自主等潛在風險領域進行了新穎的研究,並應用了Google Research 一流的對抗性測試技術來幫助在Gemini 部署之前識別關鍵的安全問題。
為了找出內部評估方法中的盲點,我們正在與各種外部專家和合作夥伴合作,針對一系列問題對我們的模型進行壓力測試。
為了診斷Gemini 訓練階段的內容安全問題並確保其輸出符合我們的政策,我們使用了諸如“真實毒性提示”之類的基準,這是一組從網絡中提取的100,000 個不同程度毒性的提示,由艾倫研究所的專家開發。對於人工智慧。有關這項工作的更多細節即將推出。
為了限制傷害,我們建立了一個專門的安全分類器來識別、標記和整理涉及暴力或負面刻板印象的內容。結合強大的過濾器,這種分層方法旨在使Gemini 對每個人都更安全、更具包容性。此外,我們正在繼續解決模型的已知挑戰,例如事實性、基礎性、歸因和佐證。
責任和安全性始終是我們模型開發和部署的核心。這是一項需要協作建構的長期承諾,因此我們正在與業界和更廣泛的生態系統合作,透過MLCommons 、 Frontier Model Forum 及其AI 安全基金以及我們的安全人工智慧框架(SAIF),旨在幫助減輕公共和私營部門人工智慧系統特有的安全風險。在開發Gemini 的過程中,我們將繼續與世界各地的研究人員、政府和民間團體合作。
讓Gemini 走向世界
Gemini 1.0 現已在一系列產品和平台上推出:
Google 產品中的Gemini Pro
我們透過Google 產品將Gemini 帶給數十億人。
從今天開始,巴德將使用Gemini Pro 的微調版本來進行更高級的推理、計劃、理解等。這是Bard 自推出以來最大的升級。它將在170 多個國家和地區提供英語版本,我們計劃在不久的將來擴展到不同的模式並支援新的語言和地點。
我們也將Gemini 引入Pixel。 Pixel 8 Pro 是第一款運行Gemini Nano 的智慧型手機,它支援Recorder 應用程式中的Summarize 等新功能,並從WhatsApp 開始推出Gboard 中的Smart Reply,明年還會推出更多訊息應用程式。
在接下來的幾個月中,Gemini 將出現在我們更多的產品和服務中,例如搜尋、廣告、Chrome 和Duet AI。
我們已經開始在搜尋中試驗Gemini,它使用戶的搜尋生成體驗(SGE)更快,美國英語的延遲減少了40%,同時品質也提高了。
與雙子座一起建造
從12 月13 日開始,開發者和企業客戶可以透過Google AI Studio 或Google Cloud Vertex AI 中的Gemini API 存取Gemini Pro。
Google AI Studio 是一款基於網路的免費開發者工具,可使用API 金鑰快速建立應用程式原型並啟動應用程式。當需要完全託管的AI 平台時,Vertex AI 允許對Gemini 進行自訂,提供全面的資料控制,並受益於額外的Google Cloud 功能,以實現企業安全、安全、隱私以及資料治理和合規性。
Android 開發人員還可以透過AICore(Android 14 中提供的新系統功能,從Pixel 8 Pro 裝置開始)使用Gemini Nano(我們最高效的裝置端任務模型)進行建置。註冊以取得AICore 的早期預覽版。
雙子座即將推出
對於Gemini Ultra,我們目前正在完成廣泛的信任和安全檢查,包括由受信任的外部方進行紅隊檢查,並在廣泛使用之前使用微調和基於人類反饋的強化學習(RLHF)進一步完善模型。
作為此過程的一部分,我們將向選定的客戶、開發人員、合作夥伴以及安全和責任專家提供Gemini Ultra 進行早期實驗和回饋,然後在明年初向開發人員和企業客戶推出。
明年初,我們還將推出Bard Advanced,這是一種全新的尖端AI 體驗,讓您可以從Gemini Ultra 開始使用我們最好的型號和功能。
雙子座時代:開啟創新未來
這是人工智慧發展的一個重要里程碑,也是我們谷歌新時代的開始,我們將繼續快速創新並負責任地提高模型的能力。
到目前為止,我們在Gemini 上取得了巨大進展,我們正在努力進一步擴展其未來版本的功能,包括規劃和記憶體方面的進步,以及增加上下文視窗以處理更多資訊以提供更好的響應。
我們對人工智慧賦能的世界所帶來的驚人可能性感到興奮——這是一個創新的未來,它將增強創造力、擴展知識、推進科學並改變世界各地數十億人的生活和工作方式。
閱讀參考:
https://storage.googleapis.com/deepmind-media/AlphaCode2/AlphaCode2_Tech_Report.pdf
https://storage.googleapis.com/deepmind-media/gemini/gemini_1_report.pdf
https://cloud.google.com/vertex-ai
https://deepmind.google/technologies/gemini/
原创文章,作者:首席安全官,如若转载,请注明出处:https://cncso.com/tw/google-gemini-ai-mega-model-surpasses-chatgpt-on-all-fronts-html