[科技] [網路] Google I/O 2025 超懶人包：Gemini 和 AI 技術領軍，科技巨頭火力全開

2025/05/21

[科技] [網路] Google I/O 2025 超懶人包：Gemini 和 AI 技術領軍，科技巨頭火力全開

Google I/O 2025 聚焦於 AI 技術的全面升級，Gemini 2.5 模型及其衍生功能如 Deep Think、AI Mode、Project Mariner，展示了 Google 在 AI 推理、搜尋和代理應用上的突破。Android XR、Google Beam 和 Flow 等新工具進一步擴展了 AI 在硬體和創意領域的應用，為開發者和用戶提供了更智慧、沉浸式的體驗。

以下為 Google I/O 2025 介紹的主要新功能與服務

Gemini 2.5 模型系列升級

Gemini 2.5 模型系列在性能上顯著提升，適用於多種開發場景，包括文字、圖像、聲音及影像處理。該模型在 LMArena 排行榜上名列前茅，展現了其在數學、程式碼及多模態任務上的卓越表現。Gemini 2.5 Flash 現已脫離預覽階段，強調高效能與低延遲，特別適合企業應用。

Deep Think 模式

Deep Think 是 Gemini 2.5 Pro 的實驗性增強推理模式，專為複雜任務設計，涵蓋數學、程式碼及多模態推理。該模式目前正在進行額外的安全評估，預計將對 Google AI Ultra 訂閱者開放，提供更深入的問題解決能力。

Google AI Pro 與 Google AI Ultra 訂閱計劃

Google 推出兩種新訂閱計劃：Google AI Pro（每月 19.99 美元）提供比免費版本更高的使用額度；Google AI Ultra（每月 249.99 美元）則提供對最先進模型（如 Veo 3 和 Deep Think 模式）的最高訪問權限，適合專業 AI 創作者。

AI Mode 搜尋功能

AI Mode 是 Google 搜尋的實驗性功能，現已向美國所有用戶推出，支持複雜多部分問題查詢，並能根據 Gmail 等個人數據提供客製化結果。新增功能包括生成體育和金融查詢的圖表，以及即時更新的購物面板。

Search Live 功能

Search Live 利用 Project Astra 的能力，允許用戶通過手機攝影機即時提問，回答與當前場景相關的問題，如園藝或化學實驗指導。該功能將於今年夏季晚些時候推出。

Project Mariner 代理功能

Project Mariner 是一個具備電腦使用能力的代理功能，能執行如搜尋公寓或購買活動門票等任務。它支持「教導與重複」功能，通過單次演示學習類似任務，將於夏季通過 Gemini API 向開發者開放。

Veo 3 影像生成模型

Veo 3 是 Google 的最新影像生成模型，具備原生聲音生成功能，包括音效、背景音和語音，提升影像的沉浸感。該模型適用於 YouTube Shorts 和電影製作，已在 Gemini 應用程式中向 Google AI Ultra 訂閱者推出。

Imagen 4 圖像生成模型

Imagen 4 是 Google 最新一代圖像生成模型，提供更高細節和更精確的文字渲染能力，現已整合至 Gemini 應用程式，適用於創意生成場景。

Flow AI 電影製作工具

Flow 是一個專為創作者設計的 AI 電影製作工具，可生成電影片段並將短片段擴展為更長場景，結合 Veo 3 的影像生成技術，簡化專業影片創作流程。

Google Beam 遠距視訊平台

Google Beam（前身為 Project Starline）是一個 AI 驅動的遠距視訊平台，利用六個攝影機將 2D 影像轉換為 3D 視覺效果，提供近乎完美的毫米級頭部追蹤和 60fps 實時渲染，實現沉浸式通話體驗。Google Meet 也新增了實時語音翻譯功能。

Android XR 平台與智慧眼鏡

Android XR 平台擴展至智慧眼鏡，與三星（Project Moohan）、Gentle Monster 和 Warby Parker 等合作夥伴共同開發。現場展示了原型機，集成了 Gemini 的 AI 功能，支持實時互動和問題解決，預計今年晚些時候推出。

Project Astra 升級

Project Astra 利用 Gemini 的多模態能力，通過攝影機幫助用戶解決實際問題，如修理自行車或識別物品。新增功能包括代表用戶進行電話查詢，增強其實用性。

Gemini Live 攝影機與螢幕分享

Gemini Live 現支持攝影機輸入和螢幕分享，免費向所有用戶（包括 iOS）開放，並即將支援 Google 日曆、地圖等應用程式擴展，提升日常任務的便利性。

Gemini 在 Chrome 的整合

美國 Google AI Pro 和 Google AI Ultra 方案的訂閱者，Gemini 現已整合至 Chrome 瀏覽器，作為 AI 瀏覽助手，能快速理解網頁內容並協助完成任務，提升瀏覽效率。

Gemma 3 模型

Gemma 3 是一個輕量級開源模型，適用於手機、筆記型電腦等設備，支持多模態處理（聲音、文字、圖片、影片）。目前處於預覽階段，適合行動端 AI 應用開發。

Android 16 功能

Android 16 引入了 Live Updates、專業媒體和相機功能、桌面窗口化以及增強的無障礙功能。該系統支持多種設備形態，包括手機、折疊屏、平板、穿戴設備及 XR 設備。

Wear OS 6 開發者預覽

Wear OS 6 採用 Material 3 Expressive 設計，提供個性化視覺和動態效果，電池續航提升高達 10%。開發者預覽版現已提供模擬器支持。

Android Studio AI 功能升級

Android Studio 整合 Gemini 2.5 Pro，提供「Journeys」和「Agent Mode」功能，支援複雜開發流程，並通過增強的「崩潰洞察」功能分析程式碼以識別和修復問題。

Google Play 增強功能

Google Play 推出內容豐富的策展空間，根據季節性興趣（如巴西的足球、日本的漫畫）提供個性化推薦，並新增訂閱功能以簡化結帳流程並降低用戶流失率。

Gemini Code Assist 與 Jules 編碼代理

Gemini Code Assist 現已對個人和 GitHub 用戶開放，支援程式碼生成和錯誤修復。Jules 是一個自主編碼代理，現處於公開測試階段，可撰寫測試、開發新功能及升級依賴版本。

沒有留言:

張貼留言

訂閱：張貼留言 (Atom)

3C老實說 · 氣象部落客勞倫斯

上方通欄-3C老實說.氣象部落客勞倫斯

2025/05/21