2025/05/21

[科技] [網路] Google I/O 2025 超懶人包:Gemini 和 AI 技術領軍,科技巨頭火力全開

Google I/O 2025 聚焦於 AI 技術的全面升級,Gemini 2.5 模型及其衍生功能如 Deep Think、AI Mode、Project Mariner,展示了 Google 在 AI 推理、搜尋和代理應用上的突破。Android XR、Google Beam 和 Flow 等新工具進一步擴展了 AI 在硬體和創意領域的應用,為開發者和用戶提供了更智慧、沉浸式的體驗。



以下為 Google I/O 2025 介紹的主要新功能與服務

Gemini 2.5 模型系列升級 


Gemini 2.5 模型系列在性能上顯著提升,適用於多種開發場景,包括文字、圖像、聲音及影像處理。該模型在 LMArena 排行榜上名列前茅,展現了其在數學、程式碼及多模態任務上的卓越表現。Gemini 2.5 Flash 現已脫離預覽階段,強調高效能與低延遲,特別適合企業應用。




Deep Think 模式 


Deep Think 是 Gemini 2.5 Pro 的實驗性增強推理模式,專為複雜任務設計,涵蓋數學、程式碼及多模態推理。該模式目前正在進行額外的安全評估,預計將對 Google AI Ultra 訂閱者開放,提供更深入的問題解決能力。


Google AI Pro 與 Google AI Ultra 訂閱計劃 


Google 推出兩種新訂閱計劃:Google AI Pro(每月 19.99 美元)提供比免費版本更高的使用額度;Google AI Ultra(每月 249.99 美元)則提供對最先進模型(如 Veo 3 和 Deep Think 模式)的最高訪問權限,適合專業 AI 創作者。



AI Mode 搜尋功能 


AI Mode 是 Google 搜尋的實驗性功能,現已向美國所有用戶推出,支持複雜多部分問題查詢,並能根據 Gmail 等個人數據提供客製化結果。新增功能包括生成體育和金融查詢的圖表,以及即時更新的購物面板。




Search Live 功能 


Search Live 利用 Project Astra 的能力,允許用戶通過手機攝影機即時提問,回答與當前場景相關的問題,如園藝或化學實驗指導。該功能將於今年夏季晚些時候推出。




Project Mariner 代理功能 


Project Mariner 是一個具備電腦使用能力的代理功能,能執行如搜尋公寓或購買活動門票等任務。它支持「教導與重複」功能,通過單次演示學習類似任務,將於夏季通過 Gemini API 向開發者開放。



Veo 3 影像生成模型 


Veo 3 是 Google 的最新影像生成模型,具備原生聲音生成功能,包括音效、背景音和語音,提升影像的沉浸感。該模型適用於 YouTube Shorts 和電影製作,已在 Gemini 應用程式中向 Google AI Ultra 訂閱者推出。



Imagen 4 圖像生成模型 


Imagen 4 是 Google 最新一代圖像生成模型,提供更高細節和更精確的文字渲染能力,現已整合至 Gemini 應用程式,適用於創意生成場景。



Flow AI 電影製作工具 


Flow 是一個專為創作者設計的 AI 電影製作工具,可生成電影片段並將短片段擴展為更長場景,結合 Veo 3 的影像生成技術,簡化專業影片創作流程。



Google Beam 遠距視訊平台


Google Beam(前身為 Project Starline)是一個 AI 驅動的遠距視訊平台,利用六個攝影機將 2D 影像轉換為 3D 視覺效果,提供近乎完美的毫米級頭部追蹤和 60fps 實時渲染,實現沉浸式通話體驗。Google Meet 也新增了實時語音翻譯功能。




Android XR 平台與智慧眼鏡 


Android XR 平台擴展至智慧眼鏡,與三星(Project Moohan)、Gentle Monster 和 Warby Parker 等合作夥伴共同開發。現場展示了原型機,集成了 Gemini 的 AI 功能,支持實時互動和問題解決,預計今年晚些時候推出。



Project Astra 升級 


Project Astra 利用 Gemini 的多模態能力,通過攝影機幫助用戶解決實際問題,如修理自行車或識別物品。新增功能包括代表用戶進行電話查詢,增強其實用性。




Gemini Live 攝影機與螢幕分享 


Gemini Live 現支持攝影機輸入和螢幕分享,免費向所有用戶(包括 iOS)開放,並即將支援 Google 日曆、地圖等應用程式擴展,提升日常任務的便利性。




Gemini 在 Chrome 的整合 


美國 Google AI Pro 和 Google AI Ultra 方案的訂閱者,Gemini 現已整合至 Chrome 瀏覽器,作為 AI 瀏覽助手,能快速理解網頁內容並協助完成任務,提升瀏覽效率。




Gemma 3 模型 


Gemma 3 是一個輕量級開源模型,適用於手機、筆記型電腦等設備,支持多模態處理(聲音、文字、圖片、影片)。目前處於預覽階段,適合行動端 AI 應用開發。




Android 16 功能 


Android 16 引入了 Live Updates、專業媒體和相機功能、桌面窗口化以及增強的無障礙功能。該系統支持多種設備形態,包括手機、折疊屏、平板、穿戴設備及 XR 設備。



Wear OS 6 開發者預覽 


Wear OS 6 採用 Material 3 Expressive 設計,提供個性化視覺和動態效果,電池續航提升高達 10%。開發者預覽版現已提供模擬器支持。




Android Studio AI 功能升級 


Android Studio 整合 Gemini 2.5 Pro,提供「Journeys」和「Agent Mode」功能,支援複雜開發流程,並通過增強的「崩潰洞察」功能分析程式碼以識別和修復問題。




Google Play 增強功能 


Google Play 推出內容豐富的策展空間,根據季節性興趣(如巴西的足球、日本的漫畫)提供個性化推薦,並新增訂閱功能以簡化結帳流程並降低用戶流失率。

Gemini Code Assist 與 Jules 編碼代理 


Gemini Code Assist 現已對個人和 GitHub 用戶開放,支援程式碼生成和錯誤修復。Jules 是一個自主編碼代理,現處於公開測試階段,可撰寫測試、開發新功能及升級依賴版本。




3c老實說 / 30天評測心得連載 / 投幣式編輯人生 / 氣象部落客勞倫斯


沒有留言:

張貼留言

Google+