Google在I/O 開發者大會,帶來一系列全新 AI 創新技術與模型,包括Gemini 3.5 Flash、Gemini Omni、個人AI代理Gemini Spark等等,並宣布Google 搜尋迎來 25 年來最大升級,透過先進的模型能力帶來全新AI功能。
由AI驅動,全新的智慧搜尋框會根據你的需求動態展開,提供空間讓你能夠更準確描述需求,而且智慧搜尋框能夠了解你的意圖,協助你組織問題,效果遠超一般的自動填入建議。
智慧搜尋框還支援多模態搜尋,你可輸入文字、圖片、檔案、影片甚至 Chrome 分頁作為想要查詢的內容。
從今天開始,全新的智慧搜尋框將在所有支援 AI 模式的國家與語言逐步推出。
你還可直接在搜尋結果頁面的AI總覽(AI Overview)提出延伸問題,並切換到AI 模式進行即時互動對話。你的上下文語境會被完整保留,而隨著探索的內容越深,所獲得的相關連結與參考文章就會變得越精準。
此外,Google 搜尋正邁入搜尋代理(search agents)的全新時代,你可以直接建立、自訂並管理多個AI代理來幫你執行任務。Google將率先推出「資訊代理(information agents)」,它們可以全天候 24 小時在背景運作,幫你隨時掌握最關心的議題。資訊代理會聰明地查找與整理網路資訊,像是部落格、新聞網站與社群貼文,以及即時的財經、購物與體育資訊。
不只如此,資訊代理會發送一份經過整理的智慧摘要給你,並具備直接執行後續動作的能力。舉例來說,如果你正在找房子,可以把理想的房屋條件全部分享給代理,它會持續搜尋,找到符合條件的房源立即通知你。
或者,你想第一時間知道自己最愛的職業運動員是否推出聯名球鞋,資訊代理會在鞋款一上架時就發送通知提醒。
資訊代理將於今年夏天率先開放給 Google AI Pro 和 Ultra 方案的訂閱使用者。
此外,Google今天也正式推出最新的Gemini 3.5 Flash,強調在效能和速度之間取得極佳平衡,是處理長期且複雜任務的理想選擇,且成本通常不到同等級模型的一半。
至於Gemini 3.5 Pro 目前正在進行測試,預計將於下個月陸續推出。
當紅的AI代理服務(AI agent),Google自然也不錯過,推出 Gemini Spark,強調是全天候個人AI代理,能代表你自動執行任務,協助更有效率地工作。
例如正在處理的工作、合作對象,甚至是你的寫作風格,還能在你的許可下,自主代你執行多步驟的工作流程。
Spark會主動發送關鍵進度更新,並在執行傳送電子郵件等高風險操作前,徵求你的明確同意。
Spark在Google Cloud上一個完全託管且安全的執行階段(runtime)中運作,這代表你不需要管理底層基礎架構,就能享有企業級的安全防護。每項任務都在一個全新、嚴格隔離且短暫的虛擬機器(VM)中執行,有助確保工作階段之間的資料絕不重疊。
另外,Google還推出Gemini Omni,是一款具備突破性的全新AI模型,能融合文字、音訊、圖片和影片素材,並生成任何形式的輸出,首波主打影片生成功能。
另外,Google Pics是由 AI 驅動的全新圖片生成與編輯工具,讓你精準掌控你的圖片。你可以透過 Pics 輕鬆移動物件、調整大小並轉換單一物件,同時還能獨立修改和翻譯文字。
這項工具直接內建於 Google 雲端硬碟、Google 文件和 Google 簡報等應用程式中,讓複雜的編輯變得簡單。團隊能快速更新全球行銷活動素材、替換照片中的產品,或是調整背景尺寸以符合不同的廣告版面。
Gmail、Google文件和Google Keep中的語音功能,則是在你最喜歡的應用程式中,透過語音進行腦力激盪、組織思緒並執行任務。你可以快速從收件匣中找出專案截止日期、反覆修改週報的草稿,或將雜亂無章的想法轉換為結構化的清單。