本文來自微信公眾號:果殼,作者:沙拉醬,頭圖來自:AI生成
本文來自微信公眾號:果殼,作者:沙拉醬,頭圖來自:AI生成
不出所料,在這場“毫無驚喜”的WWDC上,對于大家最期待的Siri升級,蘋果只字未提。這個曾經離AI最近、也最令蘋果引以為豪的產品,仿佛消失了一般。
Siri 去哪了?丨Giphy
在WWDC之前,Siri升級延期的消息就已經放出來了,所以這個深諳“預期管理”的科技企業也祭出時隔十二年的一次設計升級,液態玻璃。這個設計融入到了控件、導航、應用圖標、小部件、主屏幕和鎖定屏幕等方面,大量的系統菜單,功能全部變成了液態玻璃質感。
段子瞬間流傳起來:全世界都在搞AI,只有蘋果在搞UI。
這場幾乎只有UI升級的發布會,令人失望得徹底。
一、“消失”的Siri
“First is Apple intelligence.“當蘋果軟件工程高級副總裁Craig Federighi說出這句話的時候,守著WWDC直播的中國果粉就知道,這夜是白熬了。
今年的WWDC,留給中國工程師的好像只有UI更新——液態玻璃、3D鎖屏、透明皮膚……真正的蘋果AI離我們還很遠。
當然了,這個結果也是意料之中,因為早在今年的WWDC開始之前,我們就收到了兩個延期的消息:1. Siri AI要延期;2. Apple intelligence進入中國也要延期。
兩個延期的側重原因則有所不同。
原計劃要在今年推出的整合Apple Intelligence的Siri,也被用戶稱為“Siri AI”的功能被官宣延期。
聲明表示“Siri 幫助用戶快速找到所需資訊并完成各種任務。 在過去六個月內,我們讓 Siri 更具對話能力,推出了‘打字給 Siri’和產品知識等新功能,并整合了 ChatGPT。我們也一直在開發更個人化的 Siri,使其能更理解用戶的個人情境,并能在各個應用程式內執行操作。不過,要讓這些功能真正落地,比我們預期的還要花更長的時間,因此我們預計會在明年陸續推出。”
至于要推遲到“明年”的什么時候,業界普遍認為最早也要在明年的WWDC——這種等待帶來的絕望程度,國足球迷應該最熟悉。
升級版Siri的延期可能和技術挑戰直接掛鉤。
去年Apple intelligence首次亮相的時候,蘋果就宣傳了Siri的上下文理解能力,不過這個功能被一波測評博主吐槽了。為了增加這個能力,蘋果研發了一款 ChatGPT 和 Google Gemini 的 Siri LLM(大型語言模型)版本,不過隨著Siri升級進度的延期,生成式 Siri LLM也可能會延到 2027 年 。
另外一方面,在聲明中沒落地的“個人化Siri”功能指的可能是追蹤電子郵箱、照片、檔案等訊息并且進行深度整合。舉個例子,直接拆解工作郵件中的重要內容顯示在你的日歷上,這是種非常貼近Agent的功能。當然,這也涉及到Siri能夠調用的蘋果自帶的以及三方app的量級。
在保證軟件升級的同時,蘋果也要保證硬件使用的絲滑,避免因為“Siri AI”上線導致的電耗、卡頓等問題。這可能都是造成這次升級延期的技術難題。
至于Apple Intelligence入華的延期,則更多是數據安全和政策層面導致的。
AI是一個終端+服務的協同產物,為了增強AI實力,蘋果在Apple Intelligence中用了混合架構,簡單任務由設備端處理,復雜任務則通過加密傳輸至云端AI模型進行運算。在海外市場,蘋果是與OpenAI合作來增強Siri等功能的。
不過為了入華,這套方案顯然不能成立。所以蘋果搞了一個“雙軌制”的設計,試圖通過阿里“通義千問”和百度“文心一言”的本地模型來實現內容合規與隱私保護,結果這項方案也在前幾天傳出尚未獲批。
幾乎和大家預料相同的,這次的WWDC上“Siri”成了一個“消失”的單詞,而入華仍然待定的Apple intelligence所增加的視覺識別、實時翻譯、圖像生成等場景也離我們很遙遠。
今年一季度,蘋果在國內高端手機市場的市占率是47%,這個數字距離兩年前已經滑落了超過20%,遲遲在AI上“憋”不出大招的蘋果,有點令人失望。
二、起大早,沒趕集
“Hey Siri,告訴我今天的天氣?!笔哪觊g,到底有多少果粉說過這句話。
要說一句宿命論的話,Siri是喬布斯留給蘋果的“遺物”。當時喬布斯在蘋果商城里看到還是一個app的Siri的時候就連夜把創始團隊請到家里暢談,最后收購Siri,之后,在喬布斯去世的同一年,Siri問世。
Siri創始人是這樣形容他創業的初衷的:Siri 的終極目標是你可以對著互聯網說話,助手會為你處理一切。你甚至無需知道信息來源,應用和網站發現的問題也將被解決。
放在今天,這就是最火的Agent概念。但是搶跑了十四年的Siri如今還是一個有點別扭的智能語音助手。
“執行不堅決,等于堅決不執行”這句話很適合形容Siri在蘋果中的尷尬處境。
2018年,蘋果從谷歌挖來了一個當時所有人覺得最適合發展AI的高管——被業內稱為JG的John Giannandrea——來擔任蘋果AI的負責人。JG之前在谷歌負責搜索和AI部門,并且帶領團隊在谷歌相冊、翻譯和Gmail等產品中部署AI技術。
不過,對于在移動智能設備市場已經一騎絕塵的蘋果來說,接受AI是需要強大的自我革命基因的,但蘋果的這份DNA,并沒有從上到下的貫徹。庫克很重視AI的布局,他曾經說:機器學習和AI對于蘋果公司的未來發展至關重要,它不僅會徹底改變人們與技術進行交互的方式,而且已經為用戶的生活帶來了顯著改善。
但是蘋果另一位軟件負責人Craig Federighi,他認為蘋果還是應該聚焦在iOS的更新之上。
一位是已經在蘋果扎根的,甚至類似于“家族企業”的高管,一位是空降的外來高管,可想而知,這場“AI革命”從開始就并不順利。
當JG從谷歌帶來頂級的AI研究員,組建負責測試和數據分析的團隊,并且發現蘋果需要多投入幾億美元來做大規模測試以及圖像和文本標注來訓練大模型的時候,他沒有得到所有人的支持。
戰略不堅決,戰術就沒法堅決。
就比如,蘋果在GPU采購上一直相當保守。微軟、META都在囤貨的時候,蘋果沒有著急。天風證券郭明錤曾經分析過,Meta Platforms預計將在2025年采購130萬顆圖形處理單元(GPU),而這一數字相當于蘋果傳聞采購量的70倍。(新浪財經)
由于將創新戰略更加注重在iOS本身,蘋果也在2020年前后開始大肆宣傳“隱私”這個差異化優勢。這反而成了蘋果訓練大模型需要數據的時候一道“防火墻”,即使坐擁20幾億活躍用戶,蘋果的AI研發人員卻得跟所有隱私條款做“斗爭”才能獲得數據,相比之下,Grok就通過獲得X所有數據的進步神速。
戰略、算力、數據,用Siri搶跑了十四年的蘋果,因為“執行不堅決”蹉跎了……
這份“蹉跎”可以從去年首次上線的Apple intelligence上看出。
“Apple intelligence沒那么intelligence”這就是大部分用戶對這項功能的印象——首先就是功能的雞肋,蘋果在發布會上對于Apple intelligence的演示其實很接近大家對Agent的暢想了,但是落實到實際上的功能還是僅限于日程提醒、郵件總結、寫作助手……
不可避免地,這些功能就會被和GPT比較。不比不知道,一比更是落了下風,比如接入大模型的Siri號稱也有上下文理解能力,實際上效果差強人意。一個測評博主就先是問了Siri香港天氣如何,在Siri作答之后再請求Siri來出一個今日去香港需要準備的東西,結果Siri完全沒有考慮香港的天氣因素;再比如,郵件總結被吐槽抓不住重點、wiriting tools只能用在蘋果自帶app中并不能跨app通用……
非常戲劇性的是,正是當年沒有那么看好AI的Craig Federighi在今年的WWDC上演示著Apple intelligence的功能,也正是他在看到GPT爆火后覺得iOS上也得有一個AI的功能,之后蘋果才有了Apple intelligence的概念。
今天蘋果對于“AII-IN AI”的決心看起來是下定了,不過起大早的蘋果還能趕上這趟晚集嘛?
三、下一個iPhone時刻,還屬于蘋果嗎?
作為一名十幾年的果粉,我曾經是一名iPhone6S“釘子戶”、iPhone12“半釘子戶”、也是一位蘋果全家桶用戶,我不得不承認,Apple intelligence不是第一款讓我失望的產品了。
同樣是姍姍來遲,同樣是重磅宣傳,Vision Pro,也并沒有給果粉多少驚喜。
對于用戶來說,頭顯產品最痛的痛點有三個:重量、續航、場景。蘋果在這三方面的表現力都很一般。沒有解決頭顯最痛的痛點,而是上線了一個精美、高價的“科技玩具”,這份創新似乎“炫技”大于“用戶體驗”。
這個問題在iPhone的創新中也有所顯現,我本人就在下雨天信號不好在地鐵閘機刷不出來付款碼的時候、安卓用戶看小說看得飛起而我在地鐵只能干瞪眼的時候、打投訴電話沒辦法同時錄音的時候、騷擾電話沒有提示和屏蔽的時候想過“我為什么還要用蘋果”。
而當Agent要成為未來智能手機的大趨勢的時候,下一個“iPhone時刻”是否還會屬于有些“傲慢”的蘋果呢?
在如今的敘事里,合格的Agent手機會是一個超越“對話”形式,發展到“行動”形式的Ai助手。
就比如你現在要買一杯咖啡,你通過Siri下一個指令,幫我買一杯咖啡送到我的辦公室,iPhone可以自動打開外賣app列舉一堆在配送范圍的咖啡店,點單、付款、配送。
這中間除了AI本身的理解、思考、行動這樣的底層技術難題,還有兩個難題需要突破。
一方面是對于app。為了Agent全面的實現,蘋果需要和app去談合作,經過三方授權來調用他們的API。
這里就會遇到兩個問題:1. 多數app都有一個變現手段就是廣告,用戶打開app,會有展示頁,進入之后頂部有BANNER,下滑有信息流,商品展示有先后順序,這都是廣告位的好機會,而Agent為了增加用戶體驗大概率就是直接彈屏到需要的頁面,一下子就流失了幾個展示廣告的位置;2. 數據,在AI時代可是珍貴的資產。手機成了Agent,一談合作把各個app的用戶數據搜索個遍,來訓練自己的大模型,app倒是給手機廠做嫁衣了。
這點可能是蘋果的優勢,畢竟封閉系統、強勢地位一直都是蘋果在整個生態中的強項。
另一方面,就來自于用戶體驗。很多人并不是從一開始就很清楚地知道自己的訴求。就拿“買咖啡”來說,沒有Agent的情況下,用戶可能是打開美團,看看有沒有優惠券、翻翻有沒有新口味,最后再糾結一下是喝冰的還是喝熱的。
那么,問題來了,在這些都被Agent代勞的時候,Agent和人類的決策交互應該怎么分配,如果你的Agent按照你平時的習慣下單,忽略所有優惠、新品這些新要素,你可能會覺得:好魯莽的Agent;如果你的Agent一步一問你,你可能會覺得:好沒用的Agent。
其他的事情還好,一旦涉及到付款,那么決策的尺度就是影響用戶體驗的問題。
這幾年在用戶體驗創新上頻頻被挑毛病的蘋果,在AI這件事情上能不能回歸“用戶本質”,與他們的硬件條件一樣重要。
喬布斯有這么一個理念,他不相信用戶會主動去搜索東西,他認為蘋果的職責是精心挑選并向用戶展示他們想要的內容?;蛟S是這個理念的影響下,即使在GPT狂飆的時刻,蘋果仍然對聊天機器人的價值存疑。
但不論是姍姍來遲的Apple intelligence還是拖延的Siri升級,蘋果都必須面對一個問題:想要做最新的,或者最好的,這需要重新思考。
本文來自微信公眾號:果殼,作者:沙拉醬
支持一下 ??修改