蘋果的「設備智能」
2016 年的蘋果開發者大會( WWDC )有諸多值得回味的點,從中可以一窺蘋果在人工智能方面的思考。長期以來,蘋果對于人工智能的定位都是「設備智能」——這是一種將人工智能技術納入到硬件的處理方式,從最早的 Siri 到現在的 iOS 10 里的圖片自動識別和分類機制,事實上,蘋果的識別和分類技術并不差,2015 年 9 月,蘋果收購人工智能初創公司 Perceptio,該公司可以在無需外部數據庫的情況下,基于設備(手機、平板)來進行圖像分類。
新 iOS 10 的照片應用可以自動識別人臉、物體,并能夠相冊里的人物自動分類,新加入的「回憶」,則可以通過對照片的位置信息、人臉照片信息、場景信息等聚集在一起,還支持插入音樂。與此同時,開發者還在 iOS 10 測試版中發現了關于人臉識別功能的其他信息,比如大量關于人臉表情的代碼,包括微笑、驚恐、驚喜、哭泣、沉思等等,這意味著 iOS 10 未來很可能支持識別照片里人物的表情信息。
蘋果將上述功能加入到一臺運行 iOS 10 的iPhone 中實屬不易,要知道類似的功能在 Google 與微軟那里,都是通過云端數據處理后的返回結果。蘋果之所以采用這種方法既有歷史原因,也有諸多現實考量。歷史上看,喬布斯時代的蘋果對人機交互有著異常的堅持,比如 iOS 曾經異常的簡潔性——這也意味著毫無選擇性的交互方式。喬布斯也曾表示,如果他來做一款 DVD,那么唯一的按鈕就是「燒錄」,其他都可以舍棄。正是這樣對于簡潔性的追求,使得蘋果的產品線長期以來在功能上的變化都極其克制。
喬幫主已仙逝多年,iOS 自 iOS 7 開始在交互上開始復雜,但將人工智能納入到蘋果產品的過程依然十分緩慢,擺在蘋果面前的現實問題有兩個,其一,蘋果的云服務不如 Google 和微軟,至今蘋果 iCloud 的服務還有一部分跑在亞馬遜 AWS 上,這也使得蘋果無法像Google 微軟那樣通過云端強大的處理性能來處理照片分類、語音識別等。
其二,蘋果長期以來的價值觀就是對用戶隱私的保護。以虛擬助理來說,Siri 早在 2011 年就已經發布,但比起 Google Now、微軟的 Cortana 來說,Siri 真的很不智能,原因就在于Siri對于用戶數據的收集非常少,而另外兩家公司的產品則有點「貪得無厭」,尤其是Google,默認的用戶協議里,Google 可以收集用戶幾乎所有的為其所用。
尤其是在 2015 年 Google 發布頗具里程碑意義的 Google Photo 之后,蘋果 CEO 庫克在接受媒體采訪時公開表示:
在硅谷,許多知名的成功公司利用用戶個人信息建構自己的商業模式。它們收集了關于你的一切信息,并試圖利用這些信息來賺錢。我們認為這是錯誤的行為,而蘋果也不希望成為這樣的公司。
但另一個現實則是,時下流行的深度學習,迫切需要海量數據的「喂養」,同樣在今年 WWDC 大會上,蘋果要重新定義「大數據」,正式啟動蘋果的「Differential Privacy」,這個概念由微軟的C. Dwork 提出,其基本含義就是基于統計學原理,在一個群體層面收集數據,而非像FB、Google 那樣收集個體的數據。由于蘋果的 iMessage、 FaceTime 早已部署了端到端的加密技術,因此能夠讓用戶數據以加密的方式上傳到蘋果的服務器,然后蘋果在對于這些群體層的數據進行分析和優化,從而改善用戶的體驗。
「Differential Privacy」將在今年秋天的蘋果各個設備新系統中采用,具體會給 iOS 、macOS、watchOS 帶來哪些真正意義的改觀還無從知曉,但在另一個重要領域——語音領域,蘋果則把一副好牌打成了爛牌。
Siri 與人才之痛
作為喬布斯生前收購的最后一家公司,Siri 肩負著喬布斯對于未來交互模式的遠見思考。正如 Meeker 在人機交互歷史回顧中展示的那樣,幾百萬年前,人類從聲音的交互開始,而文字的發明,則讓交互從聲音轉入文本階段,于是出現了各種與文本打交道的交互工具。即便如此,人類交流中的 90% 依然還是通過聲音來完成,這種更自然也更原始的交互模式在過去半個世紀里并未得到突破性的進展。
自動語音識別(Automatic Speech Recognition ,簡稱ASR)是一種機器可識別人類說話單詞的能力。很長一段時間里,ASR 在準確度上都無法與人類識別相媲美,而在 2010 年,ASR 在識別準確度上迎來一個拐點。
從上圖的變化可以看出,2010—2015的五年時間,ASR 準確度得到大幅提升,這種變化超過了過去 30 年到 40 年的變化。事實上,我們現在已經接近一個時刻:機器對于語音的識別能力即將超過人類。
喬布斯看到了基于聲音的交互才是人類天性的體現,而技術進步則幫助人類重新回到了最原始的聲音交互時代。Siri 在這種情況下成為蘋果布局聲音交互的重要產品,當時,喬布斯曾被問到收購 Siri 是否想與Google 競爭搜索業務,喬布斯給出的答案很明確:Siri 不是搜索產品,他們要做人工智能。
只可惜,喬布斯并未看到搭載 Siri 的第一部 iPhone—— iPhone 4S 的發布儀式。彼時, Siri 給世界帶來的驚喜隨著一次次的惡作劇般的調侃趨于平淡,人們突然發現,Siri 幾乎沒有任何用處。她(他/它)常常答非所問,又經常無故跳出(不小心長按 home ?。?hellip;..另一方面,自喬布斯逝世后,原來的Siri 團隊核心成員幾乎都離開了蘋果,包括 Siri 早期開發者的 Dag Kittlaus 和Adam Cheyer 等人又創立了一家 Viv 的公司,其產品可以理解為新一代的 Siri。
如喬布斯當年所言,語音交互正在成為人工智能最有可能爆發的領域??纯词忻嫔系目萍脊緜?,亞馬遜、微軟以及 Google 、Facebook,無一不在這個領域發力。蘋果也推出了應對之策。
2015 年 10 月開始收購了英國語音技術初創企業VocalIQ,這家公司一直以可實現機器自我學習著稱;其次,蘋果在今年開發者大會上進一步開放 Siri ,開發者可以在 iOS 應用里直接調用 Siri 的借口來實現語音識別、搜索的功能,考慮到 Siri 和搜索已經成為 iOS 10 無處不在的功能模塊,未來不排除越來越多開發者在應用里加入 Siri ;第三,全平臺的 Siri 或許才有價值,下一代 macOS 即將配置 Siri ,未來的 Apple Car 的交互設計中,Siri 將擔當核心角色。
然而不管是不斷優化的設備智能和對 Siri 的強化訓練,蘋果在人工智能人才、論文方面也面臨諸多挑戰。有媒體盤點過 2015 年蘋果的挖人名單:
2015年年初,前蘇黎世聯邦理工學院自動系統實驗室副主管Paul Furgale加入蘋果; 7月,前意大利經典汽車廠商菲亞特克萊斯勒集團質檢總監Doug Betts加入蘋果。 8月,大眾前工程師 Megan McClain、特拉斯前工程經理Hal Ockerse、前高級工程師Jamie Carlson加入蘋果。 9月,芯片制造商Nvidia公司人工智能專家、深度學習軟件主管Jonathan Cohen 加入蘋果; 10月,電動摩托廠商Mission Motors申請破產,旗下一部分優秀工程師投奔到了蘋果旗下;
上述幾位除了Jonathan Cohen 之外都與秘密研發的 Apple Car 有關。2015年9月,蘋果罕見發布招聘廣告,大規模招募人工智能和機器學習方面的人才。路透社去年援引艾倫人工智能研究所 CEO、華盛頓大學教授 Oren Etzioni 的話表示,在招募機器學習人才方面蘋果的起步較慢,不過蘋果正試圖追趕競爭對手。
更重要的一點還在于,由于堅定的用戶隱私保護措施,機器學習創業公司 Dato 聯合創始人 Joseph Gonzalez 評價道:「蘋果希望其手機能在不了解外部世界的情況下快速響應用戶需求,以此方式實現人工智能,很難實現?!?/p>
與此同時,Google 從一開始就定位于信息的收集、整合,其基于信息的智能已爆發出不小的影響力。