字節跳動的AI神話

作者:洪文正 (Alex Hung)

2020年8月15日刊於《信報》

短視頻分享應用程式TikTok的母公司字節跳動(ByteDance)最近成為新聞焦點。其實在2018年,字節跳動已是頭條新聞,當時其估值升至750億美元,超過Uber的720億美元,成為全球最有價值的創業公司,並計劃將業務擴展到中國以外。

一場爭奪AI和機器學習領導權的戰爭,正在美國和中國之間展開。雖然美國一開始在人工智能科學和發現方面具有明顯的優勢,但其領先優勢已經減弱。中國除撥出數十億美元用於基礎設施建設,將人工智能(AI)企業放在指定的工業園區外,圍繞人工智能(AI)的創業活動在過去10年中也呈爆炸式增長。中國受益於許多美國科技公司的回流人員,以及大量受過STEM(科學、技術、工程、數學)教育的本地人才。從某程度上來說,中國在Al研究出版物的數量上,已經處於領先地位。

要建立一個Al模型,需要海量的數據供模型學習,而中國在這一點佔上風。中國有14億人口、7.3億名網民,數據收集制度較為寬鬆,是Al公司的數據天堂。由於很多移動應用程式都與微信或支付寶互聯互通,中國移動用戶對分享私人數據很自在,這與西方國家執行嚴格的規定形成鮮明對比。接觸到這數億用戶,可讓中國所有研究人員以更快的速度和強度工作。獲得這些數以億計的用戶,使得中國的Al研究人員能以更快的速度和強度開展工作。

早在2012年,字節跳動由29歲的張一鳴創立,他預測移動設備是未來訊息消費方式的關鍵。投資者對一款新聞聚合應用程式能否與現有的新聞應用進行盈利競爭持懷疑態度。字節跳動不顧一切,利用其Al能力,成為世界上領先的應用程式。它的成功很大程度上歸功於其人工智能和機器學習算法,這些算法為其所有產品的用戶提供定制化的內容源。

考慮用戶行為預測偏好

起初字節跳動的差異化在於其使用專有技術來剔除「內容搜索」。與亞馬遜及其同行使用的協作技術不同,字節跳動使用的技術考慮用戶的行為(閱讀、點擊、喜歡),以預測他們的偏好。在「今日頭條」(新聞閱讀應用程式)的文本成功之後,它將其技術應用於所有字節跳動的產品,包括抖音(和TikTok),抖音使用Al和機器學習來提供偏好的內容,使用計算機視覺和自然語言處理技術的算法來理解和分析書面內容、圖像和視頻,然後提供定制內容。隨着用戶與內容的互動(通過點擊、滑動、在每篇文章上花費的時間、評論),字節跳動的大規模機器學習和深度學習算法學習更多關於他們的偏好,以完善內容交付。這就形成基於個人喜好和興趣的高質量內容供給。系統積累的內容愈多,算法就愈能提升內容體驗。

由於驅動字節跳動系統的底層技術不受語言或文化障礙限制,公司很容易擴展業務到中國以外。雖然字節跳動進入中國科技行業相對較晚,但通過一系列併購,開始全球化戰略。2018年1月,字節跳動和BuzzFeed簽署合作協議,字節跳動獲授權在中國發行BuzzFeed的娛樂內容。2019年,字節跳動與美國晶片製造商英特爾宣布合作,另建Al創新實驗室,開發Al應用。

在所有字節跳動應用程式中,尤其是TikTok,Al將成為產品本身。TikTok利用Al研究的滙合,利用它來塑造產品,並利用用戶的個人資料和反應來即時定制符合他們喜好的內容。在TikTok上,用戶並沒有提供輸入內容或社交檔案;Al技術就能預測他們的興趣和傾向(從他們的點擊、滑動、在每篇文章上花費的時間、閱讀時間、延遲、評論、厭惡、熱門話題等)。其結果是,每當用戶打開應用時,都會明確地為他們定制一個精采的feed。

Al技術是字節跳動所有內容平台的核心,智能機器可利用自然語言處理和視覺技術,理解和分析文本、圖像和短片。其Al能力通過大規模的機器學習和深度學習算法,為用戶提供偏好的內容服務,促進毫不費力的內容發現。現時字節跳動受到不同國家的制裁,甚至封殺,但相信未來仍然是主導着AI的領導者之一。

作者為香港科技大學工商管理碩士校友會會員

Leave a reply

你的電郵地址並不會被公開。 必要欄位標記為 *