AI訓練語料被「榨乾」,OpenAI等巨頭的AI大道走向何方?

Esteban Ma
更新於
coverImg
來源: DepositPhotos

AI發展扶搖直上,快到當前全人類的庫存知識都難以跟上。為了應對AI模型所需訓練語料的匱乏,OpenAI、谷歌和Meta等巨頭不顧侵權和違規、耍花招來改進模型。


據《紐約時報》報道,早在2021年底,GPT-4的開發者OpenAI便面臨著訓練資源緊缺的問題。在開發最新的人工智慧係統時,人工智慧實驗室已經耗盡了網路上所有可靠的英文文本資源,而他們還需要更多資源。


研究機構Epoch表示,科技巨頭們的問題很緊急,它們使用資料的速度已經超過生產資料的速度,併最快會在2026年耗盡網路上所有高質量資料。


面對這一瓶頸,科技巨頭們開始想方設法來獲得訓練資源。OpenAI研發人員創建了一款名為Whisper的語音辨識工具,將流媒體Youtube影片中的音頻轉錄成新的對話文本,以使得他們的AI模型更加「人類化」。


但有三名知情人士表示,一些OpenAI員工是在「明知故犯」,這些員工已經討論過此舉可能會違反Youtube的規則。Youtube是谷歌旗下的,按規定不允許將網路上的影片用於獨立應用。


而據悉,OpenAI團隊迄今已轉錄了超100萬個小時的Youtube影片,且該公司總裁Greg Brockman親自參與了這一過程。這些由影片轉錄生成的文本被納入GPT-4的訓練係統中,成為了最新版本ChatGPT聊天機器人的基礎,推動其成為世界上最強大的AI模型。


無獨有偶,谷歌和Meta等科技巨頭也在紛紛「走捷徑」,甚至無視公司政策、網路規則和法律法規,來最大程度地獲取訓練資源。與OpenAI做法一樣,谷歌也轉錄自家流媒體平台Youtube視頻,但這本身仍可能侵犯了相關版權,因為這些影片是屬於創作者的。


對於OpenAI「偷」自家語料的做法,谷歌的態度略顯曖昧,一邊表示並不知情,一邊似乎默認容許這種行為,因為谷歌本身也在做這件事。知情人士稱,如果谷歌在OpenAI的問題上大驚小怪,公眾可能會對自己的做法提出強烈抗議,也就是說谷歌擔心自己「引火燒身」。


有趣的是,為了應對這一挑戰,谷歌隱私團隊還編寫了新條款,以便其可以利用這些網路資源來進行AI模型搭建和產品功能升級,如谷歌翻譯、Bard和雲端AI等。


據外媒報道的一份Meta內部會議記錄,該公司工程師和產品經理層討論過收購美國出版社Simon & Schuster以獲取長文本足療的計劃,也討論過從網路收集受版權保護的內容。他們認為,「與出版商、藝術家、音樂家和新聞業談授權問題所需的時間太多了。」


Meta高層表示,OpenAI似乎正在採用收版權保護的資料,而Meta可以遵循這一「市場先例」。


去年,超過10000個貿易團體、作者、公司和其他人是向美國版權局提交了有關人工智慧模型使用他們創意作品的意見,版權局正在準備就版權法如何在AI時代適用的指導意見。


電影製作人Justine Bateman表示,人工智慧模型在未經許可或付費的情況下獲取其內容,「這是美國最大的盜竊案。」


矽谷知名創投公司Andreessen Horowitz的代表律師Sy Damle認為,讓這些AI工具存在的唯一可行方法是,它們可以接受大量資料的訓練,而無需這些資料的許可。Damle稱,「所需資料規模時如此之大,以至於即使是集體許可也難以行得通。」

* 本文內容僅代表作者個人觀點,讀者不應以本文作為任何投資依據。在做出任何投資決定之前,您應該尋求獨立財務顧問的建議,以確保您了解風險。差價合約(CFD)是槓桿性產品,有可能導致您損失全部資金。這些產品並不適合所有人,請謹慎投資。查閱詳情


goTop
quote
這篇文章有幫到您嗎?
相關文章
placeholder
特斯拉財報後漲超5%!馬斯克抽身DOGE,是時候抄底了嗎? 雖然特斯拉市值已腰斬,但仍受品牌危機和關稅影響,投資人應保持謹慎。
作者  Alison Ho
昨日 03: 08
雖然特斯拉市值已腰斬,但仍受品牌危機和關稅影響,投資人應保持謹慎。
placeholder
美國總統特朗普緩解市場緊張情緒,表示沒有解僱鮑威爾的計劃,中國關稅將降低最近,美國總統唐納德·特朗普在新聞發布會上表示,他與中國的討論進展順利,並補充說他認為他們將達成協議。他表示,對中國的關稅不會高達145%,但也不會是零
作者  FXStreet
昨日 01: 37
最近,美國總統唐納德·特朗普在新聞發布會上表示,他與中國的討論進展順利,並補充說他認為他們將達成協議。他表示,對中國的關稅不會高達145%,但也不會是零
placeholder
4月22日財經早餐:再度上演「股債匯」三殺!黃金衝破3400,美元/日元跌向140川普再度炮轟鮑威爾應儘快降息,否則美國經濟會放緩,撤換鮑威爾風波升級疊加貿易談判停滯,美國再度上演「股債匯」三殺。美國三大股指均跌超2%,其中道指暴跌近1000點,跌2.48%;標指挫2.36%;納指盤中一度跌4%,收盤跌2.55%,報15870點;反映中國概念股表現的金龍指數微漲0.2%。特斯拉收跌6%,輝達跌4.5%。UnitedHealth財報後兩日暴跌27%。
作者  Insights
4 月 22 日 週二
川普再度炮轟鮑威爾應儘快降息,否則美國經濟會放緩,撤換鮑威爾風波升級疊加貿易談判停滯,美國再度上演「股債匯」三殺。美國三大股指均跌超2%,其中道指暴跌近1000點,跌2.48%;標指挫2.36%;納指盤中一度跌4%,收盤跌2.55%,報15870點;反映中國概念股表現的金龍指數微漲0.2%。特斯拉收跌6%,輝達跌4.5%。UnitedHealth財報後兩日暴跌27%。
placeholder
AI股反彈無望?摩根大通:還要跌15%!目前市場雖已部分計價悲觀預期,但AI股估值和預期的下調仍未見底。
作者  Alison Ho
4 月 18 日 週五
目前市場雖已部分計價悲觀預期,但AI股估值和預期的下調仍未見底。
placeholder
道瓊斯指數暴跌超過500點,聯合健康大幅下跌,特朗普抨擊鮑威爾延遲降息道瓊斯工業平均指數(DJIA)週四暴跌超過 500 點,或超過 1.30%,聯合健康集團(UNH)股價因財報不及預期和對全年前景的悲觀展望而暴跌 23%
作者  FXStreet
4 月 18 日 週五
道瓊斯工業平均指數(DJIA)週四暴跌超過 500 點,或超過 1.30%,聯合健康集團(UNH)股價因財報不及預期和對全年前景的悲觀展望而暴跌 23%