新研究發現,人工智能公司依賴優質出版商提供訓練數據

來源 Cryptopolitan

在研究中,Ziff Davis 的 AI 律師 George Wukoson 和首席技術官 Joey Fortuna 聲稱,AI 公司根據搜索引擎排名較高的權威網站的排名來選擇訓練數據。選擇高質量和受歡迎的網站來改進模型,因爲它們具有良好的聲譽。根據該研究,該策略使人工智能開發人員能夠微調語言模型。

Ziff Davis 指出,Axel Springer、Future PLC、Hearst、新聞集團和紐約時報等頂級內容提供商爲訓練數據集的開發做出了貢獻。特別是,已dent用於創建 OpenAI 的 GPT-3 的 OpenWebText2 的 12.04% 來自這些受信任的發佈者。

馬克·扎克伯格還對圍繞人工智能培訓內容使用正在進行的爭論發表了看法。在最近接受 The Verge 採訪時,扎克伯格承認人工智能的數據抓取具有挑戰性,但也指出個人創作者或出版商的內容可能沒有那麼有影響力。他表示,“我認爲個人創作者或出版商往往會高估其特定內容在這個宏偉計劃中的價值。”

出版商對人工智能公司提起訴訟

培訓數據源的保密引起了出版商和消費者的擔憂。 《紐約時報》和《華爾街日報》最近對人工智能公司提起訴訟,稱它們使用其內容違反了版權法。

儘管 OpenAI 已努力從《金融時報》和 DotDash Meredith 等媒體組織獲得內容許可,但仍有幾家人工智能公司在沒有適當許可的情況下開展業務。該報告進一步指出, “主要的法學碩士開發人員不再像以前那樣披露他們的培訓數據。”

儘管人工智能公司的價值不斷上升,但科技巨頭與傳統媒體公司之間的差距仍然巨大。谷歌和 Meta 等科技巨頭的估值分別爲 2.2 萬億美元和 1.5 萬億美元,仍然處於生成人工智能領域的前沿,而 OpenAI 和 Anthropic 等初創公司的估值分別爲 1570 億美元和 400 億美元。

另一方面,出版商仍在應對裁員和重組,這證明了適應人工智能日益defi的環境所面臨的財務壓力。由於與用戶生成和基於人工智能的內容的競爭,許多出版商面臨着降低成本和人員方面的挑戰。

免責聲明:僅供參考。 過去的表現並不預示未來的結果。
placeholder
日本東證指數創收盤歷史新高!2024年日股繼續大爆發? 7月4日,日本東證指數(TOPIX)突破了1989年泡沫時代的高點,收盤創下歷史新高。
作者  Alison Ho
7 月 04 日 週四
7月4日,日本東證指數(TOPIX)突破了1989年泡沫時代的高點,收盤創下歷史新高。
placeholder
iPhone16出貨量激增!蘋果市值突破3.5兆美元,分析師警告回檔風險 近期蘋果(Apple)迎兩大利好,一是個人電腦交付量較去年同期大漲21%,二是2024下半年iPhone 16出貨量將成長11%。
作者  Alison Ho
7 月 11 日 週四
近期蘋果(Apple)迎兩大利好,一是個人電腦交付量較去年同期大漲21%,二是2024下半年iPhone 16出貨量將成長11%。
placeholder
用黃金和比特幣對衝赤字和通膨風險?業內人士這樣建議FX168財經報社(亞太)訊 根據一家投資公司的觀點,儘管美國政府可能設法控制部分開支,但赤字的增長仍然令人擔憂,並繼續對通脹構成持久威脅。
作者  FX168
昨日 12: 06
FX168財經報社(亞太)訊 根據一家投資公司的觀點,儘管美國政府可能設法控制部分開支,但赤字的增長仍然令人擔憂,並繼續對通脹構成持久威脅。
placeholder
Reddit:美國版 “知乎 + 貼吧”,憑什麼老樹開新芽?有一個商業模式普通、成立於PC時代的“老傢伙”也間接乘了AI的東風,走出了半年三倍的行情——“古早貼吧”$Reddit(RDDT.US) ,從上市的100億,翻到了目前的300億。
作者  海豚投研
13 小時前
有一個商業模式普通、成立於PC時代的“老傢伙”也間接乘了AI的東風,走出了半年三倍的行情——“古早貼吧”$Reddit(RDDT.US) ,從上市的100億,翻到了目前的300億。
placeholder
【港股分析】內銀股繼續領漲 加強大盤穩定性12月24日,港股在聖誕節前夕只有半日市,市況出現有盤穩回好的跡象,恒指漲了有210多點,回企至20000點水平來收盤,而半日大市成交量有接近850億元。
作者  葉尚志
11 小時前
12月24日,港股在聖誕節前夕只有半日市,市況出現有盤穩回好的跡象,恒指漲了有210多點,回企至20000點水平來收盤,而半日大市成交量有接近850億元。
goTop
quote