在研究中,Ziff Davis 的 AI 律師 George Wukoson 和首席技術官 Joey Fortuna 聲稱,AI 公司根據搜索引擎排名較高的權威網站的排名來選擇訓練數據。選擇高質量和受歡迎的網站來改進模型,因爲它們具有良好的聲譽。根據該研究,該策略使人工智能開發人員能夠微調語言模型。 Ziff Davis 指出,Axel Springer、Future PLC、Hearst、新聞集團和紐約時報等頂級內容提供商爲訓練數據集的開發做出了貢獻。特別是,已dent用於創建 OpenAI 的 GPT-3 的 OpenWebText2 的 12.04% 來自這些受信任的發佈者。 馬克·扎克伯格還對圍繞人工智能培訓內容使用正在進行的爭論發表了看法。在最近接受 The Verge 採訪時,扎克伯格承認人工智能的數據抓取具有挑戰性,但也指出個人創作者或出版商的內容可能沒有那麼有影響力。他表示,“我認爲個人創作者或出版商往往會高估其特定內容在這個宏偉計劃中的價值。” 培訓數據源的保密引起了出版商和消費者的擔憂。 《紐約時報》和《華爾街日報》最近對人工智能公司提起訴訟,稱它們使用其內容違反了版權法。 儘管 OpenAI 已努力從《金融時報》和 DotDash Meredith 等媒體組織獲得內容許可,但仍有幾家人工智能公司在沒有適當許可的情況下開展業務。該報告進一步指出, “主要的法學碩士開發人員不再像以前那樣披露他們的培訓數據。” 儘管人工智能公司的價值不斷上升,但科技巨頭與傳統媒體公司之間的差距仍然巨大。谷歌和 Meta 等科技巨頭的估值分別爲 2.2 萬億美元和 1.5 萬億美元,仍然處於生成人工智能領域的前沿,而 OpenAI 和 Anthropic 等初創公司的估值分別爲 1570 億美元和 400 億美元。 另一方面,出版商仍在應對裁員和重組,這證明了適應人工智能日益defi的環境所面臨的財務壓力。由於與用戶生成和基於人工智能的內容的競爭,許多出版商面臨着降低成本和人員方面的挑戰。出版商對人工智能公司提起訴訟