Nvidia推出了Fugatto,這是一款旨在創建和修改音頻的尖端人工智能工具。該模型於週一宣佈,面向音樂製作人、電影製作人和視頻遊戲開發商。
Fugatto 可以根據文本提示生成音效和音樂,同時以高度創新的方式轉換現有音頻。例如,它可以將鋼琴旋律轉變成聲樂,或者發出像狗吠一樣的喇叭聲。
英偉達尚未宣佈向公衆開放該工具,理由是存在道德問題和濫用風險。 “我們需要對此保持謹慎,”英偉達應用深度學習研究副dentBryan Catanzaro 表示。 Fugatto 這個名字源自“Foundational Generative Audio Transformer Opus 1(簡稱 Fugatto)”。
然而,生成式人工智能的爭議並不新鮮。像 OpenAI 這樣的公司正面臨着這些工具帶來的道德困境的強烈反對。斯嘉麗約翰遜最近指責 OpenAI 在未經許可的情況下模仿她的聲音。英偉達正在謹慎行事。
Fugatto 接受了開源數據培訓,以避免知識產權衝突。儘管如此,濫用的風險仍然存在。人工智能產生的錯誤信息、版權侵權和其他潛在的濫用行爲使得像英偉達這樣的公司在是否將這些工具推向市場方面猶豫不決。
雖然包括 Meta 和 OpenAI 在內的其他人工智能開發商對於他們的生成音頻和視頻工具何時推出仍含糊其辭,但 Nvidia 的謹慎態度凸顯了公司走鋼絲的態度。正如卡坦扎羅所說,“任何生成技術總是會帶來一些風險。”
英偉達首席執行官黃仁勳並不相信人工智能已經準備好迎接黃金時期。黃在香港科技大學發表演講時承認,當今的人工智能模型無法提供始終可靠的答案。他描述了人們完全接受這項技術之前需要彌合的信任差距。
“我們距離做到這一點還需要幾年的時間,”他說。黃強調了“幻覺”的問題,即人工智能會產生錯誤或誤導性的結果。他認爲,用戶不應該事後猜測人工智能生成的答案是準確還是無稽之談。
黃還強調,僅僅收集數據和預訓練模型已經不夠了。人工智能必須超越“僅僅獲取所有數據”的階段。他將預訓練比作大學畢業——這是一個重要的里程碑,但距離終點線還很遠。
英偉達的解決方案?更強大的計算能力和先進的訓練技術。該公司正在加倍努力創新,這一點至關重要,因爲像 ChatGPT 這樣的大型語言模型雖然令人印象深刻,但仍然面臨着不準確和道德問題等問題。
OpenAI 也深知這一點。去年,由於其聊天機器人錯誤地對一名廣播主持人提出了法律投訴,該公司被起訴。
Fugatto 宣佈的同一天,Nvidia 高管 Jay Puri 在北京會見了中國商務部副部長王受文。中國鋪開了紅地毯,承諾改善英偉達等外國公司的營商環境。
此舉正值中美關係緊張之際,拜登政府正在準備對中國半導體出口實施新的限制。
中國商務部表示希望修復與美國的貿易關係,並將英偉達描述爲其技術戰略的關鍵合作伙伴。外交部的聲明還暗示加強兩國之間的溝通。
回到美國,英偉達正在關注拜登政府加大力度限制中國獲得尖端半導體。這增加了像英偉達這樣在兩國都有深厚業務聯繫的公司的風險。
90 天內找到一份高薪 Web3 工作: 終極路線圖