OpenAI 和 Meta 正在合作用非洲語言訓練人工智能系統。該項目包括法國電信巨頭 Orange SA,旨在彌補人工智能領域的重大差距。非洲這個擁有 2000 多種語言的大陸在人工智能培訓中很大程度上被忽視了。
該項目將於明年啓動,最初重點關注兩種西非語言:沃洛夫語和普拉爾語。這些語言總共有超過 2200 萬人使用,但當前的人工智能模型無法理解它們。
Orange 的目標是擴展其在非洲和中東的通信工具,該公司在非洲和中東的 18 個市場開展業務。但這不僅僅是客戶服務。第一階段將使用歐洲和非洲的數據中心以及公共雲系統來訓練人工智能。不過,該公司尚未明確說明將從何處獲取培訓數據。
Orange 首席人工智能官 Steve Jarrett 表示,該項目纔剛剛從 Wolof 和 Pulaar 開始。到明年,他們計劃爲林加拉語、斯瓦希里語和班巴拉語等其他撒哈拉以南語言訓練人工智能模型。這些語言對數百萬人至關重要,但在人工智能數據集中幾乎不存在。
賈勒特表示,這一舉措是朝着讓所有人都能接觸到人工智能邁出的一步,甚至包括文盲或被排除在數字進步之外的人羣。
OpenAI 將讓 Orange 儘早使用其模型。這使得 Orange 能夠開發人工智能驅動的工具,例如用於客戶服務的語音交互。他們還將處理歐洲數據中心的數據處理和託管。
這些模型將以開源方式運行,免費用於健康和教育服務等非商業用途。更廣泛的目標?爲 Orange 開展業務的所有 18 個西非國家推出定製人工智能解決方案。
作爲上下文,沃洛夫語在塞內加爾、岡比亞和毛里塔尼亞南部使用。 Pulaar 主要用於塞內加爾。這些語言共同代表了經常被主流人工智能系統忽視的重要羣體。
這對於像 Orange 這樣的公司來說是一件大事,這些公司在當地語言占主導地位的地區開展業務,但對於 OpenAI 的 GPT 或 Meta 的 Llama 等工具完全看不見。
這項工作利用了日益增長的“主權人工智能”概念。這個想法很簡單但很強大:地區和國家希望控制驅動人工智能的核心技術基礎設施。
通過本地化數據存儲和處理,他們確保自己的語言、文化和歷史不會被刪除。對於在全球科技發展中經常被邊緣化的非洲來說,這是一個展示其語言多樣性的機會。
Orange在這裏的角色是戰略性的。該公司計劃通過在歐洲中心託管 OpenAI 的模型來本地化數據處理。
此次合作還讓 Orange 能夠儘早獲得最新的人工智能進步,他們計劃將其用於語音客戶支持系統等應用。
90 天內找到一份高薪 Web3 工作: 終極路線圖