雖然這些大型科技公司和其他公司正在投資數十億美元專注於開發大型法學碩士來處理許多不同的任務,但人工智能的現實是,沒有一種方法適合所有的情況,因爲企業需要特定於任務的模型。 AWS 首席執行官馬特·加曼 (Matt Garman) 在一份有關擴大合作伙伴關係和投資的新聞稿中表示,正在開發由 Anthropic 驅動的生成式 AI 的 AWS 客戶已經做出了壓倒性的反應。 對於大多數公司來說,法學碩士仍然是某些項目的第一選擇,但對於其他公司來說,這種選擇在成本、能源和計算資源方面可能會很昂貴。 Teradatadent兼首席執行官史蒂文·麥克米倫 (Steven McMillan) 爲一些企業提供了替代路徑,但他也有不同的看法。他對 SLM 充滿信心。 “展望未來,我們認爲中小型語言模型和受控環境(例如特定領域的法學碩士)將提供更好的解決方案。” 〜麥克米倫 SLM 針對特定類型的數據生成定製輸出,因爲語言模型經過專門訓練來實現這一點。由於 SLM 生成的數據保存在內部,因此語言模型會根據潛在的敏感數據進行訓練。 由於法學碩士非常消耗能源,因此小語言版本經過培訓,可以根據項目的實際需求調整計算和能源使用。通過這樣的調整,這意味着 SLM 比當前的大型模型更加高效且成本更低。 對於想要使用人工智能獲取特定知識的用戶來說,可以選擇特定領域的法學碩士,因爲它們不提供廣泛的知識。經過訓練,它只能深入瞭解一類信息並更準確地做出響應,例如該領域的 CMO 與 CFO。 據數據科學家協會 (ADaSci) 稱,爲 100 萬用戶完全開發具有 70 億個參數的 SLM 僅需要 55.1MWh(兆瓦時)。 ADaSci 發現,使用 1750 億個參數訓練GPT-3估計消耗了 1,287MWh 的電力,並且該電力不包括正式投入使用時的電力。因此,SLM 消耗的能量大約是 LLM 訓練消耗能量的 5%。 大型模型通常在雲計算機上運行,因爲它們使用的計算能力比單個設備上可用的計算能力更多。這會給公司帶來麻煩,因爲他們在信息轉移到雲端時失去了對信息的控制,並且在通過互聯網傳輸時反應緩慢。 展望未來,企業對人工智能的採用不會一刀切,因爲效率和選擇最好、最便宜的工具來完成任務將成爲焦點,這意味着爲每個項目選擇合適規模的模型。 這將爲所有模型完成,無論是通用的法學碩士,還是較小的特定領域的法學碩士,具體取決於哪個模型將提供更好的結果,需要更少的資源,並減少數據遷移到雲的需求。 在下一階段,人工智能對於商業決策至關重要,因爲公衆對人工智能生成的答案充滿信心。 “當你考慮訓練人工智能模型時,它們必須建立在大數據的基礎上。” 〜麥克米倫 “這就是我們的全部目的,提供可信的數據集,然後提供功能和分析功能,以便客戶及其客戶可以信任輸出,”麥克米蘭補充道。 隨着世界對效率和準確性的要求很高,規模較小且特定領域的法學碩士提供了另一種選擇,以提供公司和更廣泛的公衆可以信賴的結果。 90 天內開啓您的 Web3 職業生涯並獲得高薪加密工作的分步系統。爲什麼 SLM 是首選