」工欲善其事,必先利其器。「—孔子《論語.錄靈公》
首頁 > 人工智慧 > 蘋果公司的一項新研究顯示人工智慧推理有嚴重缺陷

蘋果公司的一項新研究顯示人工智慧推理有嚴重缺陷

發佈於2024-11-04
瀏覽:436

人工智慧並不總是能把事情做好,這並不奇怪。有時候,甚至會產生幻覺。然而,蘋果研究人員最近的一項研究表明,人工智慧用於形式推理的數學模型存在更嚴重的缺陷。

✕ 刪除廣告

作為研究的一部分,蘋果科學家詢問了人工智慧大型語言模型(法學碩士)一個問題,以略有不同的方式多次提出,當他們發現法學碩士提供了意想不到的答案改變時,他們感到驚訝。當涉及到數字時,這些差異最為突出。

蘋果的研究顯示人工智慧的可靠性存在大問題

A New Apple Study Shows AI Reasoning Has Critical Flaws

這項由arxiv.org 發表的研究得出的結論是,「不同設備之間存在顯著的性能差異」。同一問題的不同實例,挑戰了目前依賴單點精確度指標的 GSM8K 結果的可靠性。 」 GSM8K 是一個資料集,其中包含8000 多個不同的小學數學問題和答案。

✕ 刪除廣告

Apple 研究人員發現此性能的差異可能高達10%。即使提示中的微小變化也可能導致LLM 答案的可靠性出現巨大問題。起來像是在使用邏輯來為您的查詢提供答案,但實際使用的並不是邏輯。即使改變幾個不重要的單字也會改變這種模式識別。 ,然後添加了一些有關獼猴桃大小的無關緊要的信息。 ,儘管獼猴桃大小數據對問題的結果沒有實際影響,但他們還是從對照中改變了他們對問題的答案。 ]

由於LLM 在我們的文化中變得越來越重要,這一消息引起了我們是否可以信任AI 的巨大擔憂為我們的詢問提供準確的答案。強調了在使用大型語言模型時準確驗證收到的資訊的必要性。如果您是經常使用人工智慧的人,您可能已經知道這一點。
版本聲明 本文轉載於:https://www.makeuseof.com/apple-study-reveals-ai-reasoning-critical-flaws/如有侵犯,請聯絡[email protected]刪除
最新教學 更多>
  • ChatGPT 功能可協助我為每個查詢取得個人化結果
    ChatGPT 功能可協助我為每個查詢取得個人化結果
    當我第一次遇到 ChatGPT 的記憶功能時,我不確定會發生什麼。但使用一段時間後,我意識到它對我得到的回應品質產生了巨大的影響。這就像擁有一個數位助理,不僅可以傾聽,還可以記住您的偏好,這是獲得對我的查詢的自訂回應的關鍵。 什麼是 ChatGPT Memories? Memories 是一項...
    人工智慧 發佈於2024-11-06
  • 您可以使用 VPN 存取 ChatGPT 嗎?
    您可以使用 VPN 存取 ChatGPT 嗎?
    那麼,您可以使用 VPN 來存取 ChatGPT 嗎? ChatGPT 和 VPN 使用 VPN 訪問 ChatGPT 很容易,就像訪問任何其他網站一樣。 VPN 啟動後,您只需登入 ChatGPT 即可開始使用。 您可能將ChatGPT 與VPN 結合使用的原因有幾個,包括: 地理禁令:...
    人工智慧 發佈於2024-11-06
  • 我如何使用 ChatGPT 多工具擴充功能來大幅增強其功能
    我如何使用 ChatGPT 多工具擴充功能來大幅增強其功能
    雖然 ChatGPT 是一個非常強大的工具,但一些缺少的功能可以讓它變得更好。作為 ChatGPT 的普通用戶,我使用免費增值 Chrome 擴展 Superpower ChatGPT 來享受新功能並改善我的 ChatGPT 體驗。 1 在不同自訂指令之間切換 ChatGPT 的自訂指令該功能可讓...
    人工智慧 發佈於2024-11-05
  • 如何使用 Nightshade 保護您的藝術品免受生成人工智慧的影響
    如何使用 Nightshade 保護您的藝術品免受生成人工智慧的影響
    人工智慧工具是革命性的,現在可以進行對話,產生類似人類的文本,並根據單字創建圖像。然而,這些人工智慧工具使用的訓練資料通常來自受版權保護的來源,特別是當涉及 DALL-E、Midjourney 等文字到圖像生成器時。 阻止生成式人工智慧工具使用版權圖像進行訓練是很困難的,各行各業的藝術家都在努力...
    人工智慧 發佈於2024-11-04
  • 蘋果人工智慧的隱私保護前景看好,但我認為存在一個問題
    蘋果人工智慧的隱私保護前景看好,但我認為存在一個問題
    蘋果在 WWDC24 上推出了一系列人工智慧功能,承諾為 iPhone、iPad 和 Mac 提供強大的工具。但蘋果真的能保證人工智慧世界中的隱私嗎?他們的設備上處理和私有雲解決方案令人印象深刻,但 ChatGPT 的整合造成了潛在的漏洞。 蘋果計劃如何將其AI 私有化 Apple 在WWDC2...
    人工智慧 發佈於2024-11-04
  • 蘋果公司的一項新研究顯示人工智慧推理有嚴重缺陷
    蘋果公司的一項新研究顯示人工智慧推理有嚴重缺陷
    人工智慧並不總是能把事情做好,這並不奇怪。有時候,甚至會產生幻覺。然而,蘋果研究人員最近的一項研究表明,人工智慧用於形式推理的數學模型存在更嚴重的缺陷。 ✕ 刪除廣告作為研究的一部分,蘋果科學家詢問了人工智慧大型語言模型(法學碩士)一個問題,以略有不同的方式多次提出,當他們發現法學碩士提...
    人工智慧 發佈於2024-11-04
  • 為什麼 ChatGPT 的語音轉文字功能是我用過的最好的
    為什麼 ChatGPT 的語音轉文字功能是我用過的最好的
    說出來才能相信;這就是 ChatGPT 出色的語音轉文字功能。事實證明,它比一些最成熟的語音轉文字應用程式更流暢和精確。 ChatGPT 比 Google 的語音輸入更好 Google 的語音輸入是我斷斷續續使用多年的工具。它配備了 SwiftKey 鍵盤應用程式和 Google 自己的手機 ...
    人工智慧 發佈於2024-11-04
  • 如何隱藏您的 ChatGPT 對話而不刪除它們
    如何隱藏您的 ChatGPT 對話而不刪除它們
    您與 ChatGPT 的某些對話可能比其他對話更私密。幸運的是,OpenAI 可以輕鬆存檔您的聊天記錄並將對話隱藏起來。無論您在網路上還是在智慧型手機上使用 ChatGPT,隱藏這些 AI 聊天都很簡單。 如何隱藏 ChatGPT 在網路上的聊天 ChatGPT 具有存檔功能,只需點擊幾下即可...
    人工智慧 發佈於2024-11-04
  • GPT-4 現在對所有人免費,但仍有 6 個理由繼續使用 ChatGPT Plus
    GPT-4 現在對所有人免費,但仍有 6 個理由繼續使用 ChatGPT Plus
    在 OpenAI 春季更新之后,GPT-4o 已向免费用户公开提供。这意味着每个人都可以免费访问 GPT-4 级别的智能。您可能想知道,既然可以免费获得,为什么还要继续每月支付 20 美元。 那么,以下是您可能想要保留 ChatGPT Plus 子系统的一些原因。 1 更多地访问 GPT-4o ...
    人工智慧 發佈於2024-11-04
  • 我已經放棄 ChatGPT,轉而選擇這個優越的替代方案:3 個原因
    我已經放棄 ChatGPT,轉而選擇這個優越的替代方案:3 個原因
    讓我們切入正題:我已經從 ChatGPT 切換到 Claude。這並不是說 ChatGPT 不好,而是這樣。但就我的需求而言,克勞德有一些優勢,對我的日常生活產生了真正的影響。 以下是我做出轉變的三個關鍵原因... 1 克勞德實際上明白我在說什麼 我不是完全的人工智慧新手,但我也沒有在業餘時...
    人工智慧 發佈於2024-11-02
  • 如何使用 OpenAI 的 ChatGPT
    如何使用 OpenAI 的 ChatGPT
    除了能够撰写工作电子邮件之外,ChatGPT 还可以为您的演示提供反馈,建议周末旅行的行程,或者在您精力耗尽时集思广益新想法。使用 ChatGPT,您输入请求并按 Enter 键,几秒钟内就会看到响应出现在您面前。 想了解如何使用 ChatGPT?我们已经为您提供了保障。 什么是 ChatGP...
    人工智慧 發佈於2024-11-02
  • GPT-4o 將 GPT-4 帶給每個人,這就是它的工作原理
    GPT-4o 將 GPT-4 帶給每個人,這就是它的工作原理
    那麼,什麼是 GPT-4o? 什麼是 GPT-4o? GPT-4o 是 ChatGPT 開發商 OpenAI 的最新 AI 模型,於 2024 年 5 月初的「春季更新」活動中發布。它將與之前表現最好的模型 GPT-4 Turbo 共存,至少目前如此,並為該工具帶來大量更新。 與其前身不同,...
    人工智慧 發佈於2024-11-02
  • 微軟收購暴雪,探索人工智慧藝術和翻譯 [Podcast]
    微軟收購暴雪,探索人工智慧藝術和翻譯 [Podcast]
    本週的播客回答了這些問題,並仔細考慮了英國政府批准微軟收購動視暴雪的影響。 您可以在 Apple 播客、Spotify、Google 播客、Amazon Music 和 Audible、Player FM 上訂閱真正有用的播客,或將 RSS 來源複製到您的播客播放器中。 Shownotes ...
    人工智慧 發佈於2024-11-01
  • 超越法學碩士:這就是為什麼小語言模型是人工智慧的未來
    超越法學碩士:這就是為什麼小語言模型是人工智慧的未來
    大型语言模型 (LLM) 随着 Open AI 的 ChatGPT 的发布而出现。从那时起,一些公司也推出了他们的法学硕士,但更多的公司现在倾向于小语言模型(SLM)。SLM 正在获得动力,但它们是什么,与法学硕士有何不同? 什么是小语言模型? 小语言模型(SLM)是一种参数较少的人工智能模型(将其...
    人工智慧 發佈於2024-11-01
  • 5 個最佳開源 AI 影像產生器
    5 個最佳開源 AI 影像產生器
    互联网上有数十个免费和开源的人工智能文本到图像生成器,专门用于特定类型的图像。因此,我们筛选了一堆,找到了您现在可以尝试的最佳开源人工智能文本到图像生成器。 1 Craiyon Craiyon 是最容易访问的开源 AI 图像生成器之一。它基于 DALL-E Mini,虽然您可以克隆 Githu...
    人工智慧 發佈於2024-09-02

免責聲明: 提供的所有資源部分來自互聯網,如果有侵犯您的版權或其他權益,請說明詳細緣由並提供版權或權益證明然後發到郵箱:[email protected] 我們會在第一時間內為您處理。

Copyright© 2022 湘ICP备2022001581号-3