」工欲善其事,必先利其器。「—孔子《論語.錄靈公》
首頁 > 人工智慧 > 蘋果公司的一項新研究顯示人工智慧推理有嚴重缺陷

蘋果公司的一項新研究顯示人工智慧推理有嚴重缺陷

發佈於2024-11-04
瀏覽:423

人工智慧並不總是能把事情做好,這並不奇怪。有時候,甚至會產生幻覺。然而,蘋果研究人員最近的一項研究表明,人工智慧用於形式推理的數學模型存在更嚴重的缺陷。

✕ 刪除廣告

作為研究的一部分,蘋果科學家詢問了人工智慧大型語言模型(法學碩士)一個問題,以略有不同的方式多次提出,當他們發現法學碩士提供了意想不到的答案改變時,他們感到驚訝。當涉及到數字時,這些差異最為突出。

蘋果的研究顯示人工智慧的可靠性存在大問題

A New Apple Study Shows AI Reasoning Has Critical Flaws

這項由arxiv.org 發表的研究得出的結論是,「不同設備之間存在顯著的性能差異」。同一問題的不同實例,挑戰了目前依賴單點精確度指標的 GSM8K 結果的可靠性。 」 GSM8K 是一個資料集,其中包含8000 多個不同的小學數學問題和答案。

✕ 刪除廣告

Apple 研究人員發現此性能的差異可能高達10%。即使提示中的微小變化也可能導致LLM 答案的可靠性出現巨大問題。起來像是在使用邏輯來為您的查詢提供答案,但實際使用的並不是邏輯。即使改變幾個不重要的單字也會改變這種模式識別。 ,然後添加了一些有關獼猴桃大小的無關緊要的信息。 ,儘管獼猴桃大小數據對問題的結果沒有實際影響,但他們還是從對照中改變了他們對問題的答案。 ]

由於LLM 在我們的文化中變得越來越重要,這一消息引起了我們是否可以信任AI 的巨大擔憂為我們的詢問提供準確的答案。強調了在使用大型語言模型時準確驗證收到的資訊的必要性。如果您是經常使用人工智慧的人,您可能已經知道這一點。
版本聲明 本文轉載於:https://www.makeuseof.com/apple-study-reveals-ai-reasoning-critical-flaws/如有侵犯,請聯絡[email protected]刪除
最新教學 更多>
  • 群智能算法:三個Python實現
    群智能算法:三個Python實現
    Imagine watching a flock of birds in flight. There's no leader, no one giving directions, yet they swoop and glide together in perfect harmony. It may...
    人工智慧 發佈於2025-03-24
  • 如何通過抹布和微調使LLM更準確
    如何通過抹布和微調使LLM更準確
    Imagine studying a module at university for a semester. At the end, after an intensive learning phase, you take an exam – and you can recall th...
    人工智慧 發佈於2025-03-24
  • 什麼是Google Gemini?您需要了解的有關Google Chatgpt競爭對手的一切
    什麼是Google Gemini?您需要了解的有關Google Chatgpt競爭對手的一切
    Google recently released its new Generative AI model, Gemini. It results from a collaborative effort by a range of teams at Google, including members ...
    人工智慧 發佈於2025-03-23
  • 與DSPY提示的指南
    與DSPY提示的指南
    DSPY(聲明性的自我改善語言程序)通過抽象及時工程的複雜性來徹底改變LLM應用程序的開發。 本教程提供了使用DSPY的聲明方法來構建強大的AI應用程序的綜合指南。 [2 抓取DSPY的聲明方法,用於簡化LLM應用程序開發。 了解DSPY如何自動化提示工程並優化複雜任務的性能。 探索實用的D...
    人工智慧 發佈於2025-03-22
  • 自動化博客到Twitter線程
    自動化博客到Twitter線程
    本文详细介绍了使用Google的Gemini-2.0 LLM,Chromadb和Shiplit自动化长效内容的转换(例如博客文章)。 手动线程创建耗时;此应用程序简化了该过程。 [2 [2 使用Gemini-2.0,Chromadb和Shatlit自动化博客到twitter线程转换。 获得实用的经...
    人工智慧 發佈於2025-03-11
  • 人工免疫系統(AIS):python示例的指南
    人工免疫系統(AIS):python示例的指南
    本文探討了人造免疫系統(AIS),這是受人類免疫系統識別和中和威脅的非凡能力啟發的計算模型。 我們將深入研究AIS的核心原理,檢查諸如克隆選擇,負面選擇和免疫網絡理論之類的關鍵算法,並用Python代碼示例說明其應用。 [2 抗體:識別並結合特定威脅(抗原)。在AIS中,這些代表了問題的潛在解決方...
    人工智慧 發佈於2025-03-04
  • 試著向 ChatGPT 詢問這些關於您自己的有趣問題
    試著向 ChatGPT 詢問這些關於您自己的有趣問題
    有没有想过 ChatGPT 了解您的哪些信息?随着时间的推移,它如何处理您提供给它的信息?我在不同的场景中使用过 ChatGPT 堆,在特定的交互后看看它会说什么总是很有趣。✕ 删除广告 所以,为什么不尝试向 ChatGPT 询问其中一些问题来看看它对你的真实看法是什么? 我理想生活中的...
    人工智慧 發佈於2024-11-22
  • 您仍然可以透過以下方式嘗試神秘的 GPT-2 聊天機器人
    您仍然可以透過以下方式嘗試神秘的 GPT-2 聊天機器人
    如果您對人工智慧模型或聊天機器人感興趣,您可能已經看過有關神秘的 GPT-2 聊天機器人及其有效性的討論。 在這裡,我們解釋什麼是 GPT-2 聊天機器人以及如何使用存取它。 什麼是 GPT-2 聊天機器人? 2024年4月下旬,一個名為gpt2-chatbot的神秘AI模型在LLM測試和基準測試...
    人工智慧 發佈於2024-11-08
  • ChatGPT 的 Canvas 模式很棒:有 4 種使用方法
    ChatGPT 的 Canvas 模式很棒:有 4 種使用方法
    ChatGPT 的新 Canvas 模式為世界領先的生成式 AI 工具中的寫作和編輯增添了額外的維度。自從 ChatGPT Canvas 推出以來,我一直在使用它,並找到了幾種不同的方法來使用這個新的 AI 工具。 ✕ 刪除廣告 1 文本編輯 ChatGPT Canvas 是如果你想編輯...
    人工智慧 發佈於2024-11-08
  • ChatGPT 的自訂 GPT 如何暴露您的資料以及如何確保其安全
    ChatGPT 的自訂 GPT 如何暴露您的資料以及如何確保其安全
    ChatGPT 的自訂 GPT 功能允許任何人為幾乎任何你能想到的東西創建自訂 AI 工具;創意、技術、遊戲、自訂 GPT 都可以做到。更好的是,您可以與任何人分享您的自訂 GPT 創建。 但是,透過分享您的自訂 GPT,您可能會犯下一個代價高昂的錯誤,將您的資料暴露給全球數千人。 什麼是自訂...
    人工智慧 發佈於2024-11-08
  • ChatGPT 可協助您在 LinkedIn 上找到工作的 10 種方式
    ChatGPT 可協助您在 LinkedIn 上找到工作的 10 種方式
    LinkedIn 个人资料的“关于”部分有 2,600 个可用字符,是阐述您的背景、技能、热情和未来目标的绝佳空间。查看您的 LinkedIn 简历,作为您的专业背景、技能和抱负的简明摘要。 向 ChatGPT 提供您所有获胜品质的列表,或将您的简历复制粘贴到其中。要求聊天机器人使用这些信息撰写...
    人工智慧 發佈於2024-11-08
  • 查看這 6 個鮮為人知的 AI 應用程序,它們可提供獨特的體驗
    查看這 6 個鮮為人知的 AI 應用程序,它們可提供獨特的體驗
    目前,大多数人都听说过 ChatGPT 和 Copilot,这两款引领 AI 热潮的开创性生成式 AI 应用程序。但是您知道吗,大量鲜为人知的 AI 工具可以提供精彩的、独特的经历?这里有六个最好的。 1 Ditto Music Ditto 不是您可以用来创建独特歌曲的众多 AI 音乐生成器之一,而...
    人工智慧 發佈於2024-11-08
  • 這 7 個跡象表明我們已經達到人工智慧的巔峰
    這 7 個跡象表明我們已經達到人工智慧的巔峰
    无论您在网上查找什么,都有网站、服务和应用程序宣称他们使用人工智能使其成为最佳选择。我不了解你的情况,但它的持续存在已经让人厌倦了。 因此,虽然人工智能肯定会留在我们的日常生活中,但有几个迹象表明我们已经达到了人工智能炒作的顶峰。 1 公众兴趣有限 虽然人工智能在科技圈受到了广泛关注,但重要的是要...
    人工智慧 發佈於2024-11-08
  • 4 個適合教師、講師和老闆的 AI 檢查 ChatGPT 偵測器工具
    4 個適合教師、講師和老闆的 AI 檢查 ChatGPT 偵測器工具
    随着 ChatGPT 能力的进步,区分哪些内容是人类编写的,哪些内容是人工智能生成的变得越来越困难。这使得老师和老板很难识别哪些内容是人手写的,哪些内容是通过 ChatGPT 生成的。 如果您很难区分,这里有最好的 ChatGPT 检测工具 我们如何测试每个 ChatGPT 检查工具 有很多...
    人工智慧 發佈於2024-11-08
  • ChatGPT 的高級語音功能正在向更多用戶推出
    ChatGPT 的高級語音功能正在向更多用戶推出
    如果您曾經想與 ChatGPT 進行全面對話,現在您可以。也就是說,只要你付費就可以獲得使用ChatGPT的特權。更多付費用戶正在存取 ChatGPT 的高級語音模式 (AVM),該模式旨在使與 ChatGPT 的互動感覺更加自然。 高級語音來到 ChatGPT Plus 和 Teams Ope...
    人工智慧 發佈於2024-11-08

免責聲明: 提供的所有資源部分來自互聯網,如果有侵犯您的版權或其他權益,請說明詳細緣由並提供版權或權益證明然後發到郵箱:[email protected] 我們會在第一時間內為您處理。

Copyright© 2022 湘ICP备2022001581号-3