Appleの新たな調査でAI推論には重大な欠陥があることが判明

表紙 > AI > Appleの新たな調査でAI推論には重大な欠陥があることが判明

Appleの新たな調査でAI推論には重大な欠陥があることが判明

2024 年 11 月 4 日に公開

ブラウズ：285

AI が必ずしも物事を正しく理解できるとは限らないのは当然のことです。場合によっては幻覚まで現れることもあります。しかし、Apple 研究者らによる最近の研究では、AI が形式的推論に使用する数学的モデルにさらに重大な欠陥があることが判明しました。

✕ 広告を削除

研究の一環として、Apple の研究者は AI 大規模言語モデルを求めました。 (LLM) という質問を、わずかに異なる方法で複数回繰り返したところ、LLM が予想外の答えを返したことに驚きました。これらのばらつきは、数字が関係する場合に最も顕著でした。

Apple の調査は、AI の信頼性に大きな問題があることを示唆しています

A New Apple Study Shows AI Reasoning Has Critical Flaws

arxiv.org によって公開されたこの調査では、「パフォーマンスに大きなばらつきがある」と結論付けられています。同じ質問を異なるインスタンス化することで、単一点の精度メトリクスに依存する現在の GSM8K 結果の信頼性に疑問を投げかけています。」 GSM8K は、8,000 を超える多様な小学校の数学の質問と回答を含むデータセットです。

✕ 広告を削除

Apple の研究者は、このパフォーマンスの差異が 10% もある可能性があることを確認しました。また、プロンプトのわずかな違いでも、LLM の回答の信頼性に大きな問題が生じる可能性があります。

言い換えれば、ChatGPT のようなものを使用するときはいつでも、回答の事実を確認する必要があるかもしれません。その理由は、AI がロジックを使用して問い合わせに回答しているように見えることがありますが、使用されているのはロジックではないからです。

AI は代わりに、パターン認識を利用してプロンプトに応答します。しかし、Apple の研究は、重要でない単語をいくつか変更するだけでパターン認識がどのように変化するかを示しています。

ここで示した重大な差異の一例は、数日間にわたるキウイの収集に関する問題によって生じました。 Apple の研究者は対照実験を実施し、キウイのサイズに関する重要ではない情報を追加しました。

✕ 広告を削除

Meta モデルと OpenAI モデルの両方で問題が発生

Meta の Llama と OpenAI の o1、その後、キーウィのサイズデータが問題の結果に具体的な影響を与えなかったにもかかわらず、対照からの問題に対する回答を変更しました。 OpenAI の GPT-4o も、LLM に与えられたデータにわずかな変動を導入する際のパフォーマンスに問題がありました。

LLM は私たちの文化の中でより顕著になってきているため、このニュースは AI を信頼できるかどうかについて大きな懸念を引き起こしますお問い合わせに対して正確に回答するため。特に財務上のアドバイスなどの問題についてはそうです。また、大規模な言語モデルを使用するときに受け取る情報を正確に検証する必要性も強化されます。

つまり、AI に盲目的に依存するのではなく、批判的思考とデューデリジェンスを行う必要があるということです。繰り返しになりますが、AI を定期的に使用している人なら、おそらくすでにご存知でしょう。

✕ 広告を削除する

リリースステートメントこの記事は次の場所に転載されています: https://www.makeuseof.com/apple-study-reveals-ai-reasoning-critical-flaws/ 権利侵害がある場合は、[email protected] に連絡して削除してください。

最新のチュートリアルもっと>

Swarm Intelligence Algorithms：3つのPython実装
Imagine watching a flock of birds in flight. There's no leader, no one giving directions, yet they swoop and glide together in perfect harmony. It may...

AI 2025-03-24に投稿されました
ラグ＆微調整によりLLMをより正確にする方法
Imagine studying a module at university for a semester. At the end, after an intensive learning phase, you take an exam – and you can recall th...

AI 2025-03-24に投稿されました
Google Geminiとは何ですか？ GoogleのChatGptのライバルについて知る必要があるすべて
Google recently released its new Generative AI model, Gemini. It results from a collaborative effort by a range of teams at Google, including members ...

AI 2025-03-23に投稿されました
DSPYでのプロンプトのガイド
dspy：LLMアプリケーションを構築および改善するための宣言的なフレームワーク dspy（宣言的自己改善言語プログラム）は、迅速なエンジニアリングの複雑さを抽象化することにより、LLMアプリケーション開発に革命をもたらします。このチュートリアルは、DSPYの宣言的アプローチを使用して強力な...

AI 2025-03-22に投稿されました
ブログをTwitterスレッドに自動化します
この記事では、GoogleのGemini-2.0 LLM、Chromadb、およびRiremlitを使用して、長型コンテンツ（ブログ投稿など）のTwitterスレッドの魅力を自動化することを詳しく説明しています。手動スレッドの作成には時間がかかります。このアプリケーションはプロセスを合理化します...

AI 2025-03-11に投稿されました
人工免疫系（AIS）：Pythonの例を備えたガイド
この記事では、脅威を特定し、中和する人間の免疫系の顕著な能力に触発された計算モデルである人工免疫システム（AIS）を探ります。 AISのコア原則を掘り下げ、クローン選択、ネガティブ選択、免疫ネットワーク理論などの重要なアルゴリズムを調べ、Pythonコードの例でそれらのアプリケーションを説明します...

AI 2025-03-04に投稿されました
ChatGPT に自分自身についての楽しい質問をしてみてください
ChatGPT があなたについて何を知っているのか疑問に思ったことはありますか?時間をかけて与えられた情報をどのように処理するのでしょうか?私はさまざまなシナリオで ChatGPT ヒープを使用してきましたが、特定のインタラクションの後にそのヒープが何を言うのかを見るのは常に興味深いものです。&#x...

AI 2024 年 11 月 22 日に公開
謎の GPT-2 チャットボットをまだ試す方法は次のとおりです
AI モデルやチャットボットに興味がある場合は、謎の GPT-2 チャットボットとその有効性に関する議論を見たことがあるかもしれません。ここでは、GPT-2 チャットボットとは何か、およびその方法について説明します。 GPT-2 チャットボットとは何ですか? 2024 年 4 月下旬、gpt2-c...

AI 2024 年 11 月 8 日に公開
ChatGPT のキャンバスモードは素晴らしい: 4 つの使用方法
ChatGPT の新しい Canvas モードは、世界をリードする生成 AI ツールでの書き込みと編集にさらなる次元を追加しました。私は ChatGPT Canvas の発売以来使用してきましたが、この新しい AI ツールを使用するためのいくつかの異なる方法を見つけました。✕ 広告の削除...

AI 2024 年 11 月 8 日に公開
ChatGPT のカスタム GPT がデータを公開する仕組みとその安全性を保つ方法
ChatGPT のカスタム GPT 機能を使用すると、誰でも思いつく限りのほとんどすべてのカスタム AI ツールを作成できます。クリエイティブ、テクニカル、ゲーム、カスタム GPT はすべてを行うことができます。さらに良いのは、カスタム GPT 作成を誰とでも共有できることです。ただし、カスタ...

AI 2024 年 11 月 8 日に公開
ChatGPT が LinkedIn での仕事の獲得に役立つ 10 の方法
2,600 文字が利用できる LinkedIn プロフィールの About セクションは、あなたの経歴、スキル、情熱、将来の目標について詳しく説明するのに最適なスペースです。 LinkedIn の経歴を、あなたの職業上の背景、スキル、願望を簡潔にまとめたものとして表示します。 ChatGPT に...

AI 2024 年 11 月 8 日に公開
ユニークなエクスペリエンスを提供する、あまり知られていない 6 つの AI アプリをチェックしてください
現時点では、AI ブームをリードしてきた 2 つの先駆的な生成 AI アプリである ChatGPT と Copilot については、ほとんどの人が聞いたことがあるでしょう。しかし、あまり知られていない AI ツールの山が素晴らしい、ユニークな体験？ここでは最高のものを 6 つ紹介します。 1 同上ミ...

AI 2024 年 11 月 8 日に公開
これらの 7 つの兆候は、AI がすでにピークに達していることを示しています
オンラインでどこを見ても、AI の使用が最良の選択肢になると宣言するサイト、サービス、アプリがあります。あなたはどうか知りませんが、常に存在していると疲れてきます。 AI は確かに私たちの日常生活に定着していますが、AI の誇大宣伝がすでにピークに達していることを示す兆候がいくつかあります。 1 一...

AI 2024 年 11 月 8 日に公開
教師、講師、上司向けの 4 つの AI チェック ChatGPT 検出ツール
ChatGPT の性能が向上するにつれて、何が人間によって書かれ、何が AI によって生成されたかを区別することがますます困難になってきています。そのため、教師や上司が、人間の手によって書かれたものと、ChatGPT を通じて生成されたものを識別することが困難になります。違いを見分けるのが難し...

AI 2024 年 11 月 8 日に公開
ChatGPT の高度な音声機能がより多くのユーザーに展開されます
ChatGPT で本格的な会話をしたいと思ったことがあるなら、今ならそれが可能です。つまり、ChatGPT を使用する特権に対して料金を支払っている限りです。より多くの有料ユーザーが ChatGPT の高度な音声モード (AVM) にアクセスできるようになりました。これは、ChatGPT との対話を...

AI 2024 年 11 月 8 日に公開