새로운 Apple 연구에 따르면 AI 추론에 심각한 결함이 있음이 밝혀졌습니다.

첫 장 > 일체 포함 > 새로운 Apple 연구에 따르면 AI 추론에 심각한 결함이 있음이 밝혀졌습니다.

새로운 Apple 연구에 따르면 AI 추론에 심각한 결함이 있음이 밝혀졌습니다.

2024-11-04에 게시됨

검색:170

AI가 항상 일을 제대로 처리하지 못한다는 것은 놀라운 일이 아닙니다. 때로는 환각을 일으키기도 합니다. 그러나 Apple 연구진의 최근 연구에 따르면 AI가 형식적 추론에 사용하는 수학적 모델에 훨씬 더 심각한 결함이 있는 것으로 나타났습니다.

✕ 광고 제거

연구의 일환으로 Apple 과학자들은 AI 대형 언어 모델을 요청했습니다. (LLM) 약간씩 다른 방식으로 여러 번 질문을 던졌으며 LLM이 답변에 예상치 못한 변화를 제공한다는 사실을 알고 놀랐습니다. 이러한 변형은 숫자가 관련되었을 때 가장 두드러졌습니다.

Apple의 연구는 AI의 신뢰성에 큰 문제를 제시합니다.

A New Apple Study Shows AI Reasoning Has Critical Flaws

arxiv.org에서 발표한 연구에서는 "전체적으로 상당한 성능 변동이 있다"고 결론지었습니다. 동일한 질문에 대한 다른 인스턴스화로 인해 단일 지점 정확도 측정 기준에 의존하는 현재 GSM8K 결과의 신뢰성에 도전하고 있습니다." GSM8K는 8000개가 넘는 다양한 초등학교 수학 문제와 답변이 포함된 데이터 세트입니다.

✕ 광고 제거

Apple 연구진은 이 성능의 차이가 최대 10%에 이를 수 있음을 확인했습니다. 그리고 프롬프트가 약간만 변형되어도 LLM 답변의 신뢰성에 큰 문제가 발생할 수 있습니다.

즉, ChatGPT와 같은 도구를 사용할 때마다 답변의 사실 여부를 확인할 수 있습니다. 그 이유는 때때로 AI가 논리를 사용하여 문의에 대한 답변을 제공하는 것처럼 보일 수 있지만 실제로는 논리가 사용되지 않기 때문입니다.

AI는 대신 패턴 인식을 사용하여 프롬프트에 대한 응답을 제공합니다. 그러나 Apple 연구는 중요하지 않은 단어 몇 개만 바꾸면 패턴 인식이 어떻게 바뀔 수 있는지 보여줍니다.

제시된 중요한 차이의 한 예는 며칠에 걸쳐 키위를 수집하는 것과 관련된 문제를 통해 나타났습니다. Apple 연구진은 대조 실험을 수행한 후 키위 크기에 대한 몇 가지 중요하지 않은 정보를 추가했습니다.

✕ 광고 제거

Meta 및 OpenAI 모델 모두 문제가 나타났습니다.

Meta의 Llama 및 OpenAI의 o1, 그런 다음 키위 크기 데이터가 문제 결과에 실질적인 영향을 미치지 않음에도 불구하고 통제에서 문제에 대한 답변을 변경했습니다. OpenAI의 GPT-4o도 LLM에 제공되는 데이터에 작은 변형을 도입할 때 성능에 문제가 있었습니다.

LLM이 우리 문화에서 점점 더 두드러지고 있기 때문에 이 소식은 우리가 AI를 신뢰할 수 있는지에 대한 엄청난 우려를 불러일으킵니다. 문의사항에 대한 정확한 답변을 제공하기 위해 특히 재정 조언과 같은 문제의 경우. 또한 대규모 언어 모델을 사용할 때 수신한 정보를 정확하게 검증해야 할 필요성도 강화됩니다.

즉, AI에 맹목적으로 의존하기보다는 비판적 사고와 실사를 수행해야 한다는 의미입니다. 그리고 AI를 정기적으로 사용하는 사람이라면 이미 알고 있었을 것입니다.

✕ 광고 제거

릴리스 선언문 이 기사는 https://www.makeuseof.com/apple-study-reveals-ai-reasoning-tical-flaws/에 복제되어 있습니다. 침해 내용이 있는 경우, [email protected]으로 연락하여 삭제하시기 바랍니다.

최신 튜토리얼 더>

Swarm Intelligence 알고리즘 : 세 가지 파이썬 구현
Imagine watching a flock of birds in flight. There's no leader, no one giving directions, yet they swoop and glide together in perfect harmony. It may...

일체 포함 2025-03-24에 게시되었습니다
래그 및 미세 조정으로 LLM을 더 정확하게 만드는 방법
Imagine studying a module at university for a semester. At the end, after an intensive learning phase, you take an exam – and you can recall th...

일체 포함 2025-03-24에 게시되었습니다
Google Gemini는 무엇입니까? Google의 Chatgpt 라이벌에 대해 알아야 할 모든 것
Google recently released its new Generative AI model, Gemini. It results from a collaborative effort by a range of teams at Google, including members ...

일체 포함 2025-03-23에 게시되었습니다
DSPY와 함께 프롬프트 안내서
dspy : LLM 응용 프로그램을 구축하고 개선하기위한 선언적 프레임 워크 dspy (선언적 자체 개선 언어 프로그램)는 신속한 엔지니어링의 복잡성을 추상화하여 LLM 애플리케이션 개발에 혁명을 일으킨다. 이 튜토리얼은 DSPY의 선언적 접근 방식을 사용하여 ...

일체 포함 2025-03-22에 게시되었습니다
블로그를 트위터 스레드로 자동화하십시오
이 기사는 Google의 Gemini-2.0 LLM, ChromADB 및 Streamlit을 사용하여 긴 형식의 컨텐츠 (예 : 블로그 게시물)를 트위터 스레드로 전환하는 것을 자동화합니다. 수동 스레드 생성은 시간이 많이 걸립니다. 이 응용 프로그램은 프로세스를 간...

일체 포함 2025-03-11에 게시되었습니다
인공 면역계 (AIS) : 파이썬 사례가있는 안내서
이 기사는 인공 면역 체계 (AIS)를 탐구합니다.이 기사는 인간 면역 체계의 위협을 식별하고 중화시키는 놀라운 능력에서 영감을 얻은 계산 모델 인 인공 면역 체계 (AIS)를 탐구합니다. 우리는 AIS의 핵심 원칙을 탐구하고, 클론 선택, 부정적인 선택 및 면역 네...

일체 포함 2025-03-04에 게시되었습니다
ChatGPT에 자신에 대해 재미있는 질문을 해보세요
ChatGPT가 당신에 대해 무엇을 알고 있는지 궁금한 적이 있나요? 시간이 지남에 따라 제공한 정보를 어떻게 처리합니까? 나는 다양한 시나리오에서 ChatGPT 힙을 사용해 보았는데, 특정 상호 작용 후에 그것이 무엇을 말하는지 보는 것은 항상 흥미롭습니다.'...

일체 포함 2024년 11월 22일에 게시됨
신비한 GPT-2 챗봇을 사용해 볼 수 있는 방법은 다음과 같습니다.
AI 모델이나 챗봇에 관심이 있다면 신비한 GPT-2 챗봇과 그 효과에 대한 토론을 본 적이 있을 것입니다.여기서 GPT-2 챗봇이 무엇이고 어떻게 할 수 있는지 설명합니다. 액세스하세요. GPT-2 챗봇이란 무엇인가요? 2024년 4월 말, LLM 테스트 및 벤치마킹...

일체 포함 2024-11-08에 게시됨
ChatGPT의 캔버스 모드는 훌륭합니다: 이를 사용하는 4가지 방법
ChatGPT의 새로운 캔버스 모드는 세계 최고의 생성 AI 도구에서 쓰기 및 편집에 새로운 차원을 추가했습니다. 저는 ChatGPT Canvas가 출시된 이후부터 사용해 왔으며 이 새로운 AI 도구를 사용하는 몇 가지 다른 방법을 찾았습니다.✕ 광고 제거 ...

일체 포함 2024-11-08에 게시됨
ChatGPT의 맞춤형 GPT가 데이터를 노출하는 방법과 이를 안전하게 유지하는 방법
ChatGPT의 맞춤형 GPT 기능을 사용하면 누구나 생각할 수 있는 거의 모든 것에 대한 맞춤형 AI 도구를 만들 수 있습니다. 창의적, 기술적, 게임적, 맞춤형 GPT가 모든 것을 할 수 있습니다. 더 좋은 점은 맞춤 GPT 창작물을 누구와도 공유할 수 있다는 것...

일체 포함 2024-11-08에 게시됨
ChatGPT가 LinkedIn에 취업하는 데 도움이 되는 10가지 방법
2,600개의 문자를 사용할 수 있는 LinkedIn 프로필의 정보 섹션은 귀하의 배경, 기술, 열정 및 미래 목표를 자세히 설명할 수 있는 훌륭한 공간입니다. 귀하의 직업적 배경, 기술 및 포부를 간략하게 요약한 LinkedIn 약력을 확인하세요. ChatGPT에...

일체 포함 2024-11-08에 게시됨
독특한 경험을 제공하는 잘 알려지지 않은 6가지 AI 앱을 확인해 보세요
현재 대부분의 사람들은 AI 붐을 이끈 두 가지 선구적인 생성 AI 앱인 ChatGPT와 Copilot에 대해 들어본 적이 있을 것입니다.하지만 잘 알려지지 않은 수많은 AI 도구가 놀라운 결과를 제공할 수 있다는 사실을 알고 계셨습니까? 독특한 경험? 다음은 최고 중...

일체 포함 2024-11-08에 게시됨
우리가 이미 AI 정점에 도달했음을 보여주는 7가지 징후
온라인 어디를 가든 AI 사용이 최선의 선택이라고 주장하는 사이트, 서비스, 앱이 있습니다. 여러분은 어떨지 모르겠지만, 지속적인 존재감 때문에 피곤해졌습니다. 따라서 AI가 확실히 우리 일상 생활에 머무르고 있지만, 몇 가지 징후는 우리가 이미 AI 과대 광고의 정점...

일체 포함 2024-11-08에 게시됨
교사, 강사, 상사를 위한 4가지 AI 검사 ChatGPT 감지 도구
ChatGPT의 성능이 향상됨에 따라 인간이 작성한 내용과 AI가 생성한 내용을 구분하는 것이 점점 더 어려워지고 있습니다. 이로 인해 교사와 상사는 사람이 쓴 내용과 ChatGPT를 통해 생성된 내용을 식별하기가 어렵습니다. 차이점을 구분하는 데 어려움을 겪고 계...

일체 포함 2024-11-08에 게시됨
ChatGPT의 고급 음성 기능이 더 많은 사용자에게 출시됩니다
ChatGPT로 본격적인 대화를 나누고 싶었다면 이제 가능합니다. 즉, ChatGPT 사용 특권에 대한 비용을 지불하는 한입니다. 더 많은 유료 사용자가 ChatGPT와의 상호 작용을 더욱 자연스럽게 느끼도록 설계된 ChatGPT의 고급 음성 모드(AVM)에 액세스할 ...

일체 포함 2024-11-08에 게시됨