」工欲善其事,必先利其器。「—孔子《論語.錄靈公》
首頁 > 人工智慧 > 我們嘗試了 Mistral AI 的 Le Chat AI 聊天機器人,以下是它與 ChatGPT 的比較

我們嘗試了 Mistral AI 的 Le Chat AI 聊天機器人,以下是它與 ChatGPT 的比較

發佈於2024-08-22
瀏覽:144

Mistral 的 Le Chat 在人工智能聊天机器人社区中越来越受欢迎,一些观察家将其标记为 ChatGPT 的潜在竞争对手。

但是这个刚刚起步的人工智能聊天机器人真的值得这个称号吗? Mistral 的 Le Chat 比 ChatGPT 更好吗?

Mistral AI 的 Le Chat 是什么?

Le Chat 是由法国人工智能初创公司 Mistral AI 开发的对话式人工智能聊天机器人。它由 Mistral 拥有的多种大型语言模型提供支持,包括 Mistral Large、Mistral Small 和 Mistral Next,您在与 AI 聊天机器人交互时可以选择使用所有这些模型。尽管它是人工智能聊天机器人领域的一个相对较新的进入者,但由于其人工智能模型的性能,尽管与 Gemini 和 GPT-4 等行业重量级产品相比尺寸较小,但它仍获得了很高的评价。

要理解这意味着什么,想象一下您正在玩积木。您拥有的块越多,您可以构建的结构就越复杂和详细,对吗?人工智能语言模型有点类似。它们有大小,通常以参数计数表示。因此,您可能在 AI 模型中听说过“7B 参数”或“70B 参数”等术语。参数计数就像模型必须理解和生成响应的构建块的数量。因此,如果语言模型具有更多参数,它就可以理解并生成更复杂、更好的响应。

现在,GPT-4 估计有 1.76 万亿个参数,而 Mistral AI 估计有 7 到 560 亿个参数。看到尺寸差异了吗?因此,Mistral AI 能够提供不错的性能是其大肆宣传的原因之一。

尽管 Le Chat 不具备 ChatGPT 的宣传水平,也没有 Gemini 等公司的品牌资产,但每当讨论潜在的 ChatGPT 竞赛时,它就会进入话题。但它值得在桌面上占有一席之地吗?

我一直在想同样的问题,为了找到答案,我广泛测试了 Le Chat,看看它与 ChatGPT 相比如何。

Le Chat 与 ChatGPT:创造力

创造力是判断对话式 AI 聊天机器人性能的最重要指标之一。请记住,人工智能聊天机器人的目的是大规模复制或模仿人类的对话能力和创造力。这使得创造力对于任何人工智能聊天机器人来说都是一个非常重要的优势。全世界已经对 ChatGPT 进行了一年多的试验,其创造能力是不可否认的。但 Le Chat 相比如何呢?我们对这两个聊天机器人进行了一系列创造力测试。

我首先问两个聊天机器人,“你会如何向艺术家描述自己?”测试他们使用创造性和富有想象力的词语来概念化自己的能力。

以下是 ChatGPT 向艺术家描述自己的方式:

We Tried Mistral AI\'s Le Chat AI Chatbot, and Here\'s How It Compares to ChatGPT

Le Chat 也将这样描述自己:

We Tried Mistral AI\'s Le Chat AI Chatbot, and Here\'s How It Compares to ChatGPT

两种回答都适合他们自己独特的方式。 ChatGPT更注重用生动的图像和隐喻来描述自己,展现创意天赋。另一方面,Le Chat 的回应信息非常丰富,并且重点描述了其作为人工智能聊天机器人的本质。有些人可能会说它缺乏 ChatGPT 的回应所展现的创意天赋和艺术风格。然而,我会大胆地说,相对于 ChatGPT 的抽象描述,我更喜欢 Le Chat 更容易想象的回应。

然后我要求 ChatGPT 和 Le Chat 写一首关于通过种植黄瓜致富的说唱歌曲——这是一个棘手的请求,我们用它来测试其他聊天机器人的创造力。您在网上能找到多少首关于黄瓜的说唱歌曲?

这是 ChatGPT 的回复:

We Tried Mistral AI\'s Le Chat AI Chatbot, and Here\'s How It Compares to ChatGPT

这是 Le Chat 的回复:

We Tried Mistral AI\'s Le Chat AI Chatbot, and Here\'s How It Compares to ChatGPT

这可能是一个主观问题,但 ChatGPT 的回复似乎是更好的选择。 Le Chat 的歌词看起来很冗长,读起来不像说唱歌手会写出来的东西。为了测试这两个歌词如果被制作成音乐的话听起来如何,我们使用Suno AI音乐生成器从歌词生成音乐。三分之三的试验中,ChatGPT 的歌词听起来好多了。以下是两个人工智能聊天机器人的两个示例,您可以判断哪个聊天机器人做得更好。

从 ChatGPT 的歌词生成的样本

样本 1:

样本 2:

从 Mistral Le Chat 的歌词生成的样本

样本 1 :

示例 2:

我尝试了一些其他创造性任务,例如诗歌、文章写作以及使用 AI 聊天机器人起草棘手的工作电子邮件。尽管表现出了巨大的潜力,但 Le Chat 在所有情况下都明显被 ChatGPT 超越。需要指出的是,Le Chat 特别擅长的一个领域是撰写文章,尽管有一些棘手的提示风格。然而,就全面创造力而言,奖牌属于ChatGPT。

Le Chat 与 ChatGPT:编程技能

熟练的编码能力已成为主要 AI 聊天机器人的关键要求。编写像样的代码是一项基本技能,但要真正在精英中脱颖而出,人工智能聊天机器人必须展示其编写能够有效解决各种复杂问题的代码的能力。我们之前使用 ChatGPT 从头开始​​构建了一个完整的 Web 应用程序,这展示了其作为编程工具的卓越能力。但 Le Chat 编写代码的水平如何?

我要求两个聊天机器人使用 CSS、HTML 和 JavaScript 编写一个简单的待办事项列表应用程序。 ChatGPT 在产生良好结果方面没有遇到任何困难。我复制了生成的代码并在浏览器上预览它,这就是 ChatGPT 创建的内容:

We Tried Mistral AI\'s Le Chat AI Chatbot, and Here\'s How It Compares to ChatGPT

每次我们重复提示时,ChatGPT 都会使用不同的样式创建一个实用的待办事项列表应用程序。生成的代码在任何情况下都不会失败。

当我在 Le Chat 上尝试相同的提示时,它生成了看似可理解的代码,但当我们尝试在浏览器上运行它时,它不起作用。重复提示3次后,没有实例生成可以完成设定任务的代码。它未能完成最基本的编码任务之一——危险信号!

当然,我不会因为一次失败的测试而评判 Le Chat。接下来,我要求两个聊天机器人生成用于加密和解密文本的 JavaScript 和 PHP 代码。在第二次测试中,ChatGPT 和 Le Chat 都生成了可以执行设定任务的功能代码。然而,Le Chat 的版本看起来像是一个没有经验的入门级程序员会写的东西。另一方面,ChatGPT 的代码更完整,看起来像是由经验丰富的程序员编写的。

我又重复了一些涉及查找和修复错误的编程测试,ChatGPT 的表现始终优于 Le Chat。在某些情况下,Le Chat 甚至不知道自己应该做什么。 Le Chat 在某些领域很有可能达到 ChatGPT 的水平,但编码技能似乎不是其中之一。

Le Chat 与 ChatGPT:常识和逻辑推理

AI 聊天机器人的一个有趣的变化是它们能够轻松解决复杂的任务,但无法完成需要基本常识才能完成的简单任务。许多聊天机器人,无论是像 ChatGPT 这样的老牌聊天机器人,还是像 Le Chat 这样的新进入者,在解决需要人类常识和逻辑推理的任务时都遇到了困难。那么,Le Chat 和 ChatGPT 在这方面相比如何呢?

我问两个聊天机器人:“如果你有一个 3 升的瓶子和一个 5 升的瓶子。如何使用 3 升和 5 升的瓶子测量 4 升的水?”

ChatGPT 巧妙地解决了问题:

We Tried Mistral AI\'s Le Chat AI Chatbot, and Here\'s How It Compares to ChatGPT

Le Chat 尝试了相同的任务,并且能够解决问题,尽管使用了不同的方法。

We Tried Mistral AI\'s Le Chat AI Chatbot, and Here\'s How It Compares to ChatGPT

两个聊天机器人在此测试中的表现相当。

接下来,我们向两个聊天机器人提出了一个棘手的问题:“如果一艘来自火星的宇宙飞船分成两部分,一部分坠入巴西附近的大西洋,另一部分坠入日本附近的太平洋,你会在哪里?埋葬幸存者吗?”

ChatGPT识破了骗局,做出了回应:

We Tried Mistral AI\'s Le Chat AI Chatbot, and Here\'s How It Compares to ChatGPT

Le Chat也识破了骗局,做出了回应:

We Tried Mistral AI\'s Le Chat AI Chatbot, and Here\'s How It Compares to ChatGPT

I尝试了更多的刁钻题,看来ChatGPT和Le Chat都非常擅长处理常识性和逻辑推理提示。然而,对于更复杂的逻辑问题,只有 ChatGPT 可以提供正确的答案。

虽然 Le Chat 作为潜在的“ChatGPT 杀手”引起了一些关注,但我们的测试表明,在真正与 AI 聊天机器人世界的重量级人物正面交锋之前,它还有很多工作要做。尽管 Le Chat 在常识推理等领域表现出了令人印象深刻的能力,但其创意输出和编码技能明显落后于 ChatGPT。这家法国人工智能新贵无疑展现出了希望,但炒作机器可能有点言过其实了。

与之前的许多雄心勃勃的竞争者一样,Le Chat 需要不断完善和训练,才能为大联盟做好准备。目前,像 ChatGPT 这样的人工智能聊天机器人显然仍然是人工智能聊天机器人世界无可争议的王者。但竞争者的领域只会变得越来越拥挤,因此领导者不能满足于现状。

版本聲明 本文轉載於:https://www.makeuseof.com/mistral-ai-le-chat-vs-chatgpt/如有侵犯,請聯絡[email protected]刪除
最新教學 更多>
  • 我已經放棄 ChatGPT,轉而選擇這個優越的替代方案:3 個原因
    我已經放棄 ChatGPT,轉而選擇這個優越的替代方案:3 個原因
    讓我們切入正題:我已經從 ChatGPT 切換到 Claude。這並不是說 ChatGPT 不好,而是這樣。但就我的需求而言,克勞德有一些優勢,對我的日常生活產生了真正的影響。 以下是我做出轉變的三個關鍵原因... 1 克勞德實際上明白我在說什麼 我不是完全的人工智慧新手,但我也沒有在業餘時...
    人工智慧 發佈於2024-11-02
  • 如何使用 OpenAI 的 ChatGPT
    如何使用 OpenAI 的 ChatGPT
    除了能够撰写工作电子邮件之外,ChatGPT 还可以为您的演示提供反馈,建议周末旅行的行程,或者在您精力耗尽时集思广益新想法。使用 ChatGPT,您输入请求并按 Enter 键,几秒钟内就会看到响应出现在您面前。 想了解如何使用 ChatGPT?我们已经为您提供了保障。 什么是 ChatGP...
    人工智慧 發佈於2024-11-02
  • GPT-4o 將 GPT-4 帶給每個人,這就是它的工作原理
    GPT-4o 將 GPT-4 帶給每個人,這就是它的工作原理
    那麼,什麼是 GPT-4o? 什麼是 GPT-4o? GPT-4o 是 ChatGPT 開發商 OpenAI 的最新 AI 模型,於 2024 年 5 月初的「春季更新」活動中發布。它將與之前表現最好的模型 GPT-4 Turbo 共存,至少目前如此,並為該工具帶來大量更新。 與其前身不同,...
    人工智慧 發佈於2024-11-02
  • 微軟收購暴雪,探索人工智慧藝術和翻譯 [Podcast]
    微軟收購暴雪,探索人工智慧藝術和翻譯 [Podcast]
    本週的播客回答了這些問題,並仔細考慮了英國政府批准微軟收購動視暴雪的影響。 您可以在 Apple 播客、Spotify、Google 播客、Amazon Music 和 Audible、Player FM 上訂閱真正有用的播客,或將 RSS 來源複製到您的播客播放器中。 Shownotes ...
    人工智慧 發佈於2024-11-01
  • 超越法學碩士:這就是為什麼小語言模型是人工智慧的未來
    超越法學碩士:這就是為什麼小語言模型是人工智慧的未來
    大型语言模型 (LLM) 随着 Open AI 的 ChatGPT 的发布而出现。从那时起,一些公司也推出了他们的法学硕士,但更多的公司现在倾向于小语言模型(SLM)。SLM 正在获得动力,但它们是什么,与法学硕士有何不同? 什么是小语言模型? 小语言模型(SLM)是一种参数较少的人工智能模型(将其...
    人工智慧 發佈於2024-11-01
  • 5 個最佳開源 AI 影像產生器
    5 個最佳開源 AI 影像產生器
    互联网上有数十个免费和开源的人工智能文本到图像生成器,专门用于特定类型的图像。因此,我们筛选了一堆,找到了您现在可以尝试的最佳开源人工智能文本到图像生成器。 1 Craiyon Craiyon 是最容易访问的开源 AI 图像生成器之一。它基于 DALL-E Mini,虽然您可以克隆 Githu...
    人工智慧 發佈於2024-09-02
  • OpenAI 推出自訂 GPT 商店:如何立即存取和使用它
    OpenAI 推出自訂 GPT 商店:如何立即存取和使用它
    OpenAI 終於推出了備受期待的 GPT 商店,為用戶提供一系列由 ChatGPT 社群創建的自訂 GPT,其中包含從寫作和設計到程式設計和生產力的專業聊天機器人。此次發布標誌著 OpenAI 的最新舉措,旨在利用其 AI 創造 ChatGPT 的巨大人氣,ChatGPT 自 2022 年 11...
    人工智慧 發佈於2024-09-02
  • Claude 3 是什麼以及您可以用它做什麼?
    Claude 3 是什麼以及您可以用它做什麼?
    Anthropic 宣布发布 Claude 3——一系列有可能颠覆 GPT-4 的人工智能模型。它具有出色的潜力,但它准备好夺得 ChatGPT 的桂冠了吗? 克劳德 3 是什么? Claude 3 是 Anthropic 开发的三个多模态 AI 模型系列,用于取代其 Claude 2 系列 ...
    人工智慧 發佈於2024-09-01
  • ChatGPT 剛剛新增了一系列新功能:以下是您會關心的功能
    ChatGPT 剛剛新增了一系列新功能:以下是您會關心的功能
    OpenAI 於 2024 年 5 月初進行的 ChatGPT 更新規模龐大,為世界領先的生成式 AI 聊天機器人帶來了大量新功能。大多數改進都集中在增強用戶互動、新功能和提高整體效能上,並且有很多理由讓您應該嘗試一下。 影像輸入與輸出功能 ChatGPT 現在能夠將影像作為輸入並產生影像作為...
    人工智慧 發佈於2024-09-01
  • 用過LLM嗎? LAM 是下一個,但他們需要工作
    用過LLM嗎? LAM 是下一個,但他們需要工作
    生成式人工智慧聊天機器人的興起使「大語言模型」這個術語變得流行,這是在幕後工作的底層人工智慧技術。大型語言模型 (LLM) 根據一組預測的語言產生輸出,以響應用戶輸入,這使得人工智慧看起來好像能夠獨立思考。 但法學碩士並不是城裡唯一的大型模特兒;大型動作模型(LAM)可能是人工智慧領域的下一個重...
    人工智慧 發佈於2024-08-31
  • 使用 ChatGPT 自訂指令的 5 種最佳方法
    使用 ChatGPT 自訂指令的 5 種最佳方法
    ChatGPT 传统上在个性化和内存一致性方面遇到困难。为了解决这个问题,OpenAI 为每个用户引入了免费或付费的自定义指令。 任何人都可以使用 ChatGPT 的自定义指令功能来个性化他们从 ChatGPT 获得的响应,同时确保在所有聊天会话中使用这些指令,并且您可以通过几种不同的方式使用它...
    人工智慧 發佈於2024-08-31
  • ChatGPT 的最新更新可讓您建立完全自訂的 GPT 模型
    ChatGPT 的最新更新可讓您建立完全自訂的 GPT 模型
    OpenAI 的旗艦人工智慧產品 ChatGPT 已經獲得了具有一系列新功能的改變遊戲規則的更新。隨著多項關鍵更新的同時推出,OpenAI 真正寵壞了 ChatGPT 用戶,尤其是 ChatGPT Plus 訂閱者。 有很多內容需要了解,我們不想讓您錯過 — 因此我們探索了最新的 ChatGPT...
    人工智慧 發佈於2024-08-29
  • 為什麼您不應該信任 ChatGPT 來總結您的文本
    為什麼您不應該信任 ChatGPT 來總結您的文本
    ChatGPT 的了解是有限的。它的程式設計迫使它提供你所要求的東西,即使結果是錯誤的。這意味著 ChatGPT 會犯錯,而且它也會犯一些常見的錯誤,尤其是當它在總結資訊而你不注意時。 ChatGPT 可能會忽略或誤解您的提示 如果您向聊天機器人提供大量資料進行排序,即使是複雜的提示,它也可能會...
    人工智慧 發佈於2024-08-29
  • Copilot 與 Copilot Pro:有什麼區別,您應該升級嗎?
    Copilot 與 Copilot Pro:有什麼區別,您應該升級嗎?
    Microsoft Copilot 一直是想要使用 OpenAI 的 ChatGPT Plus 而無需每月付費的人的天堂。 您會很高興聽到這種情況不會很快發生變化,但Microsoft 正在推出Copilot Pro,這是其免費AI 伴侶的新訂閱模型,具有新功能、自訂GPT 支援、並更深入地整合...
    人工智慧 發佈於2024-08-28
  • 如何在 Android 上使用 ChatGPT 小工具
    如何在 Android 上使用 ChatGPT 小工具
    在繼續之前,您需要更新 ChatGPT Android 應用程式 - 如果您使用的是 1.2024.052 之前的任何版本,則無法建立這個方便的主螢幕小工具。目前,ChatGPT 小工具只有一種變體:4x2 選項。 若要新增小部件,請按照以下步驟操作,但請注意,不同裝置的步驟可能略有不同: 解...
    人工智慧 發佈於2024-08-28

免責聲明: 提供的所有資源部分來自互聯網,如果有侵犯您的版權或其他權益,請說明詳細緣由並提供版權或權益證明然後發到郵箱:[email protected] 我們會在第一時間內為您處理。

Copyright© 2022 湘ICP备2022001581号-3