> 技术文档 > 猫头虎分享:GPT-4o Mini VS GPT-3.5 Turbo 新旧对决,谁能拔得头筹?_gpt-3.5-turbo gpt-4o-mini

猫头虎分享:GPT-4o Mini VS GPT-3.5 Turbo 新旧对决,谁能拔得头筹?_gpt-3.5-turbo gpt-4o-mini


GPT-4o Mini VS GPT-3.5 Turbo 🌟 新旧对决,谁能拔得头筹?

我们正在进入廉价语言模型的新时代 🚀

阅读时间:6分钟


摘要:
尽管 GPT-4o 功能强大,但我并不经常使用它。如果我正在寻找一个用于复杂推理任务的强大语言模型,我会在 9/10 次中挑选 Claude 3.5 Sonnet。这是因为它的性能略好一些,价格也略好一些。


猫头虎是谁?

大家好,我是 猫头虎,别名猫头虎博主,擅长的技术领域包括云原生、前端、后端、运维和AI。我的博客主要分享技术教程、bug解决思路、开发工具教程、前沿科技资讯、产品评测图文、产品使用体验图文、产品优点推广文稿、产品横测对比文稿,以及线下技术沙龙活动参会体验文稿。内容涵盖云服务产品评测、AI产品横测对比、开发板性能测试和技术报告评测等。

目前,我活跃在CSDN、51CTO、腾讯云开发者社区、阿里云开发者社区、知乎、微信公众号、视频号、抖音、B站和小红书等平台,全网拥有超过30万的粉丝,统一IP名称为 猫头虎 或者 猫头虎博主。希望通过我的分享,帮助大家更好地了解和使用各类技术产品。

原创作者 ✍️

  • 博主猫头虎
    • 全网搜索关键词猫头虎
    • 作者微信号Libin9iOak
    • 作者公众号猫头虎技术团队
    • 更新日期2024年6月16日
    • 🌟 欢迎来到猫头虎的博客 — 探索技术的无限可能!

专栏链接 🔗

  • 精选专栏
    • 《面试题大全》 — 面试准备的宝典!
    • 《IDEA开发秘籍》 — 提升你的IDEA技能!
    • 《100天精通鸿蒙》 — 从Web/安卓到鸿蒙大师!
    • 《100天精通Golang(基础入门篇)》 — 踏入Go语言世界的第一步!
    • 《100天精通Go语言(精品VIP版)》 — 踏入Go语言世界的第二步!

领域矩阵 🌐

  • 猫头虎技术领域矩阵
    • 猫头虎技术矩阵
    • 新矩阵备用链接

加入猫头虎的技术圈,一起探索编程世界的无限可能! 🚀

文章目录

  • GPT-4o Mini VS GPT-3.5 Turbo 🌟 新旧对决,谁能拔得头筹?
    • 我们正在进入廉价语言模型的新时代 🚀
    • 猫头虎是谁?
    • 原创作者 ✍️
    • 专栏链接 🔗
    • 领域矩阵 🌐
    • 加入猫头虎的技术圈,一起探索编程世界的无限可能! 🚀
    • GPT-4 Mini 与 GPT-3.5 Turbo 的并排比较 🔍
      • 生成语法有效的 SQL 查询 🗃️
        • GPT-3.5 Turbo
        • GPT-4o-迷你
      • 生成语法有效的嵌套 JSON 对象 🗂️
        • GPT-3.5 Turbo
        • GPT-4o-迷你
    • 讨论 📝
    • QA 环节 ❓
      • 为什么 GPT-4o-mini 的性能比 GPT-3.5 Turbo 更好?
      • GPT-4o-mini 的价格是否真的比 GPT-3.5 Turbo 更便宜?
      • 哪些情况下仍然推荐使用 GPT-3.5 Turbo?
    • 参考资料 📚
    • 表格总结本文核心知识点 📝
    • 结论 🏁
    • 未来展望 🌟
    • 温馨提示 💡
      • 联系与版权声明 📩

猫头虎分享:GPT-4o Mini VS GPT-3.5 Turbo  新旧对决,谁能拔得头筹?_gpt-3.5-turbo gpt-4o-mini

引言:
Anthropic 正在用自己的方式击败 OpenAI。然而,今天之后,可能就不再是这样了。今天,OpenAI 发布了 GPT-4o mini。与 GPT-4 系列的其他产品不同,OpenAI 制作 GPT-4o-mini 是为了与 Claude Haiku 等较小的模型竞争。 在文章中 他们声称,它是同等规模下最好的语言模型之一,而且价格便宜 60% 以上。玩了几个小时后,我完全同意。

GPT-4 Mini 与 GPT-3.5 Turbo 的并排比较 🔍

为了看看 GPT-4 mini 是否真的比其前身更好,我将运行两个相对复杂的推理任务。

生成语法有效的 SQL 查询 🗃️

我的第一个任务是查看模型是否可以生成有效的 SQL 查询。我想做一个需要一点推理的查询,包括连接和分组。以下是输入:

本周哪些市值超过 4000 亿美元且营收超过 100 亿美元的股票成交量变化最大?

GPT-3.5 Turbo

对于 GPT-3.5 Turbo,该模型无法生成语法有效的 BigQuery 查询。

猫头虎分享:GPT-4o Mini VS GPT-3.5 Turbo  新旧对决,谁能拔得头筹?_gpt-3.5-turbo gpt-4o-mini

聊天室针对此复杂查询抛出了错误

已经有自动重试逻辑。此错误消息表明 SQL 查询在每个实例中都是错误的。到目前为止看起来不太好。

GPT-4o-迷你

我使用 GPT-4o-mini 重复了测试,几乎立即得到了以下结果:

猫头虎分享:GPT-4o Mini VS GPT-3.5 Turbo  新旧对决,谁能拔得头筹?_gpt-3.5-turbo gpt-4o-mini

聊天返回了与查询相对应的股票列表

经过人工检查,结果看起来是准确的!在这个实验中,GPT-4o 显然是赢家!

生成语法有效的嵌套 JSON 对象 🗂️

在下一个实验中,我们将看看我们能否从这份公司列表中生成语法有效的 JSON 对象。如果我们可以执行后续的其他操作(例如回溯测试),我们就会知道投资组合生成正确。

GPT-3.5 Turbo

在这次实验中,GPT-3.5 Turbo模型再次抛出了错误。

猫头虎分享:GPT-4o Mini VS GPT-3.5 Turbo  新旧对决,谁能拔得头筹?_gpt-3.5-turbo gpt-4o-mini

GPT-3.5 再次失败了

但是,查看日志后,似乎不是因为任务的复杂性而失败。模型脱离了上下文。这将在下面进一步讨论。

GPT-4o-迷你

我用 GPT-4o 重复了同样的实验。

猫头虎分享:GPT-4o Mini VS GPT-3.5 Turbo  新旧对决,谁能拔得头筹?_gpt-3.5-turbo gpt-4o-mini

GPT-4o-mini 生成了一个看似有效的投资组合

看起来成功了!该模型解释了投资组合中使用的 10 只股票,并生成了一个对象。然而,为了测试该投资组合是否真的有效,我决定进行回测。

猫头虎分享:GPT-4o Mini VS GPT-3.5 Turbo  新旧对决,谁能拔得头筹?_gpt-3.5-turbo gpt-4o-mini

GPT-4o-mini 似乎生成了一个有效的回测配置

生成回测配置也适用于 GPT-4o-mini!现在,让我们看看结果。

猫头虎分享:GPT-4o Mini VS GPT-3.5 Turbo  新旧对决,谁能拔得头筹?_gpt-3.5-turbo gpt-4o-mini

GPT-4-mini 的回测结果

我们看到 GPT-4-mini 以优异的成绩通过了测试!回测成功了,对于像这样复杂的任务,对于 GPT-3.5 来说,这相当具有挑战性。欢呼!

讨论 📝

从这些结果来看,无论价格如何,GPT-4o-mini 似乎无疑是更好的选择。出于好奇,我决定在官方 API 页面上对该模型进行并排比较。

猫头虎分享:GPT-4o Mini VS GPT-3.5 Turbo  新旧对决,谁能拔得头筹?_gpt-3.5-turbo gpt-4o-mini

猫头虎分享:GPT-4o Mini VS GPT-3.5 Turbo  新旧对决,谁能拔得头筹?_gpt-3.5-turbo gpt-4o-mini

[GPT-4o mini 与 GPT-3.5 Turbo 的比较](https://openai.com/api/pricing/)

我已经知道 GPT-4o 便宜了 60% 以上。我不知道的是上下文窗口急剧扩大,现在有 128K 上下文,和 GPT-4 一样大!这就是为什么它成功生成了投资组合,而 GPT-3.5(其上下文窗口为 16k)失败了。

结合多模式和多语言,GPT-3.5 Turbo 似乎不再具有有效的用例!而且,我坚信这一点,所以我完全从 NexusTrade 应用程序中弃用了 GPT-3.5 Turbo!

QA 环节 ❓

为什么 GPT-4o-mini 的性能比 GPT-3.5 Turbo 更好?

主要原因在于 GPT-4o-mini 的上下文窗口更大,能够处理更多的信息和更复杂的任务。此外,GPT-4o-mini 在多模式和多语言支持方面也表现更出色。

GPT-4o-mini 的价格是否真的比 GPT-3.5 Turbo 更便宜?

是的,根据官方数据,GPT-4o-mini 比 GPT-3.5 Turbo 便宜了 60% 以上。

哪些情况下仍然推荐使用 GPT-3.5 Turbo?

在需要处理较小上下文窗口的简单任务时,GPT-3.5 Turbo 仍然是一个不错的选择。

参考资料 📚

  1. OpenAI 发布 GPT-4o mini
  2. GPT-4o mini 与 GPT-3.5 Turbo 的 API 比较

表格总结本文核心知识点 📝

模型 上下文窗口 价格 多模式支持 多语言支持 性能 GPT-4o-mini 128K 便宜 60% 是 是 优秀 GPT-3.5 Turbo 16K - 否 否 中等

结论 🏁

在本文中,我对 GPT-3.5 Turbo 和 GPT-4o mini 进行了并排比较。我发现在两个相对复杂的推理任务(生成有效的 SQL 和生成有效的 JSON)中,GPT-4o mini 的表现明显更好。GPT-4o mini 也比 GPT-3.5 Turbo 便宜得多,上下文窗口也大得多。出于这些原因,它无疑是更好的模型。OpenAI 的这一进步是令人惊喜的消息!

未来展望 🌟

随着 GPT-4o mini 的发布,AI 模型的价格将继续下降,功能将不断提升。Anthropic 和 Meta 的竞争将更加激烈,未来我们可能会看到更多突破性的模型发布。

温馨提示 💡

如果对本文有任何疑问,欢迎点击下方名片,了解更多详细信息!


👉 更多信息:有任何疑问或者需要进一步探讨的内容,欢迎点击下方文末名片获取更多信息。我是猫头虎博主,期待与您的交流! 🦉💬
猫头虎分享:GPT-4o Mini VS GPT-3.5 Turbo  新旧对决,谁能拔得头筹?_gpt-3.5-turbo gpt-4o-mini

联系与版权声明 📩

  • 联系方式
    • 微信: Libin9iOak
    • 公众号: 猫头虎技术团队
  • 版权声明
    本文为原创文章,版权归作者所有。未经许可,禁止转载。更多内容请访问猫头虎的博客首页。

点击✨⬇️下方名片⬇️✨,加入猫头虎领域社群矩阵。一起探索科技的未来,共同成长。🚀

🔗 猫头虎社群 | 🔗 Go语言VIP专栏 | 🔗 GitHub 代码仓库 | 🔗 Go生态洞察专栏 ✨ 猫头虎精品博文