news 2026/4/16 3:46:20

导航最新的生成式 AI 公告——2024 年 7 月

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
导航最新的生成式 AI 公告——2024 年 7 月

原文:towardsdatascience.com/navigating-the-latest-genai-model-announcements-july-2024-461f227f588f?source=collection_archive---------7-----------------------#2024-07-26

关于新模型 GPT-4o mini、Llama 3.1、Mistral NeMo 12B 以及其他生成式 AI 趋势的指南

https://medium.com/@tula.masterman?source=post_page---byline--461f227f588f--------------------------------https://towardsdatascience.com/?source=post_page---byline--461f227f588f-------------------------------- Tula Masterman

·发表于 Towards Data Science ·阅读时间 7 分钟·2024 年 7 月 26 日

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/2c1a54aec97e06bbaf4652cc58890eb2.png

图片由作者使用 GPT-4o 生成,展示不同的模型

引言

自 2022 年 11 月 ChatGPT 发布以来,几乎每周都有新的模型、创新的提示方法、创新的代理框架或其他令人兴奋的生成式 AI 突破。2024 年 7 月也不例外:仅在本月,我们就见证了 Mistral Codestral Mamba、Mistral NeMo 12B、GPT-4o mini 和 Llama 3.1 等模型的发布。这些模型在推理速度、推理能力、编程能力和工具调用性能等领域带来了显著提升,使它们成为企业使用的有力选择。

在本文中,我们将介绍最近发布的模型亮点,并讨论当今生成式 AI(GenAI)领域的一些主要趋势,包括增加上下文窗口大小、以及跨语言和跨模态的性能提升。

2024 年 7 月发布模型概述

Mistral Codestral Mamba

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/9ccaedb9551dbc596082350afb2a639e.png

图像由作者基于 Mistral AI Codestral Mamba 公告的结果创建

Mistral NeMo 12B

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/bff3c9eb1e34c83135461162a628694c.png

图像由作者基于Mistral AI NeMo 公告的结果创建

Mistral Large 2

GPT-4o mini

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/c9a13e62a7becc06958538e36a815f33.png

该图由作者根据Feynmans Learning Method结果绘制

Llama 3.1

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/450cbf33dfabb38a07c3b2ce3a1466a1.png

该图由作者根据Meta Llama 3.1 公告结果绘制

生成式 AI 模型的趋势

总的来说,所有规模的模型呈现出越来越强大的趋势,拥有更长的上下文窗口、更长的令牌输出长度以及更低的价格点。推动推理、工具调用和编码能力的提升反映了对能够代表用户执行复杂操作的代理系统的需求不断增加。为了创建有效的代理系统,模型需要理解如何分解问题、如何使用可用的工具以及如何在一次处理大量信息时进行调和。

最近,OpenAI 和 Meta 的公告反映了 AI 安全讨论的日益增加,两家公司展示了应对同一挑战的不同方法。OpenAI 采取了闭源的方式,通过采纳社会心理学和虚假信息领域专家的反馈以及实施新的训练方法来提高模型的安全性。相比之下,Meta 加大了其开源计划的力度,发布了新的工具,专注于帮助开发者减轻 AI 安全问题。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/323d506da8b3ee322752fc81dd3cf6d1.png

这张图片由作者使用 GPT-4o 创建,展示了一个闭源和开源模型竞争的竞技场。

结论

未来,我认为我们将继续看到通用模型和专业模型的进展,像 GPT-4o 和 Llama 3.1 这样的前沿模型将越来越擅长于分解问题,并在跨模态执行各种任务时表现得越来越好,而像 Codestral Mamba 这样的专业模型将在其领域中表现出色,并在处理更长上下文和微妙任务时变得更加得心应手。此外,我预计我们将看到新的基准,专注于模型在单次回合内同时执行多个指令的能力,以及越来越多的 AI 系统通过结合通用模型和专业模型协作执行任务。

此外,虽然模型性能通常是根据标准基准来衡量的,但最终重要的是人类如何看待模型的表现,以及模型在多大程度上有效地推动人类目标的实现。Llama 3.1 的发布包含了一张有趣的图表,展示了人们如何对 Llama 3.1 与 GPT-4o、GPT-4 和 Claude 3.5 的回答进行评分。结果表明,Llama 3.1 在超过 50%的示例中与其他模型平局,剩余的胜率大致在 Llama 3.1 和其挑战者之间分配。这一点具有重要意义,因为它表明开源模型现在可以在一个以前由闭源模型主导的领域中轻松竞争。

想要进一步讨论或合作?请通过LinkedIn与我联系!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/12 8:12:26

效率倍增:阴阳师自动化配置全场景掌控指南

效率倍增:阴阳师自动化配置全场景掌控指南 【免费下载链接】OnmyojiAutoScript Onmyoji Auto Script | 阴阳师脚本 项目地址: https://gitcode.com/gh_mirrors/on/OnmyojiAutoScript 副标题:从新手到大神的OAS脚本效率提升攻略 一、价值定位&…

作者头像 李华
网站建设 2026/4/14 18:58:22

iOS微信红包助手技术测评

iOS微信红包助手技术测评 【免费下载链接】WeChatRedEnvelopesHelper iOS版微信抢红包插件,支持后台抢红包 项目地址: https://gitcode.com/gh_mirrors/we/WeChatRedEnvelopesHelper 功能亮点 iOS微信红包助手作为一款针对iOS平台开发的微信插件,核心价值在…

作者头像 李华
网站建设 2026/3/25 15:02:37

FreeRTOS五种内存管理算法原理与选型指南

1. FreeRTOS内存管理机制解析 FreeRTOS的内存管理是其核心子系统之一,直接关系到实时任务调度的确定性、系统资源利用率以及长期运行的稳定性。与通用操作系统不同,嵌入式实时系统对内存分配行为有严苛要求:分配时间必须可预测、线程安全必须内建、碎片化必须可控。FreeRTO…

作者头像 李华
网站建设 2026/4/12 15:31:00

FreeRTOS Tickless低功耗模式原理与STM32工程实践

1. Tickless低功耗模式的工程本质与适用边界 在嵌入式实时系统开发中,“低功耗”从来不是一个孤立的软件开关,而是一套横跨硬件架构、时钟树设计、外设管理与RTOS内核调度的系统级工程实践。FreeRTOS的Tickless模式常被初学者误读为“关闭SysTick就能省电”,这种理解不仅掩…

作者头像 李华