Meta 添加了两个新的 语言模型 到他的系列: 羊驼 3 8B e 羊驼 3 70B。这些有望在人工智能领域实现卓越的性能。最引人注目的新闻?分别存在 8 亿和 70 亿个参数。这些数字代表模型处理和处理的复杂性和能力 过程 信息.
Llama 3 不仅仅是两个模型:更多材料正在开发中
Meta 并不止于此;计划 推出 Llama 3 系列更多型号,但没有指定日期。这一战略引发了人们的期待,也表明了公司不断改进其产品的承诺。
I 新骆驼模型 它们被描述为较之前型号的飞跃。这种改进部分归因于使用 两个自定义 GPU 集群,每个都有 24.000 个单元,这使得模型可以更有效、更准确地训练。 Meta 声称,由于它们拥有的参数数量,这些模型是 其中最好的 今天的生成人工智能。
Llama 3 的性能是通过各种 AI 基准测试来衡量的,这些基准测试是用于评估 AI 模型功能的标准化测试。这些包括 百万美元 对于知识, ARC 为了获得技能,e 下降 用于推理文本块。尽管对这些基准的有用性存在不同意见,但它们仍然是评估和比较人工智能模型功能的常用方法。
特别是,Llama 3 8B 的性能优于参数较少的类似开源模型,例如 Mistral 和 谷歌杰玛, 在至少九个不同的基准中。这包括对生物学、物理、化学、甚至代码生成和数学问题等领域的常识、推理和特定技能的测试。例如,GPT-4 就不能做得很好。
最大的型号 Llama 3 70B 不仅具有竞争力,而且在某些方面甚至超越了旗舰型号,例如 来自 Google 的 Gemini 1.5 Pro 在各种测试中,表明尽管竞争激烈,但它甚至可以经得起行业巨头的考验。然而,值得注意的是,虽然它的性能优于一些旗舰机型,例如 人类的克劳德第三十四行诗 在多次测试中,它都没有达到更先进的Claude 3 Opus模型的性能。