Llama3 刚刚正式发布,全球大模型竞争加剧
阿法兔研究笔记
2024-04-19 18:21
订阅此专栏
收藏此文章
为了支持长期开放,Meta 将 Llama3 交到了社区的手中。


撰文:阿法兔


关于 Meta llama3 的参数解读



先说结论:


Llama 3 70B 在处理多种类型的复杂任务方面,相比 8B 版本有显著的提高。70B 版本的模型在所有测试中都比 8B 版本得分高,意味着它在理解语言细节、上下文和执行复杂任务(如翻译、对话生成和代码编写)方面更为出色。这强化了 Llama 3 70B 作为用于需求繁多的 AI 项目的高效解决方案的地位。


具体分析:


Llama 3 8B:


  • MMLU 5-shot: 在 5 次尝试中达到 68.4 分,这是多模型语言理解的一个测试,用于评估模型在处理复杂语言任务时的效率。
  • GPQA 0-shot: 在未经事先示例训练的情况下,达到 34.2 分,GPQA 测试模型在回答通用问题时的表现。
  • HumanEval 0-shot: 在未经事先示例训练的情况下,达到 62.2 分,评估模型解决编程问题的能力。
  • GSM-8K 8-shot, CoT: 使用 8 次尝试和连贯思考(Chain of Thought)技术达到 79.6 分,GSM-8K 测试模型解决数学问题的能力。
  • MATH 4-shot, CoT: 使用 4 次尝试和连贯思考技术达到 30.0 分,评估模型解决高级数学问题的能力。


Llama 3 70B:


  • MMLU 5-shot: 达到 82.0 分,显示出在语言理解方面有很大提升。
  • GPQA 0-shot: 达到 39.5 分,表明在未经示例训练时处理问题的能力有所提升。
  • HumanEval 0-shot: 达到 81.7 分,显示出模型在处理编程问题上的显著提升。
  • GSM-8K 8-shot, CoT: 达到 93.0 分,显著优于 8B 版本,表明在解决数学问题上的性能大幅度提升。
  • MATH 4-shot, CoT: 达到 50.4 分,这在数学问题解决方面是一个重大飞跃。


Meta Llama 3:迄今为止最强大的开放大型语言模型(LLM)


根据 meta 官网,Meta 今天推出了 Llama 3,这是 Meta 最先进的开源大型语言模型的下一代版本。Llama 3 模型将很快在 AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、Microsoft Azure、NVIDIA NIM 和 Snowflake 上可用,并得到 AMD、AWS、Dell、Intel、NVIDIA 和 Qualcomm 提供的硬件平台的支持。


Meta 致力于以负责任的方式开发 Llama 3,并提供各种资源帮助他人也能负责任地使用它。这包括推出新的信任和安全工具,如 Llama Guard 2、Code Shield 和 CyberSec Eval 2。在未来几个月,Meta 预计将引入新功能,扩大上下文窗口,增加模型大小,并提升性能,并且将分享 Llama 3 研究论文。使用 Llama 3 技术构建的 Meta AI 现在是世界领先的 AI 助手之一,可以提升你的智能,减轻你的负担——帮助你学习、完成工作、创造内容,并连接起来,充分利用每一刻。您可以在这里尝试 Meta AI。


今天,Meta 很高兴分享 Llama 的下一代模型 Meta Llama 3 的前两个模型,它们适用于广泛用途。这次发布的模型特点是预训练并进行了指令微调,拥有 8B 和 70B 的参数,可以支持广泛的用例。这一代 Llama 在各种行业基准测试中展示了最先进的性能,并提供了新功能,包括改进的推理能力。meta 相信这些是同类最好的开源模型,毫无争议。为了支持长期的开放方法,将 Llama 3 交到了社区的手中。Meta 希望启动 AI 在整个技术堆栈中的下一波创新——从应用到开发者工具,再到评估、推理优化等等。


对 Llama 3 的目标


通过 Llama 3,Meta 的目标是构建与当今市场上最好的专有模型相媲美的最好的开源模型,希望根据开发者的反馈提高 Llama 3 的整体有用性,并在继续发挥负责任使用和部署 LLM 的领导作用的同时这样做,采纳了(部分)开源精神,提倡尽早并频繁发布,以便社区在模型仍在开发中时就能访问这些模型。Meta 今天发布的基于文本的模型是 Llama 3 模型集合中的第一批,在不久的将来的目标是使 Llama 3 多语言化和多模式化,拥有更长的上下文,并继续提高在推理和编码等核心 LLM 能力方面的整体性能。


参考资料:https://ai.meta.com/blog/meta-llama-3/

【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

阿法兔研究笔记
数据请求中
查看更多

推荐专栏

数据请求中
在 App 打开