(资料图)
编程客栈()5月6日 消息:LLaMA 等大型语言模型的成功推动了开源聊天机器人的发展,但对这些模型的许可限制限制了它们的商业用途。OpenLLaMA 为希望使用语言模型的企业提供了一种更易于访问且更具成本效益的选择.
OpenLLaMA 是 Meta 的 LLaMA 语言模型的开源复制品,可以用于商业目的。自 Meta 的 LLaMA 系列大型语言模型的揭开面纱以及随后的泄露以来,开源聊天机器人的发展已经猛增。诸如 Alpaca、Vicuna 和 OpenAssistant 的模型都以Meta的模型为基础,采用不同形式的指令调整。
然而,LLaMA 模型仅供研究使用许可,这限制了该模型的商业应用。
OpenLLaMA 复制了 Meta 的语言模型。基于其他免费提供的模型的替代方案与 Meta 模型的质量不匹配,因为 LLaMA 遵循 Deepmind 的Chinchilla缩放法则并且已经过特别大量数据的训练。
Berkeley AI Research 的研究人员希望在 OpenLLaMA 项目中复制 Meta 的 LLaMA 模型。该团队正在为该项目使用 Together 的 RedPajama 数据集。开源平台还宣布打算在4月复制 编程客栈LLaMA 模型,作为第一步发布1.2万亿参数数据集。
Together网址:https://www.together.xyz/blog/redpajama-training-progressjavascript
伯克利团队现在发布了70亿参数 OpenLLaMA 模型的早期版本,该模型迄今已在1.2万亿token中的3000亿个上进行了训练。据说性能已经接近 LLaMA 的水平,并且团队相信经过全面训练的 OpenLLaMA 将与 Meta 的原始版本竞争。
除了70亿参数模型,OpenLLaMA 团队还在训练一个30亿参数版本,以便在资源有限的用例中使用强大的语言模型。该团队目前没编程有更大模型的计划。
OpenLLaMA项目网址:https://github.com/openlm-research/open_l编程lama
上一篇:天天热推荐:福瑞股份股东户数下降9.94%,户均持股51万元
下一篇:最后一页
重庆市经信委近日印发《重庆市提振工业经济运行若干政策措施》,从稳住市场主体、提振重点产业、实施稳链工程、优化发展环境等方面推出26条
半个月吸引30家企业注册投资、多家企业完成增资、加快引进国外先进技术。6月份以来,上海外高桥保税区正加足马力,跑出招商引资加速度。6月
记者日前从工信部获悉,工信部、人力资源社会保障部、生态环境部、商务部、市场监管总局联合发布《关于推动轻工业高质量发展的指导意见》。
生态环境部近日透露,生态环境部、国家发展改革委等7部门联合印发《减污降碳协同增效实施方案》,对推动减污降碳协同增效作出系统部署。方
6月20日,中寰股份(836260)在北交所上市7个月之际,上海迎水投资等6名战投持股即将解禁。挖贝君注意到,中寰股份上市以来股价震荡下行,截
X 关闭
X 关闭