OpenBuddy系列开源模型及观止系列领域垂直大模型简介
刘玲 2024-06-12

OpenBuddy 系列开源模型介绍

浙江大学计算机系统结构实验室(ZJU ARClab)作为项目发起者、核心贡献者，深度参与OpenBuddy模型训练和开源社区建设，并在魔搭、Hugging Face等平台上推出了OpenBuddy系列开源模型。

基于Llama 3、Mixtral 22Bx8、DeepSeek等国内外优秀开源基座，OpenBuddy在模型训练过程中，重点强化了模型跨语言能力和认知能力，包括问题解决能力和深层语言理解能力。在多个基准测试中，OpenBuddy系列模型取得了优异的性能表现，在逻辑推理、代码生成、阅读理解、双语互译、跨语言交互等方面展现出接近头部闭源模型的性能。

OpenBuddy大模型引起了业界的广泛关注。2023年10月，OpenBuddy受邀参展阿里云栖大会。团队在AI馆中设置展位，以7B、34B、70B等多种规模的模型应用作为展示案例，向公众展现了多尺寸规模、多语言、多维度的模型及其能力，为众多开发者提供参考。

OpenBuddy社区的开源工作，以及ARClab在大语言模型领域的研究成果，获得了来自工业界、学术界的广泛认可。 2024年2月26日到3月1日，在美国圣迭戈举办的网络安全领域“四大顶会”之一Network and Distributed System Security（NDSS 2024）会议上，ARClab结合社区的应用安全需求，发表论文“LMSanitator: Defending Prompt-Tuning Against Task-Agnostic Backdoors”斩获大会杰出论文奖（Distinguished Paper Award）。

观止系列领域垂直大模型

“观止”系列大模型是针对专有领域垂直应用研发的大模型，它基于和OpenBuddy相似的训练技术，并结合了实验室在大模型理论、工程上的研究积累。近期陆续推出观止·教育大模型、观止·消防大模型、观止·人社大模型等领域垂直模型系列。

其中，观止·教育大模型在具备强认知能力的基础上，对课堂交互、教师角色扮演和学科问答等领域内垂直任务进行了优化，并且通过集成语音技术、数字人技术，提供丰富的交互能力，在英语口语学习、数字人答疑、校园服务问答等方面开展了深入的应用探索。

OpenBuddy系列开源模型及观止系列领域垂直大模型简介 刘玲 2024-06-12

OpenBuddy系列开源模型及观止系列领域垂直大模型简介
刘玲 2024-06-12