OpenBuddy系列开源模型及观止系列领域垂直大模型简介

OpenBuddy 系列开源模型介绍

浙江大学计算机系统结构实验室(ZJU ARClab)作为项目发起者、核心贡献者,深度参与OpenBuddy模型训练和开源社区建设,并在魔搭、Hugging Face等平台上推出了OpenBuddy系列开源模型。

基于Llama 3Mixtral 22Bx8DeepSeek等国内外优秀开源基座,OpenBuddy在模型训练过程中,重点强化了模型跨语言能力和认知能力,包括问题解决能力和深层语言理解能力。在多个基准测试中,OpenBuddy系列模型取得了优异的性能表现,在逻辑推理、代码生成、阅读理解、双语互译、跨语言交互等方面展现出接近头部闭源模型的性能。

OpenBuddy大模型引起了业界的广泛关注。202310月,OpenBuddy受邀参展阿里云栖大会。团队在AI馆中设置展位,以7B34B70B等多种规模的模型应用作为展示案例,向公众展现了多尺寸规模、多语言、多维度的模型及其能力,为众多开发者提供参考。

OpenBuddy社区的开源工作,以及ARClab在大语言模型领域的研究成果,获得了来自工业界、学术界的广泛认可。 2024226日到31日,在美国圣迭戈举办的网络安全领域四大顶会之一Network and Distributed System SecurityNDSS 2024)会议上,ARClab结合社区的应用安全需求,发表论文“LMSanitator: Defending Prompt-Tuning Against Task-Agnostic Backdoors”斩获大会杰出论文奖(Distinguished Paper Award)。

观止系列领域垂直大模型

 “观止系列大模型是针对专有领域垂直应用研发的大模型,它基于和OpenBuddy相似的训练技术,并结合了实验室在大模型理论、工程上的研究积累。近期陆续推出观止·教育大模型、观止·消防大模型、观止·人社大模型等领域垂直模型系列。

其中,观止·教育大模型在具备强认知能力的基础上,对课堂交互、教师角色扮演和学科问答等领域内垂直任务进行了优化,并且通过集成语音技术、数字人技术,提供丰富的交互能力,在英语口语学习、数字人答疑、校园服务问答等方面开展了深入的应用探索。


<<< 返回