近日,山海大模型再迭新,各项性能持续增强的同时,新增实时检索功能,处理动态、实时信息更得心应手,一问一答更精准高效,极大提升了用户使用体验。
技术升级,性能全面提升
相较于上一代,山海大模型在语义理解、逻辑推理以及指令遵循性能、对齐能力性能等方面显著提升。
此次大模型升级中,云知声引入自我演进偏好学习技术,使得大模型能够通过自我对弈微调(SPIN)实现自我提升。
在基础设施方面,云知声升级自研Uniscale训练推理一体化框架,以支持千亿级模型的偏好对齐训练。这一升级使得山海能够处理更大规模的数据集,从而提高训练效率和模型性能。
在数据生成方面,云知声采用指令自我迭代算法,生成了更加复杂和多样的指令数据。为了降低高质量人工偏好数据的高昂成本,其结合了RLHF(强化学习人类反馈)和RLAIF(强化学习人工智能反馈)方法,生成大量偏好数据。同时,借鉴课程学习的思路,对偏好数据进行重排,使模型能够从简单任务逐步过渡到复杂任务,有效提升了学习效率和效果。
在算法创新方面,SPIN技术通过自我对弈机制,让LLM在迭代过程中自我生成训练数据,并通过比较自生成响应和人类标注响应来优化其策略。这种方法不仅提升了大模型性能,也充分释放了人工标注数据在监督微调(SFT)中的潜力。
新增实时检索,让答案触手可及
为进一步提升用户体验,此次升级,山海大模型引入实时检索功能,无论是最新资讯、热点事件还是专业查询,用户的每一问,都将得到更精准及时的回应。
为了实现这一流程,云知声自研Agent框架,充分释放大模型推理和交互潜力,确保了用户意图的精准理解、信息的高效获取与总结,以及生成高质量回应的可靠性。
应用先进的意图理解和高效的实时信息获取能力,山海能够在极短的时间里对用户的交互进行意图判断,并依托对自身知识库的深刻理解,精准决策对话过程中是否需要额外信息的支持。这一过程不仅避免了无效的检索,还显著提升了对话生成的速度和准确性。
当山海判断用户的交互超出了自己的认知时,能够迅速启动信息搜索机制,从互联网的海量数据中迅速定位并提取相关话题内容。通过高效的信息处理和总结,为用户提供准确、及时且详尽的答复。
目前,实时检索功能已在山海小程序同步上线,欢迎大家体验试用,让山海真正成为你工作生活中的随身智能助手。