深度文章

低GPU利用率的实证研究;可解决数学问题的数据合成新范式;大规模合成数学推理的指令微调数据;大模型改进推荐系统
欢迎阅读“科研上新”栏目!“科研上新”汇聚了微软亚洲研究院最新的创新成果与科研动态。在这里,你可以快速浏览研究院的亮点资讯,保持对前沿领域的敏锐嗅觉,同时也能找到先进实用的开源工具。
价值观罗盘:如何让大模型与人类价值观对齐?
随着人工智能技术的快速发展和能力的不断增强,大模型已经逐步应用于人们的日常生活。但这同时也带来了很多新的潜在风险,进一步凸显了大模型与人类价值观对齐问题的紧迫性。然而,人工智能应该与哪些价值观进行对齐?又该如何对齐?这些问题至今还没有明确的答案。为了解决这些挑战,微软亚洲研究院提出了价值观罗盘(Value Compass)项目,从交叉学科的角度切入,充分借鉴伦理学和社会学中的理论,以解决对价值观的定义、评测和对齐问题。本文将深度解析大模型价值观的对齐现状,并介绍微软亚洲研究院在这一领域取得的最新研究成果——基于施瓦茨人类基本价值理论的 BaseAlign 对齐算法。
LongRoPE:超越极限,将大模型上下文窗口扩展超过200万tokens
大模型的飞速发展给人们的生活带来了前所未有的便利。我们是否能够设想利用大模型的潜力,快速扫描整部百科全书、解析繁琐复杂的法律条款,甚至对文章进行精准引用呢?在未来,这些将统统可以实现。然而,目前传统的大模型的上下文窗口限制与昂贵的微调成本使得它们难以处理超长文本,从而限制了其应用潜力。为解决这一问题,微软亚洲研究院的研究员们提出了 LongRoPE。通过精细化非均匀位置插值和渐进式扩展策略,LongRoPE 成功将大模型的上下文窗口扩展至2048k,不仅保持了原始短上下文窗口的性能,还大幅提升了长文本处理的效果。LongRoPE 的应用前景广阔,将为大模型的发展带来更多可能。

实习岗位

全职岗位