[新闻] 微软开源bitnet.cpp 1-bit推理框架| 数博会官网

微软开源bitnet.cpp 1-bit推理框架

作者: 姜芸    来源: 人民邮电报   编辑: 杨小婷  时间:2024-10-24 11:12:18  

  近日,微软宣布开源bitnet.cpp,这是一款专为大语言模型(LLM)设计的超高效1-bit推理框架,其独特之处在于能够直接在CPU上运行,无需依赖昂贵的GPU基础设施。这一创新举措为应对LLM在资源消耗、可扩展性和可持续性方面的挑战提供了全新方案。

  传统的LLM通常需要大量的GPU支持和高额的电力成本,这不仅增加了部署和维护的难度,也限制了小型企业和个人用户的可访问性。此外,巨大的能源需求还带来了可持续性方面的挑战,进一步增加了碳排放量,加剧了环境负担。

  bitnet.cpp的推出正是为了应对这些挑战。作为一款专为CPU设计的推理框架,bitnet.cpp能够在不依赖GPU的情况下,实现大型LLM模型的本地运行。通过优化核心算法,bitnet.cpp在ARM和x86CPU上均表现出色,实现了显著的加速效果。基准测试显示,在ARMCPU上,bitnet.cpp可实现1.37倍到5.07倍的加速;而在x86CPU上,加速效果更是高达2.37倍到6.17倍。同时,能源消耗也大幅降低,减少了55.4%到82.2%,为环保型AI应用提供了有力支持。

  对于注重隐私的用户而言,bitnet.cpp的推出具有重要意义。它通过实现LLM的本地运行,最大限度减少了向外部服务器发送数据的需求,从而有效保障了用户的隐私安全。此外,微软正不断推进其1-bitLLM研究和基础设施倡议,旨在促进这些模型在工业场景中的应用,为AI技术的未来发展增添新的活力。