红帽推出新型 AI 推理服务器,助力智能化在混合云环境中的加速发展

红帽公司近期正式推出了红帽 AI 推理服务器(Red Hat AI Inference Server),这款服务器旨在为混合云环境提供更加高效和经济的 AI 推理服务。通过采用先进的 vLLM 技术,并结合 Neural Magic 的创新能力,红帽希望为用户带来更快的响应速度和更优越的性能。

image.png

红帽 AI 推理服务器是一款专为高性能设计的开放推理解决方案,配备了一系列先进的模型压缩与优化工具。它的设计理念是将 vLLM 的前沿创新与红帽的企业级能力相结合,以便为用户提供灵活的部署选项。用户可以选择将其作为独立的容器化产品使用,或者将其与红帽企业 Linux(RHEL AI)和红帽 OpenShift AI 集成。

在各种部署环境中,红帽 AI 推理服务器能够向用户提供经过加固的 vLLM 发行版。其主要功能包括智能 LLM 压缩工具,可以显著缩减基础 AI 模型与微调 AI 模型的大小,同时在保持模型准确性的前提下,尽量降低计算资源的消耗。此外,红帽还提供了一个优化的模型存储库,该存储库托管在红帽 AI 组织的 Hugging Face 中,用户可以即时访问经过验证的 AI 模型。这些模型经过优化后,能够在推理部署中提升效率,效率提升可达到2到4倍,并且不会影响模型的准确性。

红帽为用户提供了强大的企业支持,这种支持基于公司多年来在将社区项目推向生产环境方面的丰富经验。与此同时,红帽 AI 推理服务器还支持在非红帽 Linux 和 Kubernetes 平台上的灵活部署,帮助用户在选择部署环境时获得更大的选择空间。

红帽 AI 业务部门副总裁 Joe Fernandes 表示:“推理是生成式 AI 的核心价值所在,它使得模型在用户互动时能够快速给出准确的回复。我们的目标是以高效和经济的方式满足大规模的推理需求。” 红帽 AI 推理服务器的推出,将为用户提供一个通用的推理层,支持在各种环境中运行不同模型的加速。

划重点:

🚀 红帽 AI 推理服务器结合 vLLM 和 Neural Magic 技术,为混合云环境提供高效推理服务。  

📉 具备智能 LLM 压缩工具和优化模型存储库,能有效提升推理效率2-4倍。  

🛠️ 提供企业级支持与灵活部署选项,适应多种操作系统与平台。  

猜你喜欢

阴阳师手游2021年紧那罗御魂最佳搭配方案与解析
阴阳师手游2021年紧那罗御魂最佳搭配方案与解析

不少的朋友都在玩阴阳师手游,在阴阳师游戏中最大的玩法就是式神的搭配与培养,这些式神玩家需要搭配御魂,每个不同的式神搭配的

在无尽的黑夜中揭开布雷耶豪斯馅饼神秘藏身之处的奥秘
在无尽的黑夜中揭开布雷耶豪斯馅饼神秘藏身之处的奥秘

漫漫长夜探索布雷耶豪斯馅饼的隐藏地点

阴阳师手游2021鬼使白御魂搭配与使用攻略详细分析
阴阳师手游2021鬼使白御魂搭配与使用攻略详细分析

在阴阳师手游中小编最喜欢的式神是鬼使白,鬼使白是一个不错的群体输出式神,它不错的攻击力受到了不少玩家的喜爱。那么今天小编

暗黑破坏神4笼缚心脏特殊效果的触发条件与实战应用技巧全面解析
暗黑破坏神4笼缚心脏特殊效果的触发条件与实战应用技巧全面解析

暗黑破坏神4笼缚心脏特效触发条件与实战技巧

如何有效地参与和玩转抓鸭子游戏,提升你的游戏技巧及乐趣
如何有效地参与和玩转抓鸭子游戏,提升你的游戏技巧及乐趣

近期疫情期间,很多朋友在宿舍和家里玩起来了抓鸭子游戏,非常的魔性,一时间抖音抓鸭子数几只已经红遍了网络,具体的玩法内容其

妄想山海手游云端账户登录方式详解及相关操作步骤分析
妄想山海手游云端账户登录方式详解及相关操作步骤分析

在妄想山海手游中我们是可以飞起云端的,不过我们如果要登录云端的话前期要做很大的装备,也还有不少的朋友还不知道妄想山海手游

提灯与地下城大师3通关技巧与攻略分享,轻松击败敌人的方法解析
提灯与地下城大师3通关技巧与攻略分享,轻松击败敌人的方法解析

在提灯与地下城中有不少的副本,每个副本打法技巧都是不同的,大师3就是其中一个,这个关卡难度比较高,下面就一起来看看大师

如何在部落冲突狂野丛林挑战中获得三星通关攻略与技巧
如何在部落冲突狂野丛林挑战中获得三星通关攻略与技巧

在部落冲突中有很多的关卡,每个关卡的通关方法都是不同的,而且每个关卡通关方法的不同也会影响最后通关的星级,狂野丛林挑战

龙之信条2水边的蜥蜴任务触发位置详解与任务完成攻略指南
龙之信条2水边的蜥蜴任务触发位置详解与任务完成攻略指南

龙之信条2水边的蜥蜴任务触发位置与完成指南