近日,红帽推出最新版本的红帽企业Linux AI(RHEL AI),这是红帽的基础模型平台,可为企业应用开发、测试和运行生成式人工智能(gen AI)模型提供更无缝的支持。
RHEL AI 1.3支持Granite 大型语言模型 (LLM) 家族的最新进展,并结合了数据准备方面的开源创新,同时继续提供针对混合云部署的多样化选择,包括底层的加速计算架构。
IDC的《Market Analysis Perspective:开放生成式人工智能、大型语言模型和不断演进的开源生态系统》指出,61%的企业计划在gen AI用例中使用开源基础模型,而超过56%的企业部署的基础模型已经开源。
红帽认为,这一趋势验证了该公司对企业gen AI的愿景,即:
更小的开源许可模型,可以根据需要在混合云的任何地方运行。
微调功能,使企业能够更轻松地根据私有数据和特定用例定制LLM。
由推理性能工程专业技术驱动的优化和更高效的人工智能模型。
强大的合作伙伴和开源生态系统支持,为客户提供更广泛的选择。
RHEL AI是红帽人工智能愿景的关键支柱,它汇集了开源许可的Granite模型系列和基于大规模对话机器人对齐(LAB)方法的InstructLab模型对齐工具。然后,这些组件被打包成优化的、可启动的红帽企业Linux镜像,用于在混合云的各种地方部署单个服务器。
RHEL AI 1.3扩展了红帽对Granite LLM的承诺,支持Granite 3.0 8b英语语言用例。Granite 3.0 8b是一个融合模型,不仅支持英语,还支持其他数种自然语言、代码生成和函数调用。非英语语言用例以及代码和函数在RHEL AI 1.3中作为开发人员预览版提供,这些功能有望在未来的RHEL AI版本中得到支持。
Docling是一个上游社区项目,近期由IBM Research开源,可帮助解析常见文档格式并将其转换为Markdown和JSON等格式,从而为gen AI应用和训练准备好这些内容。现在,RHEL AI 1.3 将这一创新作为一项受支持的功能,使用户能够将PDF转换为Markdown,从而简化数据摄取,以便使用InstructLab进行模型调整。
通过Docling,RHEL AI 1.3现在还包括上下文感知分块,它考虑到了用于gen AI训练的文档的结构和语义元素。这有助于生成的gen AI应用程序保持更好的一致性,并根据上下文对问题和任务做出适当的回应,如果不这样的话它们就需要进一步调整和对齐。
未来的RHEL AI版本将继续支持和完善Docling组件,除了 InstructLab 知识调整外,还包括其他文档格式以及检索增强生成(RAG)管道的集成。
选择是混合云中的基本元素,gen AI作为混合环境的标志性工作负载,这种可选择性需要从底层芯片架构开始。RHEL AI已经支持NVIDIA和AMD的领先加速器,1.3版本现在还以技术预览版的形式包括了Intel Gaudi 3。
除芯片架构外,RHEL AI还支持各大云提供商,包括AWS、Google Cloud和Microsoft Azure控制台,作为“自带订阅”(BYOS)产品组合。该平台还即将作为经过优化和验证的解决方案选项在Azure Marketplace和AWS Marketplace上推出。
RHEL AI 作为首选基础模型平台,可用于红帽合作伙伴提供的加速硬件产品组合,包括Dell PowerEdge R760xa服务器和Lenovo ThinkSystem SR675 V3 服务器。
由于用户希望扩展LLM的服务,红帽OpenShift AI现在支持使用vLLM运行时跨多个节点并行服务,从而提供了实时处理多个请求的能力。红帽OpenShift AI还支持用户在被服务时动态更改LLM的参数,例如将模型分片到多个GPU上,或将模型量化到更小的占用空间。这些改进旨在加快用户的响应速度,提高客户满意度,降低客户流失率。
RHEL AI和红帽OpenShift AI共同支持着红帽AI。红帽AI是红帽的解决方案组合,可加快产品面市时间并降低在混合云上交付AI解决方案的运营成本。
RHEL AI支持单个Linux服务器环境,而红帽OpenShift AI则赋能分布式Kubernetes平台环境,并提供集成的机器学习运营(MLOps)能力。这两种解决方案相互兼容,红帽OpenShift AI将整合RHEL AI 的所有功能,以实现大规模交付。
RHEL AI 1.3现已全面可用。有关附加功能、改进、错误修复以及如何升级到最新版本的更多信息