英伟达推出AI护栏服务保障大语言模型安全性

来源：网界网 | 2025-01-18 23:32:55

　　英伟达近期发布了一个全新的AI护栏服务，旨在加强大语言模型(LLM)的内容控制与安全性。该服务被命名为“NIM”，并已通过英伟达的NeMo护栏(NeMo Guardrails)套件向开发者开放。此举的主要目标是帮助开发者在构建AI系统时为其加入一系列规则，防止用户通过特定提示词绕过系统限制(即所谓的“越狱”行为)，从而避免生成不符合预期或存在安全隐患的内容。

　　NeMo护栏套件的核心技术基于英伟达的Aegis内容安全数据集，后者包含了大约3.5万个标注样本，并且已公开发布在Hugging Face平台上。这个数据集为AI模型提供了丰富的训练基础，帮助AI系统识别并阻止不当内容的生成。在大语言模型的开发过程中，尤其是在医疗、汽车和制造等行业，确保模型的安全性至关重要，英伟达的这一新服务正是针对这一需求而设计。

　　此外，英伟达还推出了一款名为Garak的工具，专门用于漏洞扫描和安全性检测。该工具能够帮助开发者识别和修复模型中潜在的安全漏洞，尤其是防止模型输出不准确的幻觉内容或泄露企业机密。随着AI技术逐步深入各个行业，尤其是在涉及敏感数据的领域，保障AI生成内容的安全性和可靠性成为了企业关注的重点。

　　英伟达强调，NeMo护栏套件不仅体积小巧，而且在性能上也有很高的效率，可以在绝大多数应用场景中流畅运行。企业在部署AI解决方案时，可以将这一安全套件直接嵌入到自家开发的AI系统中，以增强整体安全性。这项技术的应用不仅能为开发者提供更高的控制权，也有助于提升用户对AI系统的信任，避免不必要的风险和法律纠纷。

每日精选

LG将发布UltraGear OLED 950GX330A游戏显示器支持45 Hz和950 Hz双模式

　　自LG 展示UltraGear OLED 45GX950A 以来，已经过去了不到一个月，然后它又在本月早些时候在拉斯维加斯举行的 CES 2025 上展出了

2025-01-18
内置5TB SSD和4W功率输出的Thunderbolt 140扩展坞发布

　　Thunderbolt 5 在笔记本电脑领域仍然有些罕见，因为只有少数设备，例如Razer Blade 18真正支持最新标准。然而，希望购买新扩展坞的

2025-01-18
一加Open 2：泄漏揭示了世界上最薄的可折叠智能手机的设计

　　一加 Open于 2023 年作为更名后的Oppo Find N3推出。Oppo 现已确认 Find N3 的继任者将于 2 月发布。即将推出的 Oppo Fin

2025-01-18
Amazfit T-Rex 3推出新的Haze Grey颜色现有三种颜色可选

　　Amazfit T-Rex 3 最初有两种颜色可供选择，现在有第三种颜色可供选择。但是，虽然新颜色保留了发布价格，但原来的两种颜色可以以折

2025-01-18
三星Galaxy S26系列有望在充电速度方面更好地与中国旗舰产品竞争

　　国产旗舰手机在充电速度方面一直处于领先地位，最近的多款旗舰手机具有接近 100W 的快速充电额定值。另一方面，三星已经坚持使用 45

2025-01-18
十年积淀，共启未来｜维谛技术携手中联数据发布全新预制化氟泵自然冷产品

　　2025年1月10日，中联数据集团十周年庆典暨生态合作伙伴大会圆满举行。作为行业领先的云基础设施服务提供商，中联数据始终以创新为驱动

2025-01-18
小米陈波：NAS已进入到开发的尾声，外观会比较简约、优雅、高级

　　小米生态链总经理陈波在今晚的直播中透露了小米 NAS 产品的最新进展。　　陈波认为 NAS 是家庭存储的中心，小米做 NAS 会考虑到

2025-01-18
OpenAI阿尔特曼：计划几周内推出o3 mini推理模型

　　OpenAI CEO 萨姆・阿尔特曼今日在 X 上发文称，OpenAI 已完成新推理 AI 模型 o3 mini 版本，计划在几周内推出，包括 API

2025-01-18

英伟达推出AI护栏服务保障大语言模型安全性

相关阅读

每日精选

LG将发布UltraGear OLED 950GX330A游戏显示器支持45 Hz和950 Hz双模式

内置5TB SSD和4W功率输出的Thunderbolt 140扩展坞发布

一加Open 2：泄漏揭示了世界上最薄的可折叠智能手机的设计

Amazfit T-Rex 3推出新的Haze Grey颜色现有三种颜色可选

三星Galaxy S26系列有望在充电速度方面更好地与中国旗舰产品竞争

十年积淀，共启未来｜维谛技术携手中联数据发布全新预制化氟泵自然冷产品

小米陈波：NAS已进入到开发的尾声，外观会比较简约、优雅、高级

OpenAI阿尔特曼：计划几周内推出o3 mini推理模型

24小时排行

一周排行

榜单

英伟达推出AI护栏服务 保障大语言模型安全性

相关阅读

每日精选

24小时排行

一周排行

榜单

英伟达推出AI护栏服务保障大语言模型安全性