跳转到主要内容

标签(标签)

资源精选(342) Go开发(108) Go语言(103) Go(99) angular(82) LLM(75) 大语言模型(63) 人工智能(53) 前端开发(50) LangChain(43) golang(43) 机器学习(39) Go工程师(38) Go程序员(38) Go开发者(36) React(33) Go基础(29) Python(24) Vue(22) Web开发(20) Web技术(19) 精选资源(19) 深度学习(19) Java(18) ChatGTP(17) Cookie(16) android(16) 前端框架(13) JavaScript(13) Next.js(12) 安卓(11) 聊天机器人(10) typescript(10) 资料精选(10) NLP(10) 第三方Cookie(9) Redwoodjs(9) LLMOps(9) Go语言中级开发(9) 自然语言处理(9) PostgreSQL(9) 区块链(9) mlops(9) 安全(9) 全栈开发(8) ChatGPT(8) OpenAI(8) Linux(8) AI(8) GraphQL(8) iOS(8) 软件架构(7) Go语言高级开发(7) AWS(7) C++(7) 数据科学(7) whisper(6) Prisma(6) 隐私保护(6) RAG(6) JSON(6) DevOps(6) 数据可视化(6) wasm(6) 计算机视觉(6) 算法(6) Rust(6) 微服务(6) 隐私沙盒(5) FedCM(5) 语音识别(5) Angular开发(5) 快速应用开发(5) 提示工程(5) Agent(5) LLaMA(5) 低代码开发(5) Go测试(5) gorm(5) REST API(5) 推荐系统(5) WebAssembly(5) GameDev(5) CMS(5) CSS(5) machine-learning(5) 机器人(5) 游戏开发(5) Blockchain(5) Web安全(5) Kotlin(5) 低代码平台(5) 机器学习资源(5) Go资源(5) Nodejs(5) PHP(5) Swift(5) 智能体(4) devin(4) Blitz(4) javascript框架(4) Redwood(4) GDPR(4) 生成式人工智能(4) Angular16(4) Alpaca(4) 编程语言(4) SAML(4) JWT(4) JSON处理(4) Go并发(4) kafka(4) 移动开发(4) 移动应用(4) security(4) 隐私(4) spring-boot(4) 物联网(4) nextjs(4) 网络安全(4) API(4) Ruby(4) 信息安全(4) flutter(4) 专家智能体(3) Chrome(3) CHIPS(3) 3PC(3) SSE(3) 人工智能软件工程师(3) LLM Agent(3) Remix(3) Ubuntu(3) GPT4All(3) 软件开发(3) 问答系统(3) 开发工具(3) 最佳实践(3) RxJS(3) SSR(3) Node.js(3) Dolly(3) 移动应用开发(3) 低代码(3) IAM(3) Web框架(3) CORS(3) 基准测试(3) Go语言数据库开发(3) Oauth2(3) 并发(3) 主题(3) Theme(3) earth(3) nginx(3) 软件工程(3) azure(3) keycloak(3) 生产力工具(3) gpt3(3) 工作流(3) C(3) jupyter(3) 认证(3) prometheus(3) GAN(3) Spring(3) 逆向工程(3) 应用安全(3) Docker(3) Django(3) R(3) .NET(3) 大数据(3) Hacking(3) 渗透测试(3) C++资源(3) Mac(3) 微信小程序(3) Python资源(3) JHipster(3) 大型语言模型(2) 语言模型(2) 可穿戴设备(2) JDK(2) SQL(2) Apache(2) Hashicorp Vault(2) Spring Cloud Vault(2) Go语言Web开发(2) Go测试工程师(2) WebSocket(2) 容器化(2) AES(2) 加密(2) 输入验证(2) ORM(2) Fiber(2) Postgres(2) Gorilla Mux(2) Go数据库开发(2) 模块(2) 泛型(2) 指针(2) HTTP(2) PostgreSQL开发(2) Vault(2) K8s(2) Spring boot(2) R语言(2) 深度学习资源(2) 半监督学习(2) semi-supervised-learning(2) architecture(2) 普罗米修斯(2) 嵌入模型(2) productivity(2) 编码(2) Qt(2) 前端(2) Rust语言(2) NeRF(2) 神经辐射场(2) 元宇宙(2) CPP(2) 数据分析(2) spark(2) 流处理(2) Ionic(2) 人体姿势估计(2) human-pose-estimation(2) 视频处理(2) deep-learning(2) kotlin语言(2) kotlin开发(2) burp(2) Chatbot(2) npm(2) quantum(2) OCR(2) 游戏(2) game(2) 内容管理系统(2) MySQL(2) python-books(2) pentest(2) opengl(2) IDE(2) 漏洞赏金(2) Web(2) 知识图谱(2) PyTorch(2) 数据库(2) reverse-engineering(2) 数据工程(2) swift开发(2) rest(2) robotics(2) ios-animation(2) 知识蒸馏(2) 安卓开发(2) nestjs(2) solidity(2) 爬虫(2) 面试(2) 容器(2) C++精选(2) 人工智能资源(2) Machine Learning(2) 备忘单(2) 编程书籍(2) angular资源(2) 速查表(2) cheatsheets(2) SecOps(2) mlops资源(2) R资源(2) DDD(2) 架构设计模式(2) 量化(2) Hacking资源(2) 强化学习(2) flask(2) 设计(2) 性能(2) Sysadmin(2) 系统管理员(2) Java资源(2) 机器学习精选(2) android资源(2) android-UI(2) Mac资源(2) iOS资源(2) Vue资源(2) flutter资源(2) JavaScript精选(2) JavaScript资源(2) Rust开发(2) deeplearning(2) RAD(2)

category

什么是LLM Guard?



LLM Guard通过提供消毒、检测有害语言、防止数据泄露和抵抗即时注入攻击,确保您与LLM的交互保持安全。

安装


下载软件包,开始LLM Guard之旅:


pip install llm-guard


入门


重要提示:

  • LLM Guard是为在生产环境中轻松集成和部署而设计的。虽然它已经准备好开箱即用,但请注意,我们正在不断改进和更新存储库。
  • 基本功能需要有限数量的库。当您探索更高级的功能时,将自动安装必要的库。
  • 确保您使用的是Python 3.9或更高版本。使用:python--version进行确认。

库安装问题?考虑升级pip:python-m pip-install--upgrade pip。
示例:

攻击


本节概述了可以针对大型语言模型(LLM)发起的攻击范围,并演示LLM Guard如何针对这些威胁提供强大的保护。

NIST值得信赖和负责任的人工智能
根据NIST值得信赖和负责任的人工智能框架,对包括LLM在内的生成型人工智能系统的攻击大致可分为四类。LLM Guard旨在有效对抗每一类:

1.可用性细分


针对LLM可用性的攻击旨在扰乱其正常操作。拒绝服务(DoS)攻击等方法很常见。LLM Guard通过以下方式对抗这些:

  • TokenLimit输入

...

2.违反诚信


这些攻击往往通过注入恶意提示来破坏LLM的完整性。LLM Guard通过各种扫描仪保护完整性,包括:

  • 即时注入
  • 语言输入和输出
  • 语言相同
  • 相关性输出
  • 事实一致性输出
  • 禁止主题输入和输出
  • ...

3.隐私泄露


这些攻击试图通过从LLM中提取敏感信息来损害隐私。LLM Guard通过以下方式保护隐私:

  • 匿名输入
  • 敏感输出
  • 机密输入
  • ...
  •  

4.滥用


滥用攻击涉及使用LLM生成有害内容。LLM Guard通过以下方式缓解这些风险:

  • 偏置输出
  • 毒性输入和输出
  • 禁止竞争对手输入和输出
  • ...


LLM Guard的扫描仪套件全面解决了每一类攻击,提供了多层防御机制,以确保LLM的安全和负责任使用。

最佳实践


性能优化

 

  • 基准分析:在选择扫描仪之前,了解它们在不同实例上的性能至关重要。查看每个扫描仪的基准,以便根据您的具体要求做出明智的决定。
  • 型号大小权衡:选择更小的型号将加快处理速度,减少延迟。然而,这是以准确性为代价的。我们正在积极致力于提供具有最小精度权衡的紧凑型版本。
  • 使用ONNX Runtime进行CPU推理:ONNX Run是用于机器学习模型的高性能推理引擎。如果可能,我们建议使用ONNX Runtime为模型提供服务。
  • 调谐变压器kwargs:变压器有各种参数,可以进行调谐以优化性能。例如,low_cpu_mem_usage,它通过利用Accelerate库来帮助使用更少的内存。

阅读有关优化策略的更多信息

服务配置

 

  • 快速故障模式:在服务时启用fail_Fast模式,以确保提前退出,防止等待所有扫描仪完成,从而优化响应时间。
  • 扫描仪选择:评估不同扫描仪与您的用例的相关性。与其同步使用所有扫描仪(这可能会使系统不堪重负),不如考虑异步使用它们。这种方法增强了可观察性,有助于精确调试和性能监控。
  • 请求采样:对请求样本运行较慢的扫描程序,以减少总体延迟。当系统处于重负载下时,这种方法尤其有用。

可观察性和调试

 

  • 日志记录和度量:实现强大的日志记录和指标收集,以监控系统的性能和运行状况。
  • 持续改进
  • 反馈循环:与系统用户建立反馈循环,以了解库在现实场景中的表现,并收集改进建议。
  • 定期更新和测试:使用最新版本的llm-guard保持更新,并确保在生产设置中推出更新之前在暂存环境中进行彻底测试。