跳转到主要内容

x

Main navigation

Search

Search

LLM 评估指标

首页 ⟶
LLM 评估指标

【LLM评估】LLM 评估指标：终极 LLM 评估指南

developer.chat

27 January 2025

category

LLMOps

标签

LLM 评估指标
LLM
大模型评估
RAG
Fine-Tune

订阅 LLM 评估指标

热门内容

今日:

【AI工具】giskard - LLM和ML模型的开源评估和测试
【Android 】很棒的 Android 学习资源
【提示词】学习提示词的艺术
真棒代码LLM
快速应用开发
LLM应用程序的新兴体系结构
【github】最棒的github
【微信小程序】微信小程序开源项目库汇总
Lua开发
Julia开发
【因果算法】真棒的因果算法
JavaScript开发
Scratch开发
【千问】文生文Prompt指南
数据应用
【游戏开发】很棒的游戏开发
【ChatBI】 - Text2SQL的LLM评估
深度学习开发
【精选前端开发】前端组件库
【数据科学精选】很棒的数据科学资源

总体:

【直播源】直播源相关资源汇总
ChatGPT
【ChatGPT 】如何使用自定义知识库构建自己的自定义ChatGPT
【低代码平台】10个开源免费Airtable 的替代方案
【LangChain】使用LangChain（而非OpenAI）回答有关文档的问题
【Go语言中级开发】Golang 中 JSON 的完整指南（附示例）
【LLM】LangChain入门：构建LLM驱动的应用程序入门指南
Go开发
【前端框架】2023年最受欢迎的前端框架
【LangChain】LangChain中的流支持
【LLM架构】Dify与Ragflow的比较
【前端框架】2024年Vue与React：选择什么以及何时选择
【ChatGPT 】如何使用自己的数据创建私人ChatGPT
【LLM】LangChain的LangFlow
【Node.js】如何修复“错误：错误：0308010c:digital envelope routines::不受支持”
【LLM】LangChain自定义智能体
【Java开发】用Spring实现服务器发送事件（SSE）——快速指南
【开源情报精选】很棒的开源情报资源
Java开发
【隐私保护】Presidio简化了PII匿名化

最近浏览：

【智能体】用代码理解模型上下文协议（MCP）的最简单方法
【Android 】很棒的 Android 学习资源
【LLMOps】open-webui的介绍
真棒代码LLM
【系统架构】Booking.com的高级系统架构
【推荐引擎】WSDM-KKBox音乐推荐挑战赛
【微信小程序】微信小程序开源项目库汇总
【提示词】300多个终极DeepSeek-R1任务提示
混合现实应用
低代码平台
【JavaScript框架】2023年需要学习的顶级JavaScript框架：Blitz、SolidJS、Svelte等
【AI工具】giskard - LLM和ML模型的开源评估和测试
【编码】什么是编码及其用途？初学者指南
【YARA】很棒的YARA
【forecasting 】开源预测库和工具
Julia开发
SecOps
【Redux】很棒的Redux资源
使用Draw.io创建动态图的两个简单步骤
LMOps：用大规模ML、GPU和加速器为LLMS赋能

标签（标签）

资源精选(342) Go开发(108) Go语言(103) Go(99) LLM(93) 人工智能(84) angular(83) 大语言模型(67) 前端开发(50) LangChain(44) golang(43) 机器学习(40) Go工程师(38) Go程序员(38) 提示工程(36) ChatGTP(36) Go开发者(36) React(34) 大模型(33) 提示词(29) Go基础(29) Python(24) Vue(23) Web开发(20) 深度学习(20) Java(20) Web技术(19) 精选资源(19) Cookie(16) 智能体(16) android(16) 前端框架(13) JavaScript(13) Next.js(12) LLMOps(11) 聊天机器人(11) 安卓(11) 产品经理(10) RAG(10) typescript(10) 资料精选(10) PostgreSQL(10) mlops(10) NLP(10) 第三方Cookie(9) Redwoodjs(9) Go语言中级开发(9) 自然语言处理(9) 区块链(9) 安全(9) 全栈开发(8) OpenAI(8) Linux(8) AI(8) GraphQL(8) iOS(8) 数据科学(8) 软件架构(7) Go语言高级开发(7) AWS(7) C++(7) whisper(6) Prisma(6) 隐私保护(6) Agent(6) JSON(6) DevOps(6) 数据可视化(6) wasm(6) 计算机视觉(6) 算法(6) Rust(6) 微服务(6) MCP(5) 隐私沙盒(5) FedCM(5) 语音识别(5) Angular开发(5) 快速应用开发(5) 生成式AI(5) LLaMA(5) 低代码开发(5) Go测试(5) gorm(5) REST API(5) kafka(5) 推荐系统(5) WebAssembly(5) GameDev(5) 数据分析(5) CMS(5) CSS(5) machine-learning(5) 机器人(5) 游戏开发(5) Blockchain(5) Web安全(5) nextjs(5) Kotlin(5) 低代码平台(5) 机器学习资源(5) Go资源(5) Nodejs(5) PHP(5) Swift(5) Excel(4) RAG架构(4) devin(4) LLM Agent(4) Blitz(4) javascript框架(4) Redwood(4) GDPR(4) 生成式人工智能(4) Angular16(4) Alpaca(4) 编程语言(4) SAML(4) JWT(4) JSON处理(4) Go并发(4) 移动开发(4) 移动应用(4) security(4) 认证(4) 隐私(4) spring-boot(4) 物联网(4) 网络安全(4) API(4) Ruby(4) 信息安全(4) flutter(4) GPT-5(3) Claude Code(3) AI开发工具(3) 专家智能体(3) Chrome(3) CHIPS(3) 3PC(3) SSE(3) 人工智能软件工程师(3) copilot(3) Remix(3) Ubuntu(3) GPT4All(3) 模型评估(3) 软件开发(3) 问答系统(3) 开发工具(3) 最佳实践(3) RxJS(3) SSR(3) Node.js(3) Dolly(3) 移动应用开发(3) 低代码(3) IAM(3) Web框架(3) CORS(3) 基准测试(3) Go语言数据库开发(3) Oauth2(3) 并发(3) 主题(3) Theme(3) earth(3) nginx(3) 软件工程(3) azure(3) keycloak(3) 生产力工具(3) gpt3(3) 工作流(3) C(3) jupyter(3) 知识图谱(3) prometheus(3) GAN(3) Spring(3) 逆向工程(3) 应用安全(3) Docker(3) Django(3) Machine Learning(3) R(3) .NET(3) 大数据(3) Hacking(3) 渗透测试(3) C++资源(3) Mac(3) 微信小程序(3) Python资源(3) JHipster(3) AES(2) 加密(2) 输入验证(2) ORM(2) Fiber(2) Postgres(2) Gorilla Mux(2) Go数据库开发(2) 模块(2) 泛型(2) 指针(2) HTTP(2) PostgreSQL开发(2) Vault(2) K8s(2) Spring boot(2) R语言(2) 深度学习资源(2) discord(2) 半监督学习(2) semi-supervised-learning(2) architecture(2) 普罗米修斯(2) 嵌入模型(2) productivity(2) 编码(2) Qt(2) 前端(2) Rust语言(2) NeRF(2) 神经辐射场(2) 元宇宙(2) CPP(2) spark(2) 流处理(2) Ionic(2) 人体姿势估计(2) human-pose-estimation(2) 视频处理(2) deep-learning(2) kotlin语言(2) kotlin开发(2) burp(2) Chatbot(2) npm(2) quantum(2) OCR(2) 游戏(2) game(2) 内容管理系统(2) MySQL(2) python-books(2) pentest(2) opengl(2) IDE(2) 漏洞赏金(2) Web(2) PyTorch(2) 数据库(2) reverse-engineering(2) 数据工程(2) swift开发(2) rest(2) robotics(2) ios-animation(2) 知识蒸馏(2) 安卓开发(2) nestjs(2) solidity(2) 爬虫(2) 面试(2) 容器(2) C++精选(2) 人工智能资源(2) 备忘单(2) 编程书籍(2) angular资源(2) 速查表(2) cheatsheets(2) SecOps(2) mlops资源(2) R资源(2) DDD(2) 架构设计模式(2) 量化(2) Hacking资源(2) 强化学习(2) flask(2) 设计(2) 性能(2) Sysadmin(2) 系统管理员(2) Java资源(2) 机器学习精选(2) android资源(2) android-UI(2) Mac资源(2) iOS资源(2) Vue资源(2) flutter资源(2) JavaScript精选(2) JavaScript资源(2) Rust开发(2) deeplearning(2) RAD(2)

更多的标签

Tools

Forums
全球IT瞭望
CPO宝典
开发者开聊
架构师研究会
程序员云开发

网站备案号:京ICP备2022026098号

© 2026 AI开发者中心, All rights reserved.

↑