帮助
“大语言模型评估指南”的版本历史
查看该页面的日志
跳转到导航
跳转到搜索
过滤修订版本
展开
折叠
截止日期:
标签
过滤:
wikieditor(隐藏的标签)
可视化编辑
已被回退
手工回退
替换
反选
显示版本
差异选择:选中要对比的修订的单选按钮,然后按Enter键或下面的按钮。
说明:
(当前)
=与最后修订的差异,
(之前)
=与上个修订的差异,
小
=小编辑。
2026年1月17日 (星期六)
当前
之前
14:06
2026年1月17日 (六) 14:06
Admin
留言
贡献
12,235字节
+12,235
创建页面,内容为“大型语言模型(LLM)已以惊人的速度从研究实验室走向生产应用。开发人员正在将其应用于各种领域,从客户支持聊天机器人到代码生成工具,再到内容创作系统。然而,这种快速普及带来了一个重要问题:我们如何知道我们的LLM是否真的有效? 与传统软件不同,传统软件可以通过编写单元测试来检查确切的输出,而逻辑学习模型(LLM)是概率系统…”
标签
:
可视化编辑
导航菜单
个人工具
登录
命名空间
页面
讨论
大陆简体
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
特殊页面
工具
链入页面
相关更改
Atom
页面信息