OpenViking增加评估模块,欢迎讨论 #153
chuanbao666
started this conversation in
Performance
Replies: 2 comments 4 replies
-
|
在 openviking 接入其他 agent 如 opencode/openclaw 之后的评估手段,会在这里讨论吗 |
Beta Was this translation helpful? Give feedback.
1 reply
-
|
Beta Was this translation helpful? Give feedback.
3 replies
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Uh oh!
There was an error while loading. Please reload this page.
-
关于OpenViking性能评估,考虑增加一个eval模块
目前ov正在快速迭代,但缺少对性能(检索效果、速度)的评估方法,很难评估迭代的性能提升。参考LangChain、LlamaIndex与一些调研,打算增加一个评估模块。目前先关注检索问答效果、速度等方面。
大家有啥想法或建议,欢迎讨论~
OpenViking Eval 模块
OpenViking 的评估模块,提供 RAG 系统的多维度评估能力。
模块作用
Eval 模块支持对 RAG 系统进行全面评估:
模块设计
核心类型
评估器接口
安装方法
用法示例
示例 1:RAGAS 评估
示例 2:CLI 工具评估
示例 3:基于本仓库的评估
在 OpenViking 仓库根目录下执行:
# 评估文档检索效果 python -m openviking.eval.rag_eval \ --docs_dir ./docs \ --docs_dir ./README.md \ --question_file ./openviking/eval/datasets/local_doc_example_glm5.jsonl \ --output ./eval_results.json评估指标
相关文件
Beta Was this translation helpful? Give feedback.
All reactions