质量评分
质量评分有助于评估细胞类型注释的可靠性。CASSIA通过runCASSIA_score_batch
函数提供自动评分功能,该功能分析每个注释背后的推理和证据。
运行质量评分
基本用法
runCASSIA_score_batch( input_file = "my_annotation_full.csv", output_file = "my_annotation_scored.csv", max_workers = 4, model = "anthropic/claude-3.5-sonnet", provider = "openrouter" )
R
参数详情
-
输入/输出文件:
input_file
:完整注释结果的路径(来自runCASSIA_batch
)output_file
:保存评分结果的位置
-
处理参数:
max_workers
:并行评分线程数- 建议:如果提供商设置为anthropic,使用比注释步骤更少的工作进程以避免API限制
-
模型配置:
- 推荐模型:
anthropic/claude-3.5-sonnet
- 推荐提供商:
openrouter
- 推荐模型:
API提供商考虑因素
OpenRouter
- 优势:
- 更高的速率限制
- 容易切换模型
- 设置:
provider <- "openrouter" model <- "anthropic/claude-3.5-sonnet"
R
Anthropic直接使用
- 考虑因素:
- 新用户有使用限制
- 可能需要减少
max_workers
- 更适合小型数据集
- 设置:
provider <- "anthropic" model <- "claude-3-5-sonnet-20241022"
R
输出格式
评分输出文件包含:
- 原始注释数据
- 质量分数(0-100)
- 置信度指标
- 分数的详细推理
解读分数
- 90-100:高置信度,强有力的证据
- 76-89:良好的置信度,充分的证据
- <75:低置信度,需要通过注释增强智能体和比较智能体运行
报告生成
从您的分析生成详细报告。此步骤通常在质量评分之后进行。
评分报告包括CASSIA的所有输出,包括结构化输出、对话历史和质量分数。
从评分结果生成批量报告
runCASSIA_generate_score_report( csv_path = "my_annotation_scored.csv", output_name = "CASSIA_reports_summary" )
R
从scored_results.csv
生成单独的报告和索引页面。