质量评分

质量评分有助于评估细胞类型注释的可靠性。CASSIA通过runCASSIA_score_batch函数提供自动评分功能，该功能分析每个注释背后的推理和证据。

运行质量评分

基本用法

runCASSIA_score_batch(
    input_file = "my_annotation_full.csv",
    output_file = "my_annotation_scored.csv",
    max_workers = 4,
    model = "anthropic/claude-3.5-sonnet",
    provider = "openrouter"
)
R

参数详情

输入/输出文件：
- input_file：完整注释结果的路径（来自runCASSIA_batch）
- output_file：保存评分结果的位置
处理参数：
- max_workers：并行评分线程数
- 建议：如果提供商设置为anthropic，使用比注释步骤更少的工作进程以避免API限制
模型配置：
- 推荐模型：anthropic/claude-3.5-sonnet
- 推荐提供商：openrouter

API提供商考虑因素

OpenRouter

优势：
- 更高的速率限制
- 容易切换模型

设置：

provider <- "openrouter"
model <- "anthropic/claude-3.5-sonnet"
R

Anthropic直接使用

考虑因素：
- 新用户有使用限制
- 可能需要减少max_workers
- 更适合小型数据集

设置：

provider <- "anthropic"
model <- "claude-3-5-sonnet-20241022"
R

输出格式

评分输出文件包含：

原始注释数据
质量分数（0-100）
置信度指标
分数的详细推理

解读分数

90-100：高置信度，强有力的证据
76-89：良好的置信度，充分的证据
<75：低置信度，需要通过注释增强智能体和比较智能体运行

报告生成

从您的分析生成详细报告。此步骤通常在质量评分之后进行。

评分报告包括CASSIA的所有输出，包括结构化输出、对话历史和质量分数。

从评分结果生成批量报告

runCASSIA_generate_score_report(
  csv_path = "my_annotation_scored.csv",
  output_name = "CASSIA_reports_summary"
)
R

从scored_results.csv生成单独的报告和索引页面。