质量评分

质量评分有助于评估细胞类型注释的可靠性。CASSIA通过runCASSIA_score_batch函数提供自动评分功能,该功能分析每个注释背后的推理和证据。

运行质量评分

基本用法

runCASSIA_score_batch(
    input_file = "my_annotation_full.csv",
    output_file = "my_annotation_scored.csv",
    max_workers = 4,
    model = "anthropic/claude-3.5-sonnet",
    provider = "openrouter"
)
R

参数详情

  • 输入/输出文件

    • input_file:完整注释结果的路径(来自runCASSIA_batch
    • output_file:保存评分结果的位置
  • 处理参数

    • max_workers:并行评分线程数
    • 建议:如果提供商设置为anthropic,使用比注释步骤更少的工作进程以避免API限制
  • 模型配置

    • 推荐模型:anthropic/claude-3.5-sonnet
    • 推荐提供商:openrouter

API提供商考虑因素

OpenRouter

  • 优势
    • 更高的速率限制
    • 容易切换模型
  • 设置
    provider <- "openrouter"
    model <- "anthropic/claude-3.5-sonnet"
    
    R

Anthropic直接使用

  • 考虑因素
    • 新用户有使用限制
    • 可能需要减少max_workers
    • 更适合小型数据集
  • 设置
    provider <- "anthropic"
    model <- "claude-3-5-sonnet-20241022"
    
    R

输出格式

评分输出文件包含:

  • 原始注释数据
  • 质量分数(0-100)
  • 置信度指标
  • 分数的详细推理

解读分数

  • 90-100:高置信度,强有力的证据
  • 76-89:良好的置信度,充分的证据
  • <75:低置信度,需要通过注释增强智能体和比较智能体运行

报告生成

从您的分析生成详细报告。此步骤通常在质量评分之后进行。

评分报告包括CASSIA的所有输出,包括结构化输出、对话历史和质量分数。

从评分结果生成批量报告

runCASSIA_generate_score_report(
  csv_path = "my_annotation_scored.csv",
  output_name = "CASSIA_reports_summary"
)
R

scored_results.csv生成单独的报告和索引页面。