Endoscopy VQA

GIBench 模型榜

Q1 解剖定位 Q2 病变定位 Q3 诊断 Q4 看图说话 Q5 后续建议
Q1 ANATOMICAL Q2 LOCALIZATION Q3 DIAGNOSIS Q4 FINDINGS Q5 RECOMMENDATION
病变类型
20
食管 / 胃 / 结直肠
图像与题目
947
20类病变,Q1-Q5 评估
Likert评估主体
1
LLM 裁判
参与者数量
21
15 模型 + 6 医师
等待加载数据…
任务
模型整体排名
具体加权方式请参考论文和文档。
# 模型 Q1 Macro-F1 Q2 mIoU Q3 Macro-F1
当前模型概览
尚未选择模型。
按病变 / 区域细节
选择子任务与病变,对比所有模型在对应指标下的表现。
病变选择
说明: 仅展示总体层面的人机差异,可在论文/补充材料中查看更细粒度分析。
人机对比整体排名
具体加权方式请参考论文和文档。
# 参与者 Q1
解剖定位
Q2
病变定位
Q3
诊断
Q4
看图说话
Q5
后续建议
人机对比按病变 / 题型细分
选择题型与病变,横向查看参与者(医生/模型)的表现差异。
病变选择