Endoscopy VQA

GIBench 模型榜

ENDOSCOPY VQA Q1 解剖定位 Q2 病变定位 Q3 诊断 Q4 看图说话 Q5 后续建议
ENDOSCOPY VQA Q1 ANATOMICAL Q2 LOCALIZATION Q3 DIAGNOSIS Q4 FINDINGS Q5 RECOMMENDATION
病变类型
20
食管 / 胃 / 结直肠
图像与题目
947
20类病变,Q1-Q5 评估
Likert评估主体
1
LLM 裁判
参与者数量
18
12 模型 + 6 医师
等待加载数据…
任务
排序(示意)
模型整体排名
具体加权方式请参考论文和文档。
# 模型 Q1 Macro-F1 Q2 mIoU Q3 Macro-F1
当前模型概览
尚未选择模型。
按病变 / 区域细节
选择子任务与病变,对比所有模型在对应指标下的表现。
病变选择
说明: 仅展示总体层面的人机差异,可在论文/补充材料中查看更细粒度分析。
排序(示意)
人机对比整体排名
具体加权方式请参考论文和文档。
# 参与者 Q1
解剖定位
Q2
病变定位
Q3
诊断
Q4
看图说话
Q5
后续建议
人机对比按病变 / 题型细分
选择题型与病变,横向查看参与者(医生/模型)的表现差异。
病变选择