您所在的位置:首页 - 科普 - 正文科普
超过!聊天机器人登上《自然》,肿瘤识别率接近%
竣日 07-09 【科普】 811人已围观
摘要当前,癌症已经成为全球人口死亡的主要原因之一,每年有数百万人死于癌症。世界卫生组织曾提出,三分之一的癌症可以通过早发现、早治疗得以治愈。然而,超过!聊天机器人登上《自然》,肿瘤识别率接近%癌症检查一直是医疗领域面临的一大难题,尤其在病理学分析中,精确识别和诊断肿瘤对于患者的治疗至关重要,但传统的病理检查在很大程度上依赖于专家的经验和专业知识。随着GPT-4等大模型的发展,利用人工智能(AI)辅助病理诊断的研究逐渐兴起,但许多AI系统在实际应用中仍然存在性能不足和交互性差的问题。近日,来自来自哈佛
当前,癌症已经成为全球人口死亡的主要原因之一,每年有数百万人死于癌症。世界卫生组织曾提出,三分之一的癌症可以通过早发现、早治疗得以治愈。
然而,超过!聊天机器人登上《自然》,肿瘤识别率接近%癌症检查一直是医疗领域面临的一大难题,尤其在病理学分析中,精确识别和诊断肿瘤对于患者的治疗至关重要,但传统的病理检查在很大程度上依赖于专家的经验和专业知识。
随着GPT-4等大模型的发展,利用人工智能(AI)辅助病理诊断的研究逐渐兴起,但许多AI系统在实际应用中仍然存在性能不足和交互性差的问题。
近日,来自来自哈佛医学院的研究团队及其合作者开发了一个用于人类病理学的视觉语言通用AI助手——PathChat。该系统能够在近90%的情况下从活检切片中正确识别疾病,其表现优于GPT-4V等目前市面上的通用AI模型和专业医疗模型。
相关研究论文以“AMultimodalGenerativeAICopilotforHumanPathology”为题,已发表在科学期刊Nature上。
值得注意的是,这一突破性技术不仅能够识别肿瘤,还能与用户进行互动交流,为病理学的诊断和研究提供了新的工具和视角。
PathChat:多模态病理检测AI助手
多年来,计算病理学在病理形态数据分析、分子检测数据分析等领域取得了长足进步,这一由病理学与AI、计算机视觉等技术交叉形成的细分研究领域正逐渐成为医学图像分析领域的研究热点。
计算病理学是利用图像处理与AI技术构建AI计算病理模型,获取组织病理学图像,并对组织病理学图像形态外观进行初步评估,以实现通过自动图像分析技术辅助诊断、定量评估及决策。
目前,随着以ChatGPT为代表的生成式AI技术爆炸式增长,多模态大语言模型(MLLM)越来越多地应用于计算病理学研究和病理学临床实践中。但在专业度较高的解剖病理学子领域,针对病理学构建通用、多模态AI助手的研究仍处于初级阶段。
在这项工作中,研究团队设计了一款专门用于人类病理学研究的多模态生成式AI助手——PathChat。他们通过自我监督学习对来自100万多张切片的1亿多个细胞组织图像片段进行预训练,并与一种SOTA纯视觉编码器UNI相结合,生成一个能对视觉和自然语言输入进行推理的MLLM,在对45万多条指令数据集进行微调后,构建出了PathChat。
图|指令微调数据集和PathChat构建。(来源:该论文)
研究发现,PathChat不仅能够处理多模态输入,还可以对病理学相关的复杂询问做出准确的回答,在近90%的情况下都能从活检切片中正确识别疾病。
超越GPT-4V,准确率近90%
为测试PathChat的检测性能,研究团队将PathChat与开源模型LLaVA、专为生物医学领域定制的LLaVA-Med及GPT-4V进行了比较。
他们设计PathQABench对比实验,通过分析来自不同器官部位和实践的病理病例,对比了PathChat与LLaVA、LLaVA-Med、GPT4V的检测性能。
图|PathChat的多项选择评估。(来源:该论文)
结果显示,在不提供临床背景的情况下,PathChat的诊断准确率明显优于LLaVA1.5和LLaVA-Med,在只评估图像的情况下,PathChat在全部组合基准上的准确率为78.1%,比LLaVA1.5的准确率高52.4%,比LLaVA-Med的准确率高63.8%。
在提供临床背景后,PathChat的准确率进一步提高到89.5%,比LLaVA1.5的准确率高39.0%,比LLaVA-Med的准确率高60.9%。
通过对比实验发现,PathChat可以从图像的视觉特征中获得大量的预测能力,而不仅仅依赖于临床背景,它只需要通过普通自然语言提供的非视觉信息,就能有效、灵活地利用多模态信息准确地诊断组织学图像。
为了客观地评价每个模型对开放式问题回答的准确性,研究团队招募了7位病理学家,组成评估小组,通过对比4个模型对260个开放式问题的回答,分析模型检测的准确度。
图|七位病理学家组成的小组对PathChat和读者研究进行的公开回应评估。(来源:该论文)
最后,在七位专家能够达成共识的开放式问题上,PathChat的总体准确率为78.7%,比GPT-4V、LLaVA1.5和LLaVA-Med分别高出26.4%、48.9和48.1%。总的来说,与其他三个模型相比,PathChat都表现出了更优的性能。
研究人员表示,PathChat可以分析和描述病理组织图像中微妙的形态细节,而且除了图片输入以外,还能回答需要病理学和一般生物医学背景知识的问题,有望成为病理学家和研究人员的重要辅助工具。
尽管PathChat在实验中表现出色,但其在实际应用中仍面临一些挑战。例如,如何确保模型能够识别无效查询并避免错误输出,如何保持与最新医学知识的同步更新等。此外,PathChat的训练数据主要来自历史数据,这可能导致其反映的是“过去的科学共识”而非最新信息。
研究人员表示,未来的研究可能会进一步增强PathChat的功能,包括支持整个千兆像素WSI或多个WSI输入,以及集成更多特定任务的支持,如精确计数或定位对象。此外,将PathChat与数字幻灯片查看器或电子病历等工具集成,或许也将更有利于提高其在临床实践中的实用性。
日前,多模态生成人工智能模型PathChat2发布,其可对病理图像和文本进行推理,在交互式幻灯片查看器中接受多个高分辨率图像和文本的交替输入,从而对每个咨询案例进行更全面的评估。
与PathChat1相比,它在鉴别诊断和形态描述方面的性能有了大幅提高,在指令跟踪和执行开放式问题解答和报告总结等各种任务方面的能力也更强。
Tags: 备注blue什么意思
版权声明: 免责声明:本网站部分内容由用户自行上传,若侵犯了您的权益,请联系我们处理,谢谢!联系QQ:2760375052
上一篇: 腾讯控股月日斥资亿港元回购万股
下一篇: 修身堂附属授出万港元的贷款
最近发表
- 一款值得信赖的全能座驾
- Jeep牧马人,越野传奇的全面解析
- 轻松掌握 XP 中文语言包下载与安装全攻略
- 深入探索Google操作系统,如何改变我们的数字生活
- 一款独特的美式SUV
- 轻松入门电脑知识,畅游数字世界——电脑知识学习网带你全面掌握
- 深入解读vivo Y93手机参数,性能、功能与用户体验
- 电源已接通但未充电?别慌!详解及解决方法
- 苹果SE4上市时间及价格全解析,性价比之王的回归
- 探寻AM3平台的最佳CPU选择
- 别克君威价格全解析,购车必备指南
- 全面解析与深度评测
- 理解负指数分布图像,隐藏在日常生活中的数学之美
- 全面解析与购车指南
- 深入了解标志206最新报价,购车指南与市场分析
- 深入了解 i3 10100,一款适合日常生活的高效处理器
- 走进vivo手机商城,探索智能生活的新篇章
- 5万以下汽车报价大全,为您精选高性价比的经济型车型
- 一辆小车的精彩故事
- 全面解析与购车建议
- 深入了解昊锐1.8T油耗表现及其优化技巧
- 迈腾18T,都市出行的理想伙伴,轻松驾驭每一段旅程
- 桑塔纳新款,传承经典,焕发新生
- 联发科MT6765,智能手机的高效心脏
- 丰田Previa,一款经典MPV的前世今生
- 小学校长受贿近千万,背后的故事与启示
- 探索移动帝国论坛,连接全球移动技术爱好者的桥梁
- 小小的我预售破4000万,一场梦幻童话的奇迹之旅
- 深度解析凯迪拉克CTS(进口),豪华与性能的完美结合
- 揭秘南方人为何更易患鼻咽癌?
- 豪华与性能的完美结合——价格详解及购车指南
- 我是刑警编剧专访,坚持创作初心,不惯市场之风
- 轻松掌握图标文件的奥秘
- 黄圣依在最强大脑中的高知魅力——路透背后的故事
- 微信紧急提醒,警惕木马病毒——如何防范与应对网络攻击?
- Jeep新大切诺基,经典与现代的完美融合
- 顾客用餐时打火机不慎落入锅内引发爆炸事件解析
- 解读大捷龙报价,购车前必知的关键信息
- 大学生作业中的AI气息,新时代的学习变革
- 比亚迪思锐,探索未来汽车科技的先锋
- 警惕串联他人越级走访,数人多次煽动行为终被抓获的警示
- 经典与现代的完美融合——联想ThinkPad X201,一款改变工作方式的笔记本电脑
- 北京平谷再现鸟中老虎
- 一位七旬官员的人生转折,公诉背后的故事与深思
- 财神鱼离奇死亡,男子悲痛之余做出惊人决定,起锅烧油含泪吃下
- 掌握 Flash 课件制作,从零开始的实用教程
- 蜜雪冰城的新动作,背后的战略调整与市场应对
- 警惕网络谣言,重庆小女孩急需救助的真相揭秘
- 深入了解2012款锋范,经典小车的完美演绎
- 刘诗诗,淡然面对传闻,专注自我成长