新研究发现 OpenAI 的 o1-preview AI 模型在诊断棘手医疗案例方面优于医生

暗月寺鸿远 2024-12-25 科技时尚 13 次浏览 0个评论

　　来源：IT之家

　　IT之家 12 月 25 日消息，由哈佛医学院和斯坦福大学组成的科研团队，在医学诊断领域深入评估 OpenAI 的 o1-preview 模型，发现其比人类医生更擅长诊断棘手的医疗案例。

　　根据研究报告，o1-preview 正确诊断了 78.3% 的测试案例，在 70 个特定案例的对比测试中，准确率更是高达 88.6%，显著优于其前身 GPT-4 的 72.9%。

　　使用医学推理质量评估标准量表 R-IDEA，o1-preview 在 80 个案例中取得了 78 个满分。相比之下，经验丰富的医生仅在 28 个案例中获得满分，住院医生则仅为 16 例。

　　在 25 位专家设计的复杂案例中，o1-preview 得分高达 86%，是使用 GPT-4 的医生（41%）和使用传统工具的医生（34%）的两倍多。

　　研究人员承认该测试存在局限性，部分测试案例可能包含在 o1-preview 的训练数据中，且测试主要集中于系统单独工作，并未充分考虑其与人类医生协同工作的场景；此外 o1-preview 建议的诊断测试成本高昂，在实际应用中存在局限性。

　　IT之家附上参考地址

Superhuman performance of a large language model on the reasoning tasks of a physician

OpenAI‘s o1-preview outperforms doctors in diagnosing tricky medical cases， study finds

　　广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

你可能想看：

王炸来了！OpenAI正式推出AI视频生成模型Sora

OpenAI发布了下一代模拟推理模型o3和o3-mini

很强也很贵！OpenAI12天12场直播收官，官宣最新推理模型o3

亚马逊云科技加码医疗领域，赋能大米和小米推出特需儿童AI解决方案

大型语言模型遇到瓶颈 AI“淘金热”时代即将终结？

卧室软装搭配案例，卧室软装搭配案例分析

美驻华大使：我们之前不跟中国合作，制裁中国，发现没用

人物 | 巴沙尔·阿萨德：他原本只想做一名眼科医生

转载请注明来自重庆初品装饰设计有限公司，本文标题：《新研究发现 OpenAI 的 o1-preview AI 模型在诊断棘手医疗案例方面优于医生》

暗月寺鸿远 36篇文章站点微博

每一天，每一秒，你所做的决定都会改变你的人生！

发表评论取消回复

评论列表（暂无评论，13人围观）参与讨论

admin管理员

热评文章

猜你喜欢

网站收藏

新研究发现 OpenAI 的 o1-preview AI 模型在诊断棘手医疗案例方面优于医生

发表评论取消回复

还没有评论，来说两句吧...

最近发表

为您推荐

相邻内容

友情链接

文章目录

admin管理员

热评文章

猜你喜欢

网站收藏

新研究发现 OpenAI 的 o1-preview AI 模型在诊断棘手医疗案例方面优于医生

普京：俄正努力结束俄乌冲突，必要时将再次使用“榛树”导弹

偶像首次成为电影男一号，粉丝薅政府消费券狂刷票房！“票卖出去几百张，座位却空荡荡”

狼队角球直接攻破曼联球门！费迪南德发推：无语

美国上周初请失业金人数降至一个月来最低，但失业的时间更长

童光毅，任上被查

开审尹锡悦、弹劾韩德洙，韩国明天上演两出大戏

阿航客机失事现场找到第二个黑匣子

新骗局来了：杭州女子花17万买“大牌小样”，收到的竟是一箱泡沫纸

发表评论取消回复

还没有评论，来说两句吧...

最近发表

为您推荐

相邻内容

友情链接

文章目录