ChatGPTによる臨床検査技師国家試験正答率の検証

近年,大規模言語モデル(large language models; LLM)が世界的に様々な分野で注目を集めている。LLMとは,非常に巨大なデータセットとディープラーニング技術を用いて構築された言語モデルである。LLMは,人間に近い流暢な会話が可能であり,自然言語を用いたさまざまな処理を高精度で行えることから,世界中で注目を集めている。本研究では,LLMであるOpenAI社が開発したChatGPTの異なる2つのモデル(GPT-3.5, GPT-4)にて,過去3年間の臨床検査技師国家試験におけるChatGPTの正答率について評価を行った。GPT-3.5による正答率の平均は51.4%であった。一...

Full description

Saved in:
Bibliographic Details
Published in医学検査 Vol. 73; no. 2; pp. 323 - 331
Main Authors 市野, 直浩, 土井, 洋輝, 永沢, 大樹, 菊地, 良介, 秋山, 秀彦, 石田, 秀和, 齋藤, 邦明, 坪井, 良樹
Format Journal Article
LanguageJapanese
Published 一般社団法人 日本臨床衛生検査技師会 25.04.2024
日本臨床衛生検査技師会
Subjects
Online AccessGet full text
ISSN0915-8669
2188-5346
DOI10.14932/jamt.23-80

Cover

More Information
Summary:近年,大規模言語モデル(large language models; LLM)が世界的に様々な分野で注目を集めている。LLMとは,非常に巨大なデータセットとディープラーニング技術を用いて構築された言語モデルである。LLMは,人間に近い流暢な会話が可能であり,自然言語を用いたさまざまな処理を高精度で行えることから,世界中で注目を集めている。本研究では,LLMであるOpenAI社が開発したChatGPTの異なる2つのモデル(GPT-3.5, GPT-4)にて,過去3年間の臨床検査技師国家試験におけるChatGPTの正答率について評価を行った。GPT-3.5による正答率の平均は51.4%であった。一方,GPT-4では79.8%の正答率結果が得られた。本結果より,ChatGPTはこの先医療現場における有効なアドバイザーとして進化する可能性をもつことが示唆された。しかし,今回不正解となった20%の中には,患者を診断する際に誤診につながりかねない回答が含まれており,今後のChatGPTの精度向上は必須と考えられる。今回の検証は,LLMにおけるChatGPTの臨床検査領域での多様な応用の進展に寄与すると考えられ,この先の発展に期待したい。
ISSN:0915-8669
2188-5346
DOI:10.14932/jamt.23-80