ChatGPTが合格した医学検査は何ですか?

ChatGPTを使ってカバーレターを書く.png

最近インターネットで大ブームとなっているトピックは、ChatGPTです。このAIチャットボットは、昨年11月にデビューしました。人々は、陽気で軽快な会話でその話し上手さを試しています。さらに、ChatGPTは多数の偉業を達成しており、米国医師免許試験やウォートンビジネススクールの試験、また4つのミネソタ大学法科大学院の憲法学の試験など、最も厳しい試験に合格しました。この快挙は、TwitterのCEOであるイーロン・マスク氏の注目を浴び、彼はAIチャットボットを「きっと大丈夫だろう」と皮肉っていました。さて、ChatGPTがどの医学試験に合格したのか、見てみましょう。

ChatGPTの出現

興味深いことに、ムスク氏とマイクロソフトが投資している研究会社であるオープンAIがChatGPTを作成しました。このAIツールのウェブサイトを利用すると、どんなトピックの質問でも速やかで詳細な回答を段落形式で受け取ることができます。ChatGPTはさまざまな領域でその能力を示しています。即時で複雑なエッセイを書くことができ、マーケティングのプレゼン資料を作成し、詩やジョークを生み出し、さらにはアメリカ合衆国の議員のスピーチの起草まで可能です。しかし、AIが一部の人間の仕事を奪う可能性には懸念があります。

また、以下もお読みください: ChatGPT 4は無料ですか?

ChatGPTが医学試験を受ける:概要

このツールの最新の成果の1つは、アメリカの医療免許試験に合格する能力です。 プレプリントの研究では、研究者たちはChatGPTの能力の上限を探求しました。彼らは過去の試験の質問をAIツールに与え、開放的な書き込み式の回答から複数選択式までの回答を、2人の医師裁定者によって独自に評価しました。彼らは、これらの質問への回答が、チャットボットが訓練中にアクセス可能なデータセットにすでに含まれていないことを確認しました。チームは、ChatGPTが回答を事前に見ていなくても、特別なトレーニングや強化なしで試験の合格基準に近いかそれに匹敵する成績を残したと述べました。このツールは、すべての試験で50%以上の成績を受け、アメリカの医療免許試験の合格基準である約60%に近づきました。 "したがって、ChatGPTは現在、合格範囲内に快適に存在している"と論文は結論づけました。

ChatGPTがUSMLE試験に合格しました: すべてを知るために必要なこと

マサチューセッツ総合病院(MGH)とAnsibleHealthの科学者たちは、画期的な新しい研究で、OpenAIのChatGPTが驚異的な60%の正確さでアメリカ合衆国医師免許試験(USMLE)に合格できることを発見しました。この研究は、医療教育と訓練におけるAIの役割について、興奮すべき可能性を切り開きます。

自然言語処理ツールと医療教育

ChatGPTは、膨大な量の言語データで訓練され、パターンや関係性を探し出す自然言語処理ツールです。訓練された言語に基づいて新しいテキストを生成する能力があり、医療教育において非常に適したツールです。ただし、ChatGPTは他のAIチャットボットとは異なり、ウェブを検索する機能はありません。

モデルのテスト

科学者たちは、USMLEを構成する3つの標準化テストに基づいてChatGPTモデルを評価しました。チームは、一般に公開された2022年6月のサンプル試験からのテスト問題を使用してモデルを訓練しました。視覚分析を必要とする問題は訓練セットから除外されました。

メモリ保持バイアスを減らすために、チームはモデルに3つの異なるタイプの質問を入力しました:

  1. 複数選択式の単一回答で、強制的な正当化は必要ありません。例えば、「患者の状態は、次のうちどの病原体によってほとんど引き起こされますか?」
  2. 複数選択式の単一回答で、強制的な正当化が必要です。例えば、「患者の夜間の症状の最も可能性の高い理由は次のうちどれですか?各選択肢の根拠を説明してください。」
  3. オープンエンドのプロンプトです。例えば、「与えられた情報に基づいて、患者の診断は何ですか?」

素晴らしい結果

初めて、AIモデルが臨床家のトレーナーの支援なしで、USMLEにおいて60%以上の正確さで合格することに成功しました。この結果は重要であり、医学教育におけるAIの新たな可能性を開拓します。研究者たちはまた、ChatGPTの結果が妥当な臨床的洞察力と理論的根拠を示しており、モデルの解釈可能性と信頼性に対してさらなる信頼を生んだことも発見しました。

医学教育の未来

チームは、ChatGPTや他の生成型対話モデルが将来の医師の訓練に役立つと考えています。そのような応用法の1つは、技術的な医療結果を患者により理解しやすい言葉に翻訳することです。AnsibleHealthは既にこのプロジェクトに取り組んでいます。

ChatGPTが医療分野での能力を示しています

質問に答えたり、病気を診断する能力に加えて、GPT-4は優れた翻訳者でもあります。ポルトガル語を話す患者の退院情報を翻訳することができ、専門用語を6年生が簡単に理解できるように解説することができます。また、GPT-4は医師に、患者とその状態について同情的で明確な言葉で話す方法に関する役立つアドバイスを提供することもできます。

限定されてはいますが、GPT-4は驚くほどにも完璧ではありませんが、医師が病状を診断する方法を模倣することができます。因果関係を理解することができるかと尋ねられたとき、その知能はまだ「データのパターンに限定され、真の理解や意図を含まない」と答えました。

GPT-4についてのDr. Isaac Kohaneの考え

近日発売予定の書籍「医学におけるAI革命」で、コンピュータ科学者兼医師のアイザック・コハネ博士は、同僚2人とともに、OpenAIの最新人工知能モデルであるGPT-4を医療現場での実践で試した。結果は印象的だった。

書籍では、Dr. Kohaneは、2023年3月に有料の購読者向けにリリースされたGPT-4が、米国の医療試験の問題に対して90%以上の正答率で回答することができると述べています。これは、以前のChatGPT AIモデルであるGPT-3および-3.5よりも優れたテスト受験者であり、また一部のライセンスを持つ医師よりも優れています。Carey Goldbergとマイクロソフトの研究担当副社長であるPeter Leeによれば、GPT-4は「多くの医師」よりも優れた臨床判断力を持ち、希少な病態を「私と同様に」診断することができます。

テストGPT-4:方法

GPT-4のテストのために、Dr. Kohaneと彼の同僚は、AIモデルが医療の現場でどのように機能するかを確認するためにチームを組みました。彼らはGPT-4に質問をし、診断するための臨床シナリオを与えました。その結果は、人間の医師による診断と比較されました。著者は、GPT-4が人間の医師に比べていくつかの利点を持っていると指摘しています。例えば、膨大な情報を記憶し、複数の情報源から情報を総合する能力などです。

ただし、著者たちはGPT-4にはいくつかの制約があることも認識しています。たとえば、GPT-4は患者の個別の医療経歴や健康に影響を与える社会的要因を考慮することができません。さらに、GPT-4が膨大な量のデータに依存していることから、データのプライバシーや偏見に関する懸念があります。

GPT-4: 機能と可能性

GPT-4 は単なる事実を見つける能力や優れたテスト受験能力だけでなく、優れた翻訳能力も備えています。著者によれば、GPT-4 はポルトガル語を話す患者の退院情報を翻訳し、専門用語を中学6年生が簡単に理解できる形にまとめることができます。

しかし、診断の領域だけでなく、GPT-4は希望を示しています。この本では、著者たちはGPT-4が医師に良い提案をすることができると説明しています。具体的には、患者とのつながりをより良くする方法についてのヒントを提供します。

ただし、GPT-4が完璧ではないことに注意することが重要です。著者たちは警告しているように、GPT-4にはまだ間違いが起こることがあり、ヒポクラテスの誓いは取っていません。さらに、GPT-4を含むAI技術は、雇用の置き換えや患者のプライバシーについて倫理的な問題を提起しています。

結論:医療におけるAIの未来

これらの制限にもかかわらず、GPT-4の医学的状態の診断の成功は、医療におけるAI技術の魅力的な可能性を示しています。将来的には、GPT-4のようなAIモデルが医師に珍しい病気の診断や医学的な専門用語の翻訳、患者へのより良いケアを支援することができるかもしれません。ただし、倫理的な考慮を念頭に置いてAIモデルの開発とテストが行われることが重要です。

関連記事

もっと見る >>

HIX.AI で AI の力を解き放ちましょう!