ライオンブリッジ ゲーミング部門の詳細を見る

言語を選択:

オレンジ色の背景に複数のヘルス アイコンとボタン

臨床試験における AI

臨床試験結果の一般向け要約を AI で作成できるか

臨床試験の一般向け要約 (PLS) (非専門家向けの要約) は、臨床研究を拡大し、研究コミュニティに対する社会的信頼感を高めるために不可欠なコミュニケーション ツールとして登場しました。一般向け要約は、臨床試験のボランティア参加者に、非専門的なわかりやすい言葉で試験結果の要約を伝えるものです。また医療関係者以外の読者に対しても、研究結果、疾患、治療法についての信頼できる情報が提供されます。

欧州連合 (EU) では現在、非専門家向けの要約を公開することは、臨床試験規則 (CTR) No 536/2014 に基づく規制上の必須要件となっています。これは、ライフサイエンス分野における生成 AI の新たな用途になるのでしょうか。AI によるコンテンツ制作は、こうした要約の作成と、臨床試験の結果報告の負担軽減に役立つのでしょうか。PLS は通常、医療文書作成の専門家や情報公開の専門家が作成します。また EU では、規制によって厳格な提出スケジュールが定められています。さらにこうした報告は、機密性の高い研究結果の開示を伴うものであり、それも多くの場合は医薬品や治療法が臨床治療向けに承認される前に行われるため、容易ではないことが多々あります。

今回のブログ記事では、臨床試験におけるこの AI の新たな潜在的用途について探っていきます。AI コンテンツ制作ツールは、科学的な正確性を損なうことなく、一般向け要約の作成と翻訳をサポートできるのでしょうか。

  • #technology
  • #life_sciences
  • #ai
  • #generative-ai
  • #blog_posts

専門的な内容を平易な言葉で

高品質でバランスの取れた臨床試験結果の要約を、平易な言葉で作成するために必要な労力とスキルは、しばしば過小評価されています。これは言語、コミュニケーション、ビジュアル デザインのスキルに加え、以下のような分野の専門知識も必要になる、多分野にまたがる作業なのです。

  • 臨床試験の研究方法論
  • 規制要件
  • 生物医学分野の統計学
  • ヘルス リテラシーの原則

特に注意すべき点として、臨床研究の結果を総括する作業には、次のようなリスクが伴うことがよくあります。

  • 短い要約を作成するためにプロトコルの評価項目を選択する際の無意識の偏見
  • 科学的公正性を脅かす、試験結果の不正確な提示
  • スタイルやトーン (語調) における望ましくない変更 (例: 宣伝的な表現の使用や、根拠のない性能の主張など)
  • 要約を翻訳する際の言語スタイル、用語、正確さの維持
  • 一般オーディエンスにとっての読みやすさを確保するための、医療リテラシーや計算能力の原則に関する考慮の欠如

臨床研究の結果を要約して公開する際のリスクを意識して、多くの臨床試験依頼者は、PLS の作成に AI を導入することに不安を感じています。AI を導入するユースケースや、AI と人間の関与の適切なバランスを定めることは、必要な多分野の専門知識を持たない試験依頼者にとっては難しい場合があります。

臨床試験における AI 使用の潜在的なメリット

AI を適切なユースケースで使用すれば、一般向け要約の作成にかかる負担を大幅に軽減できます。臨床試験で AI を活用することで、人的リソースが排除されるという心配はありません。EU の AI 法によれば、AI システムの導入者は、必要な能力を持ち、トレーニングを受けた、権限を有する個人を配置して、人間による監督を行う必要があります。人間が以下のような基準をもとにコンテキストを定義し、AI 出力を検証しなければなりません。

  • 臨床試験に関する独自の知識
  • 文化固有の表現
  • PLS のトーン

また、不正確な要約によってもたらされうる潜在的な損害や不信感を考慮すると、臨床試験で過度に AI に依存することは危険です。

ライオンブリッジでは PLS による情報伝達の機密性と言語的な課題を踏まえて、PLS の初期ドラフトの作成段階で AI を使用し、その作業を自動化することを推奨しています。その後、次のような各段階を、AI を利用して最適化することができます。

  • 修正
  • 改善
  • 翻訳

臨床試験依頼者は、高度なプロンプト エンジニアリングを活用して、PLS の初稿を自動生成できます。次に大規模言語モデル (LLM) に、事前に定義した情報を臨床試験報告書やその他の関連文書 (臨床試験プロトコル、インフォームド コンセント フォーム、表、リスト、グラフなど) から抽出し、要約するよう指示することができます。プロンプトが不適切な場合は、質の低い応答が生成され、PLS 作成の負担が増大します。この負担を回避するには、エンジニアリングの専門家が、次を防止できるプロンプト エンジニアリングを設計する必要があります。

  • LLM のハルシネーション
  • 文脈幅に関する制限
  • 誤った情報の提示
大型スクリーンでデータセットを確認している研究者たち

テンプレートを利用する

ライオンブリッジでは、EU CTR、付属書 V のコンテンツ要件、およびヘルス リテラシーの原則に準拠したマスター プロンプト テンプレートを開発しました。このテンプレートを使用すると、PLS の初期ドラフトの作成を自動化できます。臨床試験依頼者がプロンプト テンプレートを使用すれば、一般向けのわかりやすいスタイルで正確な情報を記載した、信頼性の高い初期ドラフトを生成することができます。また、プロンプト テンプレートを試験依頼者の臨床試験レポートやテンプレートに合わせて調整し、正しい情報をどこで見つければよいかを LLM に指示することもできます。臨床試験レポートは数百、数千ページに及ぶため、プロンプト エンジニアリングを慎重に行うことで、メディカル ライターや臨床試験チームは時間を大幅に節約し、技術的な詳細の正しい解釈と要約の修正に集中できるようになります。

PLS の初期ドラフトが生成され、レビューと修正の段階に入ると、プロンプト エンジニアリングの反復はより複雑になるため、効率を高めて PLS 作成プロセス全体を最適化するにはワークフローを事前定義しておくことが必要になります。LLM は、初期ドラフトの作成段階以降もコンテンツ、表現、および PLS の読みやすさを改善する目的で引き続き利用できます。また自然言語翻訳も、AI と人間によるポストエディットを通じて最適化することができます。

臨床試験依頼者は、PLS プロンプト エンジニアリングのマスター テンプレートをもとに作業を開始し、次のような点を考慮してテンプレートを調整していくことができます。

  • 臨床試験のさまざまな段階
  • 被験者集団
  • 治療領域
  • その他、臨床試験固有の要素

また、同じ臨床開発計画に基づく複数の臨床試験に、マスター プロンプトを適応させて再利用することも可能です。PLS 作成における AI の関与レベルは、PLS 作成にまつわるリスクと、臨床試験依頼者のリスク許容度によって異なります。

PLS 作成における AI と人間の関与

PLS 作成時の偏見、省略、歪曲の防止

試験要約には偏見が含まれる可能性があることが知られており、臨床試験依頼者は一般向け要約を作成する際に、そうした偏見を軽減する必要があります。特に、要約に含めるエンドポイントを選択する際にはそれが重要になります。フェーズ 3 または 4 のプロトコルには、主要エンドポイント、二次エンドポイント、および三次エンドポイントが組み込まれる場合があり、臨床試験依頼者はそのうちの一部を、患者との関連性が高く、PLS に含めるべきものであると判断することがあります。Good Lay Summary Practice (GLSP) のガイダンスでは、エンドポイント選択のための確立/文書化されたフレームワークに従って、どのエンドポイントを含めるかを試験依頼者が事前に定義しておくことを推奨しています。それにより、PLS に含めるエンドポイントを選択する際の偏見のリスクを回避できます。臨床試験依頼者は、そのように事前選択したエンドポイントを PLS のプロンプト テンプレートに組み込んで、LLM に正しい結果を提示・抽出させることができます。

また PLS の作成プロセスにおいて、一般的な有害事象や、臨床試験の被験者募集における被験者の選択・除外基準を要約するよう LLM に指示した場合にも、偏見、省略、誤った表現などが生じる可能性があります。高度なプロンプトと人間による監視がなければ、LLM は患者が注目すべき有害事象を省略したり、場合によってはコンテキスト不足のために安全性データを誤って解釈したりする可能性もあります。また、重要な適格性基準が見落とされ、臨床試験との関連性が低い基準が要約される場合もあります。臨床試験チームおよびメディカル ライターは、PLS が以下のような内容であることを確認しなければなりません。

  • 患者の利益を念頭に置いている
  • 肯定的な結果と否定的な結果の両方を提示している
  • 科学的なニュアンスと一致している

臨床開発プログラム全体の準備、修正、拡大

適切なスキルを持つプロンプト エンジニアであれば、プロンプト テンプレートの準備と修正、プロンプト再利用の自動化、ワークフローを最適化するための後処理プロンプトの実行が可能です。事前に作業を行い、マスター プロンプト テンプレートを作成・テストしておくことで、試験依頼者は自動作成された PLS ドラフトを修正して改良できるようになります。試験依頼者が選択する方法論によっては、PLS 作成においてプロンプトを複数回繰り返す必要が出てくる場合もあります。プロンプト テンプレートは、臨床開発プログラムに含まれるある研究用から別の研究用に調整し直して、再利用することもできます。AI が進化し、自然言語全体のコーパスが改善されるにつれて、ソース言語による PLS のドラフト作成からターゲット言語への翻訳に至るまでのプロセス全体がさらに効率化される可能性があります。

DNA 鎖のデジタル表現

LLM は大規模なデータセットのコーパスによってトレーニングされるため、望ましい PLS 出力を得るには、微調整と優れたプロンプト エンジニアリングが重要になります。プロンプトは人間が生成するものなので、偏見が含まれる可能性があり、それが LLM によって増幅または再現されうることを、臨床試験依頼者は覚えておかなければなりません。臨床試験での AI の使用から生じるこのような偏見 (意図的かどうかによらず) により、偏ったまたはバランスの悪い試験結果要約が生成されるおそれがあります。

お問い合わせ

責任ある AI の使用とは、透明性のある AI の使用を意味します。EU の AI 法によれば、AI を使用して一般公開用のテキストを生成または操作する場合、AI を導入した組織はそれを開示する必要があります。臨床試験依頼者は、PLS 作成プロセスのどこでどのように LLM を使用するかを明確にしなければなりません。

ライオンブリッジでは、AI の使用に対する信頼感を構築し、研究コミュニティ、お客様、そして一般社会全体からの AI トラストを確保するために、TRUST フレームワークを開発しました。臨床試験における AI の利用については、当社の eBook『ライフ サイエンス業界における AI の活用と言語戦略』で詳しく解説しています。皆さまからのお問い合わせをお待ちしております。

linkedin sharing button

執筆者
ピア ウィンデロブ、ライフ サイエンス戦略および製品マーケティング担当 VP

お問い合わせ

勤務先のメール アドレスを入力してください