Besök Lionbridge Games

VÄLJ SPRÅK:

hälsoikoner och knappar mot orange bakgrund

AI och kliniska prövningar

Kan AI skriva allmänspråkliga sammanfattningar om resultat i kliniska prövningar?

Allmänspråkliga sammanfattningar växer fram som ett viktigt kommunikationsverktyg för att utöka klinisk forskning och främja allmänhetens förtroende för forskningsvärlden. Allmänspråkliga sammanfattningar ger deltagare i kliniska prövningar en sammanfattning av prövningsresultaten med ett mer lättillgängligt och mindre vetenskapligt språk. De ger också målgrupper utanför den medicinska världen tillförlitlig information om forskningsresultat, sjukdomar och behandlingar.

Offentliggöranden av allmänspråkliga sammanfattningar är numera ett regulatoriskt krav som fastställs i Europeiska unionens direktiv om kliniska prövningar (EU CTR) nr 536/2014. Så, kan det här vara ett nytt användningsområde för generativ AI och Life Sciences? Kan AI-baserat skapande av innehåll användas för att skapa sådana sammanfattningar och underlätta arbetet med rapportering från kliniska prövningar? Allmänspråkliga sammanfattningar (PLS) skrivs vanligtvis av experter på medicinsk text och/eller kommunikation. De är också föremål för strikta regulatoriska tidslinjer inom EU. Dessutom kan rapporteringen vara utmanande eftersom det innebär att avslöja känsliga forskningsresultat – ofta innan ett läkemedel eller en behandling godkänns för klinisk användning.

I det här blogginlägget utforskar vi detta nya potentiella användningsområde för AI och kliniska prövningar. Kan verktyg för AI-innehåll vara till hjälp för att skriva och översätta allmänspråkliga sammanfattningar utan att den vetenskapliga noggrannheten offras?

  • #technology
  • #life_sciences
  • #ai
  • #generative-ai
  • #blog_posts

Från fackspråk till klarspråk

Det underskattas ofta hur stora arbetsinsatser och färdigheter som krävs för att göra högkvalitativa och balanserade allmänspråkliga sammanfattningar av kliniska resultat. Det är en tvärvetenskaplig uppgift som kräver kunskaper i språk, kommunikation och visuell design samt expertis inom:

  • Forskningsmetodik i kliniska prövningar
  • Regulatoriska krav
  • Biomedicinsk statistik
  • Hälsolitteracitetens principer.

Dessutom är processen för sammanfattning av kliniska forskningsresultat utsatt för risker, inklusive:

  • oavsiktlig bias vid urval av protokollslutpunkter för en kort sammanfattning
  • felaktig presentation av försöksresultat, vilket hotar den vetenskapliga integriteten
  • oönskade förändringar i stil eller ton, t.ex. genom att introducera kommersiellt språk eller grundlösa påståenden om resultat
  • utmaningen i att behålla språkets stil, terminologi och noggrannhet under översättningen av sammanfattningen
  • texter skapade utan att ta hänsyn till hälsolitteracitet och räkneförmåga för att se till att sammanfattningar enkelt kan läsas av en icke-vetenskaplig målgrupp.

Med tanke på riskerna med att sammanfatta och offentliggöra kliniska forskningsresultat är många prövningssponsorer försiktiga med att börja använda AI i sina allmänspråkliga sammanfattningar. Att definiera ett användningsfall för AI-användning och den rätta balansen mellan AI och mänsklig inblandning kan vara en utmaning för sponsorer som saknar nödvändig multidisciplinär expertis.

Vilka är de potentiella fördelarna med AI i kliniska prövningar?

Under ett korrekt användningsfall kan AI avsevärt minska insatserna för att utarbeta allmänspråkliga sammanfattningar. Det finns ingen risk att AI ersätter människan i kliniska prövningar. Enligt EU:s AI-förordning ska den som använder AI-system se till att individer med nödvändig kompetens, utbildning och behörighet har översyn över arbetet. En människa ska definiera kontexten och validera AI-utdata baserat på:

  • Unik kunskap inom klinisk forskning
  • Kulturella nyanser
  • Allmänspråklig ton

Dessutom finns det risker med att förlita sig på AI i alltför hög grad i kliniska prövningar, med tanke på de potentiella skador och den misstro som en felaktig sammanfattning skulle kunna orsaka.

Innehållet i dessa allmänspråkliga sammanfattningar är känsligt och rymmer ofta språkliga utmaningar. Därför rekommenderar Lionbridge att AI används för att automatisera det första utkastet till en sådan sammanfattning. Därefter kan AI användas för att optimera arbetsflödet i de övriga stegen av sammanfattningen:

  • Revidering
  • Anpassning
  • Översättning.

Sponsorer kan automatiskt skapa ett första utkast till en allmänspråklig sammanfattning med hjälp av noggrant utformade AI-prompter. En stor språkmodell (LLM) kan instrueras att extrahera och sammanfatta fördefinierad information från den kliniska prövningsrapporten och andra relevanta referensdokument, såsom kliniskt prövningsprotokoll, formulär för informerat samtycke och tabeller, listor och grafer. En dålig prompt genererar svar av låg kvalitet, vilket försvårar arbetet med att skriva den allmänspråkliga sammanfattningen. För att undvika det här problemet bör experterna utforma prompterna så att de motverkar:

  • Hallucinationer i stora språkmodeller
  • Kontextfönsterbegränsningar
  • Presentation av felaktig information.
Forskare granskar datamängder på en stor skärm

Börja med mallar

Lionbridge har tagit fram en huvudmall för utformning av prompter som uppfyller innehållskraven och principerna om hälsolitteracitet i bilaga V till Prövningsförordningen (EU CTR). Den här mallen möjliggör automatisering av det första utkastet av den allmänspråkliga sammanfattningen. Genom att använda en promptmall kan prövningssponsorer producera ett bra första utkast till en allmänspråklig sammanfattning, som innehåller korrekt information och är skriven på klarspråk. Det går även att anpassa promptmallen efter sponsorns rapporter och mallar från en klinisk prövning. På så sätt får den stora språkmodellen vägledning om var den kan hitta rätt information. Rapporter från kliniska prövningar kan innehålla hundratals eller tusentals sidor, så genomtänkt utformning av prompter kan innebära stora tidsbesparingar för medicinska skribenter och prövningsteam. Samtidigt får de möjlighet att fokusera på att tolka den tekniska informationen på rätt sätt och finputsa sammanfattningar.

När AI har producerat ett första utkast till den allmänspråkliga sammanfattningen skickas det vidare till gransknings- och revideringsstegen. Nu blir utformningen och finjusteringen av prompter mer komplicerad och kräver ett fördefinierat arbetsflöde för att effektivisera och optimera arbetet med att färdigställa sammanfattningen. Stora språkmodeller kan även användas efter de initiala utkaststegen till att anpassa innehållet, språket och läsbarheten i den allmänspråkliga sammanfattningen. Översättningar av naturligt språk kan också optimeras med hjälp av AI och mänsklig efterredigering.

Sponsorer kan utgå ifrån en huvudmall för utformning av prompter för allmänspråkliga sammanfattningar och sedan anpassa mallen för att ta hänsyn till:

  • Olika testfaser
  • Försökspopulationer
  • Terapeutiska områden
  • Andra aspekter som är specifika för en klinisk prövning.

Dessutom går det att anpassa och återanvända en huvudprompt i flera kliniska prövningar under samma kliniska utvecklingsplan. Nivån av AI-användning i allmänspråkliga sammanfattningar beror på risker relaterade till utvecklingen av det här arbetsflödet och sponsorns risktolerans.

AI och mänsklig inblandning i utvecklingen av allmänspråkliga sammanfattningar

Undvik fördomar, utelämnanden och felaktig information när du tar fram allmänspråkliga sammanfattningar

Fördomar är en känd risk inom forskningssammanfattningar, och prövningssponsorer måste motverka dem när de utvecklar allmänspråkliga sammanfattningar. Det är särskilt viktigt vid valet av vilka slutpunkter som ska stå med i sammanfattningen. Ett fas 3- eller 4-protokoll kan inkludera primära, sekundära och tertiära slutpunkter. Sponsorn kan bestämma att vissa är patientrelevanta och bör ingå i den allmänspråkliga sammanfattningen. Enligt vägledningen Good Lay Summary Practice (GLSP) bör sponsorer fördefiniera vilka slutpunkter som ska inkluderas enligt ett fastställt dokumenterat ramverk. På så sätt blir det enklare att undvika fördomar i valet av slutpunkter till en allmänspråklig sammanfattning. Prövningssponsorer kan lägga in sådana förvalda slutpunkter i en promptmall för sammanfattningen för att säkerställa att den stora språkmodellen samlar in och presenterar korrekta resultat.

Fördomar, utelämnanden eller felaktig information kan också förekomma när en allmänspråklig sammanfattning tas fram, till exempel om den stora språkmodellen instrueras att sammanfatta vanliga biverkningar eller inkluderings- och exkluderingskriterier för rekrytering av patienter till kliniska prövningar. Utan noggrant skrivna prompter och mänsklig övervakning kan stora språkmodeller utelämna biverkningar av intresse för patienter eller till och med misstolka säkerhetsdata på grund av otillräcklig kontext. De kan också missa viktiga behörighetskriterier och sammanfatta mindre relevanta kriterier i försökssammanhang. Prövningsteam och medicinska skribenter bör se till att den allmänspråkliga sammanfattningen

  • tillgodoser patientens intressen
  • presenterar gynnsamma och ogynnsamma resultat
  • överensstämmer med vetenskapliga nyanser

Förbered, anpassa och skala upp för olika kliniska utvecklingsprogram

Duktiga prompttekniker kan förbereda och anpassa promptmallar, automatisera återvinning av prompter och utföra efterbehandling av prompter för att få ett optimalt arbetsflöde. Genom att i ett tidigt skede utveckla och testa en huvudmall för prompter kan sponsorer förbättra kvaliteten på det första, automatiserade utkastet. Beroende på vilken metod prövningssponsorn använder kan prompterna till sammanfattningen behöva justeras flera gånger. Promptmallar kan även återanvändas och anpassas från en prövning till en annan i ett kliniskt utvecklingsprogram. I takt med att AI utvecklas och korpusen förbättras för naturligt språk kan hela processen effektiviseras ytterligare, från utkast till en allmänspråklig sammanfattning på källspråket till översättning av den till målspråken.

Digitaliserade DNA-strängar

Stora språkmodeller tränas med en enorm samling datauppsättningar, så det är viktigt att utforma och finjustera prompter av högsta kvalitet för att skapa den önskade allmänspråkliga sammanfattningen. Sponsorer bör komma ihåg att människor genererar prompterna och kan introducera fördomar som stora språkmodeller kan förstärka eller reproducera. Sådana fördomar som härrör från AI och kliniska prövningar (avsiktliga eller inte) kan leda till snedvridna eller obalanserade resultatsammanfattningar.

Kontakta oss

Ansvarsfull AI-användning är transparent AI-användning. Enligt EU:s AI-förordning ska sponsorer av kliniska prövningar som använder AI för att generera eller manipulera innehåll avsett för allmänheten tydligt informera om detta. Det ska vara tydligt var och hur testsponsorerna tillämpar stora språkmodeller i processen för allmänspråkliga sammanfattningar.

Lionbridge har tagit fram ett TRUST-ramverk för att öka förtroendet för vår användning av AI och säkerställa AI-förtroende inom forskningsvärlden och hos kunder och allmänheten. Om du vill veta mer om AI och kliniska prövningar kan du läsa vår e-bok: AI och språkstrategier för Life Sciences. Hör av dig.

linkedin sharing button

FÖRFATTARE
Pia Windelov, VP för Life Sciences Strategy and Product Marketing

Kontakta oss

Ange företagets e-postadress.