언어 선택 :

의료 업계에서의 AI: 협업을 통해 임상시험에서 데이터 사용을 개선할 수 있는 방법

대규모 데이터 공유 네트워크의 잠재력 활용

저자: Mark Aiello, April Crehan

왜 데이터를 공유해야 할까요?


데이터가 AI의 원동력이라는 것은 의심할 여지가 없습니다. AI를 개발할 때 아무리 정교하고 발달한 솔루션이라고 해도 시스템을 훈련할 때는 다양하고 정제된 데이터가 필요합니다. 기계를 스마트하게 학습시키기 위해 필요한 대규모의 고품질 데이터를 확보하는 일은 쉽지 않습니다. 의료 분야에서는 더욱 어려운 일이죠.

환자들은 당연하게도 의사 이외의 사람들과 개인정보(데이터)를 공유하는 일을 꺼립니다. 또한 의사들은 환자의 개인정보를 보호하기 위한 법 및 윤리적인 제약을 받습니다. 이런 제한이 분명 존재하는 의료 데이터 세트의 가치를 더욱 높입니다. 기업 또는 기관이 등록된 환자 정보 및 데이터 세트를 공유하게 만드는 것은 무엇일까요?

사회적 이익은 상당합니다. 임상시험 관계자라면 누구나 데이터 공유를 통해 생산성 제고, 더 빠른 결과 재현, 중복 작업의 감소로부터 직접적인 이익을 얻을 수 있습니다.

생산성 증가


반복되는 이야기지만 협업이 참여하는 모든 사람의 작업을 개선한다는 연구가 있습니다. 등록된 데이터를 환자, 의사, 약 개발자, 연구자 등의 관계자와 공유하는 것은 데이터 소유자에게 더 적은 비용으로 더 빠른 성공을 가져다 줄 수 있음을 의미합니다. 한 보고서에서 Elsevier는 연구 데이터 공유가 '연구 속도를 높일 수 있다'는 데 주목했습니다. 이 보고서는 플라시보 치료제보다 항우울제가 심각한 성인 우울증의 단기 치료에 더욱 효과적이라는 메타 분석 결과를 통해 협업의 중요성을 입증했습니다. (Elsevier가 '가장 종합적인 최신 항우울제 분석'이라고 말한) 이 분석은 이미 발표된 보고서 및 과거에 발표되지 않은 데이터 세트의 조합으로 도출된 것입니다. 작업 내용을 공유한 연구자, 규제 기관 및 제약 회사가 이 메타 분석을 가능하게 하였으며, 저자들은 전체 데이터 세트를 발표하여 반복 시험 및 추후 이용을 가능하게 했습니다. 협업이 앞으로의 연구에도 긍정적인 영향을 줄 수 있다는 것을 의미합니다.

중복 작업 및 위험 요소 감소


신약 개발에 천문학적인 비용이 든다는 것은 이미 알고 있을 것입니다. 시험 단계의 약은 여덟 번 중 일곱 번은 최종 승인을 받지 못합니다. 사전에 다른 기업이 동일한 단계를 밟았다는 것을 알 수 있다면 다른 방법을 선택할 수 있습니다. 성공 및 실패 정보를 공유함으로써 다른 경로, 분자, 질병에 리소스를 할당할 수 있습니다. 단계를 뛰어넘어 곧 개발될 제품의 개선으로 넘어갈 수도 있습니다. 실수를 빠르게 발견하고 투명성을 높이면 환자의 위험도 줄어들 수 있습니다. 약물을 지속 사용했을 때의 부정적인 결과 또는 불확실한 결과를 숨김으로써 사망까지도 초래할 수 있는 부정적인 결과가 발생하기도 합니다.

효능 증명


연구와 시험 과정이 투명할수록 다른 사람이 작업을 지지(또는 오류 증명)하기 쉽습니다. 재현성은 과학 발전에 핵심 요소이며 데이터가 공개되어 있을 때 재현이 간소화됩니다. AI 세계에서 테스트 세트 공유는 다른 사람들이 기존 AI 시스템을 개선하려는 시도에 도움이 됩니다. 연구자들이 개선할 수 있는 분야를 초기에 찾아낼수록 더욱 빠르게 반복할 수 있습니다.

어떤 데이터를 공유해야 할까요?


이런 이익에도 불구하고 가장 중요한 어려움이 남아 있습니다. 환자들이 의료 데이터 공유를 꺼린다는 점이죠. 연구자 및 시험 의뢰자는 이 문제를 어떻게 극복해야 할까요? 데이터를 공유해 의료 분야에서 AI를 더 많이 개발하고 응용하는 데 중요한 것은 데이터 익명화를 통해 환자의 개인정보 관련 우려를 줄이는 것입니다. 보상 기반으로 익명화된 데이터를 공유하는 작은 연구자 그룹을 조직하면 정보 공유를 효과적으로 촉진할 수 있습니다. 일부 정부 및 저널은 이미 과학 연구 기금 제공 및 발표에 일정 수준의 데이터 공유를 요구합니다. 이렇게 하면 연구자들의 데이터 공유를 촉진할 수 있습니다.

그럼 정확히 무엇이 공개되나요?

데이터 세트


학습 세트, AI 시스템의 청사진을 공유하면 IP를 위태롭게 만들 수 있습니다. 하지만 시스템이 동작하는지 테스트했던 테스트 세트 정도는 공개할 수 있지 않을까요? 사용하고 있는 AI 시스템을 진정으로 신뢰한다면 여러분이 사용한 테스트 데이터로 자체적인 시스템을 테스트해 성능을 추월했는지 확인할 수 있어야 합니다.

결과


사람은 누구나 성공을 공유하는 것을 자랑스러워 하지만 실패도 유용한 정보가 될 수 있습니다. 사람들이 성공한 작업은 물론 실패한 작업도 공유할 수 있는 열린 문화를 만들어야 합니다. 동료들 역시 여러분의 실수를 통해 배우고 원인까지 파악할 수 있습니다. 앞서 언급했지만 좋지 않은 소식을 공유함으로써 생명을 살릴 수도 있습니다.

환자 풀

의료 분야에서 가장 강력한 AI 응용 분야는 임상시험에 맞는 환자를 모집하는 것입니다. AI가 임상시험에 적합한 지원자를 식별하는 데 도움을 줄 수 있기 때문에 잠재적 참여자를 '빼앗기지' 않도록 보호해야 한다는 압박감이 줄어듭니다. AI를 활용하면 여러분과 경쟁자는 자신의 임상시험 환자 풀에서 경쟁자의 시험에 적합한 환자를 발견할 수 있습니다.

결국 의료 분야에서 AI를 사용하는 것은 잠재적으로 환자에게 더 나은 환경을 제공할 수 있다는 것을 의미합니다. 임상시험계에서 더 공유된다면 진정으로 삶을 바꾸는 혁신의 속도도 빨라질 것입니다.

AI가 임상시험계에 혁신을 일으키는 방법이 궁금하신가요? 자세한 정보를 알아보려면 여기를 클릭하세요.

  • #life_sciences
  • #blog_posts

Lionbridge
AUTHOR
Lionbridge