Розробка AI-системи для клінічних випробувань — вибір пацієнтів та моніторинг
Клінічні випробування — найдорожчий етап розробки ліку. Фаза III: $200M–$1B, 3–7 років. 30% випробувань проваливаються через проблеми з набором пацієнтів, 50% сайтів набирають менше 70% запланованих учасників. AI розв'язує це системно.
Набір пацієнтів
Автоматичний скринінг EHR за критеріями включення/виключення
Кожне клінічне випробування має десятки критеріїв включення/виключення, написаних медичною англійською. Завдання: знайти відповідних пацієнтів у базі EMR лікарні.
NLP система:
- Парсинг критеріїв: структуроване представлення через клінічне вилучення концепцій (SNOMED, LOINC, RxNorm)
- Зіставлення EHR: пошук пацієнтів, які відповідають всім критеріям
- Рейтинг: пріоритизація за ймовірністю проходження pre-screening
На практиці: ручний скринінг 1000 пацієнтів = 100–200 годин. NLP-скринінг = 2–5 хвилин з recall >92% на критерії.
Аналіз генерованості
AI аналізує, наскільки репрезентативна популяція випробування для реальної популяції пацієнтів. Виявлення системного виключення (напр., історично всі випробування серцевої недостатності виключали жінок і пожилих людей).
Передбачення коефіцієнта завершення
Модель передбачує ймовірність того, що конкретний пацієнт завершить випробування (проти dropout):
- Географічна доступність
- Соціально-економічні фактори
- Історія дотримання попередніх рецептів
- Кількість візитів та їх частота
Вибір спочатку пацієнтів високої compliance знижує dropout rate та прискорює набір.
Моніторинг під час випробування
Виявлення сигналів безпеки
Real-time аналіз небажаних подій (AE) по мірі надходження даних. Традиційно: монітори вручну переглядають CRF (Case Report Forms). AI:
- Автоматичне кодування AE за MedDRA
- Виявлення потенційних серйозних AE у вихідних документах (NLP)
- Статистичне виявлення сигналу: аналіз диспропорційності (PRR, ROR) для раннього виявлення сигналів безпеки
Виявлення відхилень від протоколу
NLP + rule checking: автоматичне виявлення відхилень від протоколу із даних EMR та ePRO. Приклад: пацієнт прийняв заборонений ліку за даними pharmacy records.
Якість даних ePRO
Electronic Patient-Reported Outcomes: передбачення пропущених/неправдоподібних відповідей. Моделі: часові паттерни, відповіді поза діапазоном, аномальна швидкість відповідей (занадто швидко → не читав запитань).
Підтримка адаптивного дизайну випробувань
Для адаптивних випробувань: Bayesian статистика + симуляції для обґрунтування проміжних рішень (продовжити, змінити, зупинити). AI компонент: швидкі симуляції характеристик експлуатації при різних сценаріях.
Оптимізація мережі сайтів
Передбачення ефективності сайту
Передбачення коефіцієнта набору та якості даних для кожного сайту:
- Історична ефективність на попередніх випробуваннях
- Розмір та якість популяції пацієнтів
- Досвід персоналу
- Інфраструктура (EMR, зв'язок з регулятором)
Вибір сайту став data-driven замість заснованого на особистих зв'язках CRO.
Здійснюваність за країнами
AI аналізує нормативні розписи, розмір пулу пацієнтів, вартість, швидкість затвердження по країнах → оптимальне змішання країн для багатонаціонального випробування.
Синтетичні контрольні групи
Замість традиційної контрольної групи (плацебо) — побудова синтетичної контролі з реальних пацієнтів (RWD - Real World Data), які не отримували дослідження лік. Propensity score matching + ML для максимальної порівнюваності.
Нормативний статус: FDA та EMA приймають синтетичні контролі для орфанних захворювань та прискорених шляхів при певних умовах. Економія: виключення 30–50% учасників контрольної групи = зменшення витрат та етичні проблеми плацебо.
Хронограма розробки AI-системи набору пацієнтів: 3–5 місяців для конкретної терапевтичної області з інтеграцією в 3–5 EMR систем.







