Разработка AI-системы фармаконадзора Pharmacovigilance AI
Фармаконадзор (ФН) — система мониторинга безопасности лекарственных средств после регистрации. FDA требует от фармкомпаний отслеживания и подачи MedWatch/CIOMS отчётов. AI масштабирует этот процесс с ручного анализа отчётов к автоматической обработке миллионов источников.
Источники сигналов безопасности
Классические источники
- Spontaneous reports (спонтанные сообщения): FAERS (FDA), EudraVigilance (EMA), VigiBase (WHO) содержат миллионы отчётов об НПР
- Клинические испытания: SAE reports
- Медицинская литература: PubMed — тысячи статей ежедневно
Digital и social media мониторинг Twitter/X, patient forums (PatientsLikeMe, DailyStrength, Reddit), health blogs — пациенты часто сообщают о НПР в соцсетях задолго до формальных отчётов.
Исследования показывают: 15–25% НПР, выявленных через social media, не представлены в FAERS. Signal detection из tweets о препаратах: 6–12 месяцев опережение перед формальными базами.
NLP пайплайн для извлечения НПР
Из спонтанных отчётов
ICSR (Individual Case Safety Report) — неструктурированный текст с медицинской терминологией, описками, сокращениями. NLP задачи:
- Named entity recognition: drug names, adverse events (MedDRA coding), outcomes
- Causality extraction: "после приёма → развилось"
- Negation detection: "пациент не отмечал тошноты"
- Attribute linking: к какому препарату относится это НПР?
Fine-tuned BioBERT/ClinicalBERT. Точность MedDRA coding: F1 0.82–0.88.
Из медицинской литературы
Systematic review автоматизация: поиск, screening, extraction данных об НПР из клинических статей. 10,000 статей в месяц → автоматический дайджест новых safety signals.
Из social media
Задача: отличить "аспирин помог от головной боли" (не НПР) от "после аспирина желудочное кровотечение" (НПР). Classifier: report / non-report + drug + AE extraction.
Challenges: informal language, misspellings, non-medical terminology ("жуткая тошнота" = тошнота по MedDRA), false positives (упоминания препарата без НПР).
Signal Detection и Disproportionality Analysis
PRR, ROR, BCPNN
Статистические меры disproportionality: встречается ли данная drug-event комбинация чаще ожидаемого?
- PRR (Proportional Reporting Ratio): если PRR > 2 и число случаев > 3 — потенциальный сигнал
- ROR (Reporting Odds Ratio): аналог odds ratio из case-control
- BCPNN (Bayesian Confidence Propagation Neural Network): байесовский подход, используется ВОЗ
ML-based signal detection
Превосходство над disproportionality: учитывает confounding factors, временные тренды, лекарственные взаимодействия. Sparse matrix factorization, deep learning на FAERS timeseries.
Ранняя детекция: ацетаминофен-гепатотоксичность усилилась бы в 18 месяцев раньше при ML-анализе.
Автоматизация compliance workflow
CIOMS/ICSR автоматическое заполнение
NLP + IA: из входящего отчёта → структурированный E2B(R3) формат для подачи в регуляторные органы. Снижение времени обработки: с 45–90 минут до 5–10 минут с верификацией.
Aggregate reporting
PSURs (Periodic Safety Update Reports): ежегодные/полугодовые отчёты компании в регулятор. AI агрегирует все НПР за период, классифицирует, формирует черновик narrative sections.
Literature monitoring automation
Ежедневный мониторинг PubMed, EMBASE по ключевым словам (препарат + НПР) → classification relevance → очередь для фармаковигилянс-специалиста. 90% нерелевантных публикаций отфильтровывается автоматически.
Regulatory timelines: ICSR serious unexpected AE → подача в FDA в течение 15 дней. Автоматизация критически важна для соблюдения сроков при большом объёме отчётов.
Срок разработки: 4–8 месяцев на NLP-платформу + интеграцию с FAERS/EudraVigilance.







