Разработка AI-системы анализа побочных эффектов лекарств
Каждое утверждённое лекарство несёт известные и неизвестные побочные эффекты. AI ускоряет обнаружение неизвестных через анализ масштабных данных, которые не могут быть обработаны вручную.
Источники данных для анализа НПР
Стандартные регуляторные базы
- FAERS (FDA Adverse Event Reporting System): 30M+ отчётов с 1968 года
- EudraVigilance (ЕС): 18M+ электронных отчётов
- VigiBase (ВОЗ): крупнейшая мировая база, 130M+ отчётов
Real World Data (RWD)
- Страховые claims данные: триллионы записей о назначениях и диагнозах
- EHR популяционные датасеты
- Региональные лекарственные регистры
Patient-generated data
- Social media (Twitter, Reddit, health forums)
- Patient apps и wearables
Методы обнаружения НПР
Frequentist disproportionality
Стандарт отрасли: PRR, ROR, chi-squared tests для выявления drug-event combinations с аномально высокой частотой в базах спонтанных отчётов. Автоматизированный мониторинг всей FAERS еженедельно.
Bayesian Signal Detection
BCPNN (ВОЗ), GPS (Empirical Bayes Geometric Mean): более устойчивы к малым числам случаев, чем frequentist методы. EBGM > 2 + ≥3 случаев → сигнал для проверки.
ML на EHR/Claims
Самоконтролируемые дизайны (SCCS - Self-Controlled Case Series): сравнение частоты НПР в период воздействия препарата vs. контрольный период у того же пациента. Убирает confounding by indication.
Ещё мощнее: cohort studies с propensity score matching из миллионов пациентов. Новые препарат A vs. существующий препарат B — какой вызывает больше ССЗ-событий?
Text Mining из литературы
Кo-occurrence analysis в публикациях: препарат и НПР часто упоминаются вместе. NLP извлекает drug-AE пары с sentiment/causality context. Предшествует формальным сигналам в FAERS на 3–18 месяцев.
Network pharmacology
Граф: препарат → мишени → биологические процессы → фенотипы (болезни, НПР). GNN на этом графе предсказывает потенциальные НПР через shared targets с другими препаратами, у которых НПР известны.
Пример: препарат A связывается с target T, который также связывается с препаратом B (известна кардиотоксичность) → потенциальная кардиотоксичность A.
Обнаружение лекарственных взаимодействий
Методы предсказания DDI
Два препарата → взаимодействие → усиление или ослабление эффекта, токсичность. Механизмы:
- CYP450 взаимодействия: один ингибирует метаболизм другого
- Фармакодинамические: аддитивный/синергетический эффект
ML-подходы:
- Matrix factorization: sparse DDI matrix → latent factors → prediction
- GNN на drug similarity/target similarity graphs
- Knowledge graph embedding: TransE, RotatE на фармакологических KG
DrugBank и TWOSIDES датасет → обучение ML → предсказание неизвестных DDI.
Постмаркетинговый мониторинг DDI
EHR: пациенты, одновременно получающие оба препарата + outcome → observational study с appropriate confounding control.
Интерпретабельность для регулятора
Все сигналы требуют медицинской валидации. AI — tool for prioritization, не решение. Output системы:
- Ранжированный список сигналов с доказательной базой
- Поддерживающие отчёты из FAERS/литературы
- Черновик оценки для Medical Safety Officer
Срок разработки: 3–5 месяцев для platform с интеграцией FAERS, EudraVigilance и NLP модулем для литературы.







