AI-система управління стійким розвитком та ESG
ESG-звітність переходить від PR-документів до даних, що аудуються: CSRD (Corporate Sustainability Reporting Directive) з 2024 року вимагає double materiality assessment, а SEC Climate Disclosure Rules - верифіковані Scope 1/2/3 дані. Компанія з 200 постачальниками та 15 виробничими майданчиками фізично не може зібрати та консолідувати ESG-дані вручну без автоматизації.
Автоматизація збору ESG-даних
Головний біль – дані розподілені за 40 джерелами: SCADA енергосистем, ERP (SAP, Oracle), supplier portals, платіжні системи (для розрахунку travel emissions), utility bills. Жодне джерело не має стандартного формату.
ETL-пайплайн для ESG
Apache Airflow для оркестрації. Кожне джерело - окремий DAG з трансформацією в єдину ESG-схему даних (GRI-aligned або ESRS-aligned структура). Зберігання: PostgreSQL або Snowflake з ESG data model (entity: facility, activity_type, period, value, unit, source, confidence_score).
LLM-компонент: автоматична класифікація utility bills та рахунків-фактур за ESG-категоріями (Scope 1/2/3 emissions, water, waste). GPT-4o або Claude 3.5 Sonnet із structured output (JSON schema) - precision 0.91 на тестовому датасеті з 3000 документів vs. 0.67 у rule-based класифікатора.
Розрахунок викидів
Scope 1: прямі спалювання - activity data × emission factor з бази IPCC/DEFRA. Scope 2: закуплена електроенергія × location-based або market-based factor (RE100 compliance). Scope 3: 15 категорій, з яких категорії 1 (purchased goods) та категорії 11 (use of sold products) - найбільш трудомісткі.
ML-завдання для Scope 3 Cat 1: spend-based estimation (витрати постачальника × emission intensity за EEIO таблицям) + фізичні дані там, де доступні. Гібридна модель знижує невизначеність оцінки з ±40% (чистий spend-based) до ±18%.
Моніторинг та аномалії
Energy Management System (EnMS): тимчасові ряди споживання енергії з 15-хвилинною роздільною здатністю. Prophet або N-BEATS для прогнозу baseline consumption. Відхилення > 2σ від прогнозу робочий час — аномалія (витік, неоптимальний режим устаткування, незакриті ворота складу). На виробничому підприємстві 1200 співробітників: система знайшла 14 аномалій за 3 місяці, економія $180K/рік на електроенергії.
Scope 3 Category 4: Upstream transportation
Інтеграція з TMS (Transport Management System): кожне відвантаження → distance × load factor × emission factor (тип транспорту, паливо). ML-оптимізатор маршрутів з ESG-constraint: CO2 - бюджет на відвантаження як hard constraint, cost - objective.
ESG-скоринг постачальників
Supply chain sustainability rating: 200+ постачальників, дані з CDP questionnaires, Ecovadis, Open Databases (Refinitiv, MSCI ESG). XGBoost-класифікатор передбачає ймовірність ESG-інциденту у постачальника (штраф регулятора, скандал, екологічна аварія) на 12-місячному горизонті. AUROC 0,78 на hold-out.
Фічі: CDP disclosure score, галузевий benchmark, GDELT news sentiment (негативні згадки), geographical risk index (Climate Risk Index), розмір компанії, країна.
NLP-моніторинг новин: RSS + NewsAPI → BERT-based sentiment classifier для моніторингу ESG-ризиків у потоці новин. Named Entity Recognition (NER) пов'язує згадки з конкретними постачальниками з реєстру.
Автоматизація ESG-звітності
Генерація звітів
LLM (GPT-4o, Claude) + RAG за внутрішніми ESG-даними: генерація наративних розділів GRI/ESRS звіту зі структурованих даних. Шаблон звіту + таблиці → 80% тексту генерується автоматично, експерт перевіряє та доповнює.
Важливо: LLM не повинен галюцинувати цифри. Архітектура: усі числові claims прив'язані до конкретних записів у БД через citation mechanism — якщо LLM неспроможна послатися на джерело, він включає цифру в текст.
Double Materiality Assessment (CSRD)
Матриця materiality: 2 осі - financial materiality (вплив ESG-факторів на фінанси компанії) та impact materiality (вплив компанії на суспільство/екологію). ML-компонент: кластеризація та пріоритизація ESG-тем на основі stakeholder survey data + industry benchmarks.
Стек
| Слой | Технологии |
|---|---|
| Оркестрация данных | Apache Airflow, dbt |
| Хранение | Snowflake, PostgreSQL |
| Расчёт выбросов | Python, IPCC/DEFRA факторы, pyCO2SYS |
| ML-модели | XGBoost, PyTorch, Hugging Face |
| LLM для отчётов | GPT-4o, Claude 3.5 (Azure/Anthropic API) |
| Мониторинг | Grafana, Apache Flink |
Термін розробки: 4–10 місяців залежно від кількості джерел даних та вимог до охоплення стандартів звітності.







