AI-система розрахунку вуглецевого сліду
Scope 3 emissions - 70-90% вуглецевого сліду типової компанії. Розрахувати їх точно без автоматизації неможливо: категорія 1 (закуплені товари та послуги) потребує даних від сотень постачальників, категорія 11 (використання проданих продуктів) – розуміння патернів споживання клієнтів. Ручний розрахунок щорічно дає похибку 35-50%. ML-пайплайн вважає безперервно з похибкою 12-20%.
Архітектура розрахункового двигуна
Ієрархія методів розрахунку
GHG Protocol допускає три методи для Scope 3 Category 1:
| Метод | Точность | Требования к данным |
|---|---|---|
| Spend-based | ±40% | Расходы + EEIO факторы |
| Average-data | ±25% | Вес/объём закупок + emission intensity |
| Supplier-specific | ±10% | PCF данные от поставщика |
ML-завдання: для кожного рядка закупівель автоматично вибрати найкращий доступний метод та розрахувати emission factor. Класифікатор (LightGBM) визначає метод доступних даних. Якщо від постачальника є PCF – supplier-specific. Якщо є вага – average-data. Інакше spend-based з EXIOBASE 3.8 EEIO таблицями.
Парсинг рахунків-фактур та документів
80% activity data надходить у вигляді PDF-рахунків. Document AI пайплайн: - LayoutLMv3 (Microsoft) - multimodal модель для structured extraction з документів - Видобувані поля: supplier_name, line_item_description, quantity, unit, unit_price, total - NER + класифікація за HS-кодом датасеті рахунків-фактур з 8 галузей
Деплой: Azure Form Recognizer або self-hosted TorchServe. Обробка 10 000 документів на день на 2×A10G GPU, latency 1.8 с на документ.
Розрахунок Scope 1 та Scope 2
Scope 1: прямі викиди
Джерела: спалювання палива (котли, генератори, корпоративний автотранспорт), технологічні процеси (зварювання, хімічні реакції), виток холодоагентів (F-gases). SCADA/EMS інтеграція: споживання палива з лічильників → множення IPCC AR5/AR6 emission factors.
ML-аномалія: якщо споживання газу котельні у вихідний день >150% середнього вихідного дня минулого року — alert. LSTM Autoencoder на годинникових даних, навчений на 2 роки нормальних показань.
Scope 2: закуплена енергія
Location-based метод: споживання кВт·год × регіональний emission factor (IEA, Ember, AIB для Європи). Market-based: Guarantees of Origin (GO), RECs, Power Purchase Agreements - віднімаються з розрахунку.
Автоматизація: інтеграція з власним кабінетом енергозбутових компаній (API або web scraping) для щомісячного оновлення consumption data без ручного введення.
Прогнозування та сценарний аналіз
Net-zero pathway моделювання
Компанія ставить за мету SBTi (Science Based Targets initiative) — знизити Scope 1+2 на 46% до 2030. ML-компонент: Time-Series Forecasting (EV conversion schedule) - Supplier engagement (top 20 з викидів → вимога PCF даних)
Для кожного сценарію: NPV декарбонізаційних інвестицій vs. cost of carbon (EU ETS ціна + regulatory risk).
Внутрішній carbon pricing
Shadow carbon price ($50–150/tCO2e) застосовується до інвестиційних рішень. ML-модуль автоматично розраховує carbon cost для capex проектів з ERP даних (обладнання → lifecycle emissions по Ecoinvent базі).
Інтеграція з ринками вуглецю
Верифікація carbon credits: перевірка якості offsets на базі Gold Standard, VCS (Verra). ML-класифікатор оцінює ризик double-counting та permanence ризик лісових проектів (satellite imagery + деградація лісу через NDVI time series).
Автоматичний реєстровий облік: API інтеграція з Xpansiv CBL, Gold Standard Registry для відстеження retire/cancel операцій з credits.
Стек
Зберігання: Snowflake із dbt-трансформаціями для ESG-моделі. Обчислення: Python (pandas, pyCO2SYS для marine emissions). ML: scikit-learn, LightGBM, PyTorch для time-series. Document AI: LayoutLMv3, Hugging Face Transformers. Оркестрація: Apache Airflow.
Термін розробки: 3-6 місяців для базового розрахункового двигуна з автоматичним імпортом даних. Повний Scope 1-2-3 із document AI та сценарним аналізом: 6–10 місяців.







