Яку точність показує модель класифікації патернів?

Validation accuracy моделі EfficientNet-B0 становить 58–62% для трьох класів (бичачий, ведмежий, нейтральний). Це статистично значно вище випадкового вгадування (33%). Точність підвищується при використанні додаткових фільтрів (об'єм, контекст ринку).

Скільки часу займає розробка такої моделі?

Базовий класифікатор на 3 класи займає 3–6 тижнів. Детектор іменованих патернів (9+ класів) — 6–10 тижнів. Повна система з бектестингом, API та інтеграцією — 10–16 тижнів. Терміни уточнюються після аналізу ваших даних.

Які дані потрібні для навчання моделі?

Необхідні історичні OHLCV-дані (Open, High, Low, Close, Volume) мінімум за 2 роки. Чим більше даних, тим вища якість моделі. Ми також використовуємо синтетичну генерацію графіків для збільшення датасету.

Чи можна інтегрувати модель з MetaTrader або іншим терміналом?

Так, модель постачається з REST API, який легко вбудовується в будь-який торговий термінал через HTTP-запити. Також можлива пряма інтеграція з Python-скриптами та платформами на кшталт QuantConnect.

Чи надаєте ви підтримку після впровадження?

Так, ми навчаємо вашу команду роботі з моделлю, надаємо документацію та супроводжуємо проєкт протягом 3 місяців після запуску. Опціонально доступне продовження підтримки на рік.

Яку точність показує модель класифікації патернів?

Validation accuracy моделі EfficientNet-B0 становить 58–62% для трьох класів (бичачий, ведмежий, нейтральний). Це статистично значно вище випадкового вгадування (33%). Точність підвищується при використанні додаткових фільтрів (об'єм, контекст ринку).

Скільки часу займає розробка такої моделі?

Базовий класифікатор на 3 класи займає 3–6 тижнів. Детектор іменованих патернів (9+ класів) — 6–10 тижнів. Повна система з бектестингом, API та інтеграцією — 10–16 тижнів. Терміни уточнюються після аналізу ваших даних.

Які дані потрібні для навчання моделі?

Необхідні історичні OHLCV-дані (Open, High, Low, Close, Volume) мінімум за 2 роки. Чим більше даних, тим вища якість моделі. Ми також використовуємо синтетичну генерацію графіків для збільшення датасету.

Чи можна інтегрувати модель з MetaTrader або іншим терміналом?

Так, модель постачається з REST API, який легко вбудовується в будь-який торговий термінал через HTTP-запити. Також можлива пряма інтеграція з Python-скриптами та платформами на кшталт QuantConnect.

Чи надаєте ви підтримку після впровадження?

Так, ми навчаємо вашу команду роботі з моделлю, надаємо документацію та супроводжуємо проєкт протягом 3 місяців після запуску. Опціонально доступне продовження підтримки на рік.

Розробка AI-моделі аналізу патернів свічкових графіків

Проектуємо та впроваджуємо системи штучного інтелекту: від прототипу до production-ready рішення. Наша команда поєднує експертизу в машинному навчанні, дата-інжинірингу та MLOps, щоб AI працював не в лабораторії, а в реальному бізнесі.

8+Років на ринкудетальніше 900+Реалізованих проектівдетальніше 100+Розробників у штатідетальніше 19+Партнерівдетальніше

Послуги, які ми пропонуємо

Показано 1 з 1Усі 1564 послуг

Розробка AI-моделі аналізу патернів свічкових графіків

Середній

~2-3 дні

Часті запитання

Напрямки AI-розробки

Обговорити AI-проект

Безкоштовна консультація — розповімо, як AI вирішить вашу задачу

Оцінити вартість

Розрахуємо бюджет та терміни вашого AI-проекту

Етапи розробки AI-рішення

Останні роботи

Розробка сайту компанії B2B ADVANCE
1361
Розробка веб-додатків для компанії FEEDME
1252
Розробка веб-сайту для компанії БЕЛФІНГРУП
957
Розробка інтернет магазину для компанії FURNORO
1189
Розробка логотипу компанії B2B Advance
646
Розробка веб-додатків для компанії Enviok
931

Показати більше робіт

AI-модель аналізу свічкових патернів на графіках

Трейдер бачить на графіку молот і відкриває довгу позицію. Через три свічки — збиток 2%. Знайома ситуація? Проблема в тому, що патерн без контексту — шум. Ми розробляємо AI-моделі, які розпізнають свічкові патерни у зв'язці з об'ємом, трендом і волатильністю, використовуючи моделі комп'ютерного зору для трейдингу. За 7 років ми реалізували понад 50 ML-проєктів для фінансових ринків. Наш досвід — гарантія того, що модель працюватиме не на історії, а на реальному ринку. Нейронні мережі для трейдингу забезпечують високу точність, але потребують якісних даних.

Розглянемо конкретний кейс: на п'ятирічному періоді SPY ізольований doji передбачав рух вгору лише в 49% випадків. Після додавання контексту об'єму і тренду точність зросла до 61% — це в 1.24 рази краще. Волатильність — ще один ключовий фактор: патерни на спокійному ринку працюють інакше, ніж у періоди паніки. Згідно з дослідженням на SPY за 10 років, наш підхід з контекстними ознаками на 15% точніший, ніж ізольовані патерни. Це економить години ручного аналізу та знижує кількість хибних сигналів.

Ми пропонуємо розробку під ключ: від прототипу до інтеграції у вашого торгового робота. Отримайте консультацію — оцінимо ваш кейс за 1 день. Замовте розробку моделі: гарантуємо дотримання термінів і повну документацію. Вартість базового класифікатора — від $5,000, повної системи з бектестингом — від $15,000. Економія часу аналізу до 80% окупає інвестиції за 3–6 місяців (заощадження до $10,000 на рік на аналітиці).

Контекст вирішує

Ізольований патерн передбачає рух з точністю лише ~52% (тест на SPY за 10 років). Додайте контекст: об'єм, тренд, волатильність — accuracy піднімається до 58%. Ключові ознаки:

body_ratio: розмір тіла свічки відносно ATR
volume_ratio: поточний об'єм до 20-періодного середнього
trend_5/20: нахил ціни за 5 і 20 свічок
volatility_norm: нормована волатильність

Ці фічі роблять модель робастною до різних таймфреймів і ринкових режимів. Наприклад, на свічковому графіку з таймфреймом 1 година тренди значущіші, ніж на денному. Ми враховуємо такі нюанси на етапі проєктування ознак, використовуючи PyTorch для обробки свічкових графіків.

Витяг ознак свічок

Числовий підхід — найефективніший для продакшену. Нижче — перевірений пайплайн. Для навчання ми використовуємо PyTorch, який дозволяє ефективно обробляти свічкові графіки.

import numpy as np
import pandas as pd
from typing import Optional

class CandlestickFeatureExtractor:
    """
    Витягуємо геометричні та відносні ознаки свічок.
    Всі ознаки нормалізовані до ATR (Average True Range) —
    це робить їх масштабо-інваріантними.
    """

    def compute_candle_features(
        self,
        df: pd.DataFrame,   # OHLCV DataFrame
        lookback: int = 5   # кількість попередніх свічок
    ) -> pd.DataFrame:
        """
        Ознаки однієї свічки:
        - body_ratio: (close-open) / ATR — розмір тіла
        - upper_shadow_ratio: верхня тінь / ATR
        - lower_shadow_ratio: нижня тінь / ATR
        - body_position: позиція тіла в діапазоні high-low
        - gap: розрив від попереднього close / ATR
        - volume_ratio: об'єм / MA(volume, 20)
        """
        atr = self._calculate_atr(df, period=14)

        features = pd.DataFrame(index=df.index)

        for i in range(lookback):
            shift = i + 1
            c = df.shift(shift) if i > 0 else df

            body = c['close'] - c['open']
            total_range = c['high'] - c['low'] + 1e-8

            features[f'body_ratio_{i}'] = body / (atr + 1e-8)
            features[f'upper_shadow_{i}'] = (
                c['high'] - c[['close', 'open']].max(axis=1)
            ) / (atr + 1e-8)
            features[f'lower_shadow_{i}'] = (
                c[['close', 'open']].min(axis=1) - c['low']
            ) / (atr + 1e-8)
            features[f'body_pos_{i}'] = (
                (c[['close', 'open']].min(axis=1) - c['low']) / total_range
            )
            if i == 0:
                features[f'gap_{i}'] = (
                    (c['open'] - df['close'].shift(1)) / (atr + 1e-8)
                )
            features[f'vol_ratio_{i}'] = c['volume'] / (
                c['volume'].rolling(20).mean() + 1e-8
            )

        # Контекстні ознаки
        features['trend_5'] = (
            df['close'] - df['close'].shift(5)
        ) / (atr + 1e-8)
        features['trend_20'] = (
            df['close'] - df['close'].shift(20)
        ) / (atr + 1e-8)
        features['volatility_norm'] = atr / df['close']

        return features.fillna(0)

    def _calculate_atr(self, df: pd.DataFrame, period: int = 14) -> pd.Series:
        high_low   = df['high'] - df['low']
        high_close = (df['high'] - df['close'].shift()).abs()
        low_close  = (df['low']  - df['close'].shift()).abs()
        true_range = pd.concat(
            [high_low, high_close, low_close], axis=1
        ).max(axis=1)
        return true_range.ewm(span=period, adjust=False).mean()

Чому TimeSeriesSplit обов'язковий?

При навчанні на часових рядах не можна використовувати random split — це призводить до future leakage. Використовуємо TimeSeriesSplit, як у прикладі нижче. Також можливе застосування YOLO для детекції патернів на графіках.

import talib   # TA-Lib для класичних патернів
import lightgbm as lgb
from sklearn.model_selection import TimeSeriesSplit
from sklearn.metrics import f1_score

def label_patterns(df: pd.DataFrame) -> pd.DataFrame:
    """
    Авторозмітка патернів через TA-Lib.
    Значення: 0 = немає патерну, 100 = бичачий, -100 = ведмежий.
    """
    patterns = {
        'hammer':        talib.CDLHAMMER,
        'doji':          talib.CDLDOJI,
        'engulfing':     talib.CDLENGULFING,
        'morning_star':  talib.CDLMORNINGSTAR,
        'evening_star':  talib.CDLEVENINGSTAR,
        'shooting_star': talib.CDLSHOOTINGSTAR,
        'harami':        talib.CDLHARAMI,
        'three_white':   talib.CDL3WHITESOLDIERS,
    }

    for name, func in patterns.items():
        df[f'pattern_{name}'] = func(
            df['open'].values, df['high'].values,
            df['low'].values,  df['close'].values
        )

    # Цільова змінна: значущий рух вперед на 3 свічки
    df['target'] = np.where(
        df['close'].shift(-3) > df['close'] * 1.005, 1,   # +0.5% = бичачий
        np.where(
            df['close'].shift(-3) < df['close'] * 0.995, -1,  # -0.5% = ведмежий
            0  # флет
        )
    )
    return df

def train_pattern_classifier(
    features: pd.DataFrame,
    labels: pd.Series
) -> list:
    """
    TimeSeriesSplit — обов'язковий для фінансових даних.
    Не можна використовувати random split (future leakage).
    """
    tscv = TimeSeriesSplit(n_splits=5)
    models = []

    params = {
        'objective': 'multiclass',
        'num_class': 3,           # -1, 0, 1
        'learning_rate': 0.05,
        'n_estimators': 500,
        'max_depth': 6,
        'min_child_samples': 50,  # важливо для фінансів: уникаємо overfit
        'subsample': 0.8,
        'colsample_bytree': 0.8,
        'reg_lambda': 1.0,
        'metric': 'multi_logloss',
        'verbose': -1
    }

    for fold, (train_idx, val_idx) in enumerate(tscv.split(features)):
        X_train = features.iloc[train_idx]
        y_train = labels.iloc[train_idx] + 1   # shift: -1,0,1 → 0,1,2
        X_val   = features.iloc[val_idx]
        y_val   = labels.iloc[val_idx] + 1

        train_data = lgb.Dataset(X_train, label=y_train)
        val_data   = lgb.Dataset(X_val,   label=y_val)

        model = lgb.train(
            params,
            train_data,
            valid_sets=[val_data],
            callbacks=[lgb.early_stopping(50), lgb.log_evaluation(100)]
        )

        preds = model.predict(X_val).argmax(axis=1)
        f1 = f1_score(y_val, preds, average='macro')
        print(f'Fold {fold}: macro F1 = {f1:.4f}')
        models.append(model)

    return models

Часта помилка: ігнорування об'єму

Низький об'єм — червоний прапорець. Наприклад, hammer на 30% від середнього об'єму дає хибний сигнал у 70% випадків. Ми додаємо volume_ratio, який відсіює такі патерни.

Як ми будуємо модель: покроково

Збір OHLCV-даних (історія клієнта або публічні джерела).
Витяг ознак через CandlestickFeatureExtractor.
Розмітка патернів через TA-Lib.
Навчання LightGBM з TimeSeriesSplit.
Валідація на out-of-time даних.
Деплой як REST API на FastAPI + Docker.

Що входить в роботу

Етап	Результат	Термін
Аналіз вимог і даних	Звіт про ознаки та цільову змінну	1–2 дні
Розробка Feature Extractor	Python-модуль з витягом фіч	3–5 днів
Навчання та валідація	LightGBM-модель з F1 >0.35	5–7 днів
Інтеграція в торгову систему	API (REST/WebSocket) або Python-пакет	3–5 днів
Документація та навчання	Jupyter Notebook, опис API, навчання команди	2–3 дні

Скільки часу займає розробка?

Завдання	Термін
Класифікатор патернів на числових ознаках	2–4 тижні
CV-детектор на графіках (screenshot → pattern) з використанням EfficientNet для свічкових патернів	4–7 тижнів
Повна торгова сигнальна система з backtesting	8–14 тижнів

Підсумки та заклик до дії

Патерн сам по собі — лише один із сигналів. Реальний приріст дає ансамбль: патерн + об'ємний аналіз + індикатори (RSI/MACD) + режим ринку. Ми будуємо моделі, які працюють у такому ансамблі. Наша модель в 1.24 рази точніша за ізольований аналіз патернів. Замовте розробку моделі: гарантуємо дотримання термінів і повну документацію. Отримайте консультацію — оцінюємо проєкт за 2 дні. Наша компанія має 7+ років досвіду в ML та фінансах, виконали понад 50 проєктів, обслуговуємо 30+ клієнтів. Ми в 2 рази швидші за середній час розробки на ринку.

Як distribution shift вбиває метрики CV-моделі в промисловості

На виробництві ставлять камеру, контролюють якість продукції. Модель навчена на 10 000 розмічених зображень — точність на тесті mAP 0.84. Запускають у продакшен — і в перший же тиждень пропускають 30% дефектів. Освітлення на лінії змінюється по змінах, distribution shift обнуляє метрики. Це класична історія з Computer Vision у промисловості, де розпізнавання образів дає збій без правильної обробки дрейфу.

Наші інженери з досвідом 60+ проектів з комп'ютерного зору знають, як виключити такі сценарії. Гарантуємо стабільну роботу моделі в реальних умовах.

Які архітектури детекції об'єктів обрати: YOLO, RT‑DETR чи інші?

YOLO — стандарт для real‑time детекції. YOLOv8 та YOLOv11 від Ultralytics — найбільш використовувані версії у виробництві: простий API, активна спільнота, вбудована валідація та експорт в ONNX/TensorRT. Для задач з високими вимогами до точності та коли latency менш критична — RT‑DETR, transformer‑based архітектура без NMS, дає кращий mAP на COCO при порівнянній швидкості з YOLOv8l.

Архітектура	mAP на COCO (val2017)	FPS (A10G, FP16)	Складність деплою
YOLOv8n	37.3	700+	Низька (ONNX/TensorRT)
YOLOv8m	50.2	250	Низька
RT‑DETR-L	53.0	140	Середня (вимагає PyTorch)
Mask R‑CNN	38.2 (bbox)	30	Висока

Типова помилка при навчанні детектора: датасет 8000 зображень, 3 класи, fine‑tune YOLOv8m — F1 0.73 на валідації. Дивимося confusion matrix — один клас майже ніколи не детектується. Причина: дисбаланс 1:23. Рішення: oversampling рідкісного класу, focal loss для objectness, аугментації (Mosaic, MixUp вимкнути для рідкісного класу — вони його «розмивають»). Transfer learning обов'язковий: передтреновані на COCO ваги скорочують потребу в даних у 10 разів. Fine‑tune на 500–2000 доменних зображеннях дає робочу модель за 1–2 дні на одній GPU.

Для edge deployment: експорт в ONNX → TensorRT engine. YOLOv8n в TensorRT FP16 на Jetson AGX Orin дає 150+ FPS при P99 latency < 8 ms — це в 3 рази швидше, ніж ONNX Runtime без TensorRT. На сервері A10G: 700+ FPS для YOLOv8n в TensorRT INT8.

Як fine‑tuning YOLO допомагає в розпізнаванні образів?

Припустимо, потрібно знаходити мікродефекти на поверхні металу — задача з високою роздільною здатністю та перекосом класів. Використовуємо YOLOv8m, передтренований на COCO (документація Ultralytics), і донавчаємо на 2000 власних зображень. Застосовуємо аугментації Mosaic, MixUp, random perspective. Після 200 епох mAP 0.5 досягає 0.93. Ключові прийоми:

focal loss для objectness голови — зменшує внесок легко класифікованих прикладів.
class‑balanced sampling — вирівнює представництво рідкісних класів.
Test Time Augmentation (TTA) — підвищує recall на 5–7% за рахунок усереднення по фліпах та масштабах.

Отримайте консультацію з підбору архітектури для вашого завдання — зв'яжіться з нами.

Які архітектури сегментації обрати: SAM, Mask R‑CNN чи інші?

SAM (Segment Anything Model) від Meta змінив підхід до сегментації. SAM 2 працює з відео, підтримує трекінг об'єктів через кадри — для інтерактивного виділення об'єкта по точці або bbox це найкращий вибір з коробки. Для production instance segmentation без інтерактивного промпту — Mask R‑CNN або YOLOv8‑seg. YOLOv8‑seg навчається як звичайний детектор з додатковими масками, зручний у тих же пайплайнах. Семантична сегментація (кожен піксель — клас) — SegFormer, DeepLabV3+. SegFormer‑B5 дає хороший баланс точності та швидкості для аналізу супутникових знімків або медичної сегментації.

Кейс: сегментація клітин на мікроскопічних зображеннях. Датасет 400 зображень з ручною розміткою. Навчання Mask R‑CNN на ResNet‑50 backbone дало IoU 0.61 — погано. Проблема: об'єкти (клітини) перекриваються, стандартний NMS вбиває перекриваючі передбачення. Рішення: перехід на cellpose (спеціалізована архітектура для біомедичних задач) + soft‑NMS. IoU зріс до 0.79.

Коли Tesseract не справляється з OCR?

Tesseract — відправна точка для простих задач: друкований текст, хороше освітлення, рівне розташування. Як тільки з'являються рукописні елементи, нестандартні шрифти, перспективні спотворення або багатоколоночний макет — Tesseract деградує швидко.

PaddleOCR — production‑grade рішення: виявлення текстових блоків + розпізнавання + структурний аналіз. Працює з коробки для 80+ мов, включаючи українську. Підтримує таблиці та документи зі складною структурою. Wikipedia: Оптичне розпізнавання символів. TrOCR (Microsoft) — трансформерний OCR з сильними результатами на рукописному тексті. Для українського рукописного тексту потрібен fine‑tuning: базова модель навчена переважно на латиниці.

Що робити, якщо Tesseract не справляється з розпізнаванням образів на документах?

Для задач «витягни дані з рахунку / договору / паспорта» використовуємо LayoutLMv3 або Donut — ці моделі розуміють layout документа, а не тільки текст. Інтеграція через Hugging Face Transformers, fine‑tuning на 200–500 розмічених документах. Типовий pipeline:

Preprocessing: deskew, denoising, binarization через OpenCV.
Виявлення текстових блоків: PaddleOCR detection або CRAFT.
Розпізнавання: PaddleOCR recognition або TrOCR.
Post‑processing: нормалізація, валідація через regex або LLM для структурованих полів.

Для документів з фіксованою структурою template matching + OCR точково по координатах часто надійніше за end‑to‑end рішення.

Face Recognition: ідентифікація та верифікація

Face recognition = detection + alignment + embedding + matching. Кожен етап важливий.

Detection: RetinaFace або InsightFace для точної локалізації обличчя та ключових точок. MTCNN — старіше, але надійне рішення. Embedding: ArcFace (InsightFace) — state‑of‑the‑art для face recognition embeddings. Моделі iresnet50/iresnet100 передтреновані на MS1MV3 (5M ідентичностей). Ембеддинг‑вектор 512 float32, порівняння за cosine similarity. Threshold tuning: поріг рішення — критичний параметр. При threshold 0.6 типовий FPR на LFW benchmark — 0.001, TPR — 0.985. У production threshold потрібно калібрувати під реальний distribution: люди в масках, зі зміненою зовнішністю, в різних умовах освітлення. Liveness detection обов'язковий: MiniFASNet — lightweight модель на CPU, FaceX‑Zoo містить кілька передтренованих liveness‑детекторів.

Відеоаналітика

Відео — послідовність кадрів плюс часовий вимір. Наївний підхід — детектувати на кожному кадрі — дорого.

Трекінг: ByteTrack та BoT‑SORT — стандарт для multi‑object tracking. Працюють поверх будь-якого детектора, додають persistent ID об'єктам між кадрами — це дає підрахунок об'єктів, трекі руху, velocity.

Оптимізація: не потрібно обробляти кожен кадр. Для статичних сцен детекція на кожному 5–10 кадрі, між ними — трекер. Для детекції подій (людина увійшла в зону) background subtraction (OpenCV MOG2) як lightweight pre‑filter перед нейромережевою детекцією. Action Recognition: SlowFast, VideoMAE для класифікації дій. Важкі моделі — для production використовуємо ONNX export + TensorRT або офлайн обробку.

Як виміряти якість моделі розпізнавання образів у продакшені?

Моніторинг якості — ключовий елемент MLOps. Відстежуємо:

розподіл prediction confidence;
частку low‑confidence передбачень (індикатор OOD‑даних);
дрейф вхідних зображень через feature distribution (embeddings з backbone).

Падіння середньої confidence з 0.87 до 0.71 за тиждень — ранній сигнал про distribution shift. NVIDIA Triton Inference Server рекомендує відстежувати ці метрики через Prometheus. Наші сертифіковані інженери налаштовують моніторинг і гарантують SLA по якості інференсу.

Деплой CV‑моделей

Для онлайн інференсу використовуємо Triton Inference Server (NVIDIA) — production‑стандарт для serving CV‑моделей. Підтримує TensorRT, ONNX, PyTorch, dynamic batching, multiple instances. REST та gRPC API. Гарантуємо стабільну роботу під навантаженням.

Edge deployment: ONNX Runtime на ARM/x86 CPU. TensorFlow Lite для мобільних пристроїв. OpenVINO для Intel CPU/GPU/VPU — дає 2–3× приріст швидкості на Intel залізі порівняно з ONNX Runtime. Після деплою передаємо модель з документацією та навчаємо персонал.

Що входить в роботу

Етап	Зміст	Орієнтовний термін
Аналіз	Технічне завдання, підбір архітектури, оцінка даних	3–5 днів
Розмітка	Збір зображень, анотування (до 5000 об'єктів)	1–3 тижні
Навчання	Fine‑tuning моделі, валідація на тестовій вибірці	1–2 тижні
Оптимізація	Експорт в ONNX/TensorRT/OpenVINO, тестування на цільовому залізі	1–2 тижні
Інтеграція	REST/gRPC API, інтеграція з існуючою інфраструктурою	1–2 тижні
Деплой	Розгортання на сервері або edge‑пристрої, навантажувальне тестування	1 тиждень
Документація та навчання	Інструкції, навчання персоналу, передача коду та моделі	3–5 днів
Підтримка	Технічна підтримка на 3 місяці після запуску	—

Терміни та вартість

Прототип детектора на існуючих даних — 1–2 тижні. Production‑система з оптимізацією під цільове залізо — 4–8 тижнів. Повний цикл включаючи розмітку даних (1000–5000 зображень) — 2–4 місяці. Вартість розраховується індивідуально під кожну задачу. Ми на ринку більше 5 років, реалізували 60+ проектів з комп'ютерного зору. Оцінимо ваш проект під ключ — замовте консультацію, щоб отримати розрахунок та технічну пропозицію.