В каких случаях выбирать TimescaleDB, а когда ClickHouse?

TimescaleDB подходит, если нужны ACID-транзакции, частые обновления и JOIN с реляционными данными (например, балансы кошельков). ClickHouse выигрывает для аналитики по большим диапазонам дат (тысячи миллиардов строк) с агрегациями — скорость GROUP BY в десятки раз выше. Мы часто комбинируем обе СУБД: TimescaleDB для горячих операционных данных, ClickHouse как аналитический warehouse.

Как ускорить запросы к старым данным в TimescaleDB?

Используйте continuous aggregates — материализованные представления, которые обновляются инкрементально. Например, OHLCV по минутам пересчитывается каждые 60 секунд. Старые чанки компрессируются с коэффициентом 10–20x без потери возможности фильтрации по времени или символу. Настройте политику компрессии для данных старше 7 дней.

Какая оптимальная стратегия вставки в ClickHouse для парсинга?

ClickHouse оптимизирован для батчей 10 000–100 000 строк. Накапливайте данные в буфере и сбрасывайте 1–2 раза в секунду. Используйте ReplacingMergeTree для дедупликации при повторных вставках. Для агрегатов — SummingMergeTree. Указывайте ORDER BY по полям фильтрации (symbol, time) — это одновременно первичный ключ и порядок хранения.

Как обеспечить отказоустойчивость системы хранения?

Для TimescaleDB используйте репликацию PostgreSQL (streaming replication). ClickHouse поддерживает multi-shard кластеры с репликацией на уровне таблиц (ReplicatedMergeTree). Настраивайте точки восстановления и политики ретенции. Мы включаем мониторинг через Grafana: метрики размера таблиц, количества партиций, latency вставки.

Что входит в типовой проект по внедрению?

У нас входит: аудит текущих данных и паттернов запросов, проектирование схемы (hypertable или MergeTree), настройка партиционирования/компрессии, миграция существующих данных, написание ETL-скриптов, интеграция с мониторингом (Grafana + alerting), документация, обучение команды. Сроки: 1–3 недели в зависимости от объёма.

В каких случаях выбирать TimescaleDB, а когда ClickHouse?

TimescaleDB подходит, если нужны ACID-транзакции, частые обновления и JOIN с реляционными данными (например, балансы кошельков). ClickHouse выигрывает для аналитики по большим диапазонам дат (тысячи миллиардов строк) с агрегациями — скорость GROUP BY в десятки раз выше. Мы часто комбинируем обе СУБД: TimescaleDB для горячих операционных данных, ClickHouse как аналитический warehouse.

Как ускорить запросы к старым данным в TimescaleDB?

Используйте continuous aggregates — материализованные представления, которые обновляются инкрементально. Например, OHLCV по минутам пересчитывается каждые 60 секунд. Старые чанки компрессируются с коэффициентом 10–20x без потери возможности фильтрации по времени или символу. Настройте политику компрессии для данных старше 7 дней.

Какая оптимальная стратегия вставки в ClickHouse для парсинга?

ClickHouse оптимизирован для батчей 10 000–100 000 строк. Накапливайте данные в буфере и сбрасывайте 1–2 раза в секунду. Используйте ReplacingMergeTree для дедупликации при повторных вставках. Для агрегатов — SummingMergeTree. Указывайте ORDER BY по полям фильтрации (symbol, time) — это одновременно первичный ключ и порядок хранения.

Как обеспечить отказоустойчивость системы хранения?

Для TimescaleDB используйте репликацию PostgreSQL (streaming replication). ClickHouse поддерживает multi-shard кластеры с репликацией на уровне таблиц (ReplicatedMergeTree). Настраивайте точки восстановления и политики ретенции. Мы включаем мониторинг через Grafana: метрики размера таблиц, количества партиций, latency вставки.

Что входит в типовой проект по внедрению?

У нас входит: аудит текущих данных и паттернов запросов, проектирование схемы (hypertable или MergeTree), настройка партиционирования/компрессии, миграция существующих данных, написание ETL-скриптов, интеграция с мониторингом (Grafana + alerting), документация, обучение команды. Сроки: 1–3 недели в зависимости от объёма.

Система хранения парсинг-данных: TimescaleDB vs ClickHouse

Проектируем и разрабатываем блокчейн-решения полного цикла: от архитектуры смарт-контрактов до запуска DeFi-протоколов, NFT-маркетплейсов и криптобирж. Аудит безопасности, токеномика, интеграция с существующей инфраструктурой.

8+Лет на рынкеподробнее 900+Реализованных проектовподробнее 100+Разработчиков в штатеподробнее 19+Партнеровподробнее

Услуги, которые мы предлагаем

Показано 1 из 1Все 1305 услуг

Система хранения парсинг-данных: TimescaleDB vs ClickHouse

Средний

~3-5 дней

Часто задаваемые вопросы

Направления блокчейн-разработки

Обсудить блокчейн-проект

Бесплатная консультация — расскажем, как блокчейн решит вашу задачу

Оценить стоимость

Рассчитаем бюджет и сроки вашего блокчейн-проекта

Этапы блокчейн-разработки

Последние работы

Разработка сайта компании B2B ADVANCE
1360
Разработка веб-приложения для компании FEEDME
1251
Разработка веб-сайта для компании БЕЛФИНГРУПП
957
Разработка интернет магазина для компании FURNORO
1188
Разработка логотипа компании B2B Advance
646
Разработка веб-приложения для компании Enviok
929

Показать больше работ

Сырые данные из блокчейна или бирж накапливаются быстро — десятки гигабайт в день для активно парсимых источников. Типичный проект: парсинг 5000 кошельков каждые 10 секунд — это 43 млн строк в день. Через полгода объём достигает 7.8 млрд строк. Хранить это в обычном PostgreSQL в одной таблице означает деградацию запросов через несколько месяцев. Мы проектируем системы хранения на TimescaleDB или ClickHouse под конкретные паттерны запросов и объёмы. Выбор между этими базами — прагматический, не религиозный. Стоимость хранения после компрессии снижается на 80%, а запросы ускоряются в десятки раз. Наши клиенты часто сталкиваются с ростом объёмов после трёх месяцев эксплуатации: запросы начинают выполняться десятки секунд, стоимость хранения растёт. Мы предлагаем архитектуру, которая масштабируется линейно — добавляем новые ноды без даунтайма. Получите консультацию по выбору СУБД для ваших данных.

Когда выбирать TimescaleDB, а когда ClickHouse?

TimescaleDB — расширение PostgreSQL. Добавляет hypertables (автоматическое партиционирование по времени), continuous aggregates (инкрементальные материализованные представления), compression. Вы остаётесь в PostgreSQL-экосистеме: стандартный SQL, ACID транзакции, JOIN с обычными таблицами, привычный инструментарий.

ClickHouse — колоночная OLAP база. Данные хранятся по столбцам, что даёт огромный выигрыш при агрегациях по подмножеству колонок. Скорость GROUP BY и SUM на миллиардах строк — на порядок выше PostgreSQL. Слабая сторона: нет транзакций, UPDATE/DELETE — дорогие операции, JOIN работает иначе.

Критерий	TimescaleDB	ClickHouse
Паттерн запросов	Сложные JOIN, OLTP+OLAP mix	Аналитика, агрегации по большим диапазонам
Запись	INSERT в транзакции, UPSERT	Batch insert, eventual дедупликация
Чтение точечное	Быстро (B-tree индексы)	Медленнее (нет эффективных точечных)
Аналитика	Хорошо	Намного быстрее
Обновления	Стандартный UPDATE	Дорого (ReplacingMergeTree)
Операционная сложность	Умеренная	Выше
Объём данных	До ~1TB эффективно	Эффективно с 100GB+

Рекомендация для парсинга on-chain данных:

TimescaleDB — если данные нужны для продуктовой логики (балансы, позиции, аккаунты), есть JOIN с реляционными данными, нужны ACID-гарантии
ClickHouse — если это аналитический pipeline (trading сигналы, агрегированная статистика, исторический анализ), запросы работают с большими диапазонами дат

В production часто комбинируют: TimescaleDB для горячих/операционных данных + ClickHouse для аналитического warehouse. Такая связка даёт до 90% экономии на хранении холодных данных. Получите консультацию — мы поможем выбрать оптимальную СУБД.

Как настроить компрессию в TimescaleDB?

Базовая концепция: обычная таблица PostgreSQL превращается в hypertable — под капотом создаются чанки (partitions) по временному измерению. Каждый чанк — отдельный файл, старые чанки можно компрессировать или архивировать.

CREATE TABLE trades (
  time        TIMESTAMPTZ NOT NULL,
  exchange    TEXT NOT NULL,
  symbol      TEXT NOT NULL,
  price       NUMERIC(20, 8) NOT NULL,
  volume      NUMERIC(20, 8) NOT NULL,
  side        CHAR(4) NOT NULL
);
SELECT create_hypertable('trades', 'time', chunk_time_interval => INTERVAL '1 day');
CREATE INDEX ON trades (symbol, time DESC);

Continuous aggregates заменяют дорогие realtime GROUP BY на инкрементальные материализованные представления. Теперь запрос SELECT * FROM trades_1m WHERE bucket > NOW() - INTERVAL '1 day' — это SELECT из материализованного представления, не агрегация по raw данным.

Старые данные компрессируются почти без потери функциональности (кроме UPDATE/DELETE):

ALTER TABLE trades SET (
  timescaledb.compress,
  timescaledb.compress_orderby = 'time DESC',
  timescaledb.compress_segmentby = 'symbol'
);
SELECT add_compression_policy('trades', INTERVAL '7 days');

Типичная степень сжатия для биржевых данных: 10–20x. 100GB raw -> 5–10GB compressed. Экономия на хранении достигает 80% для данных старше месяца. Ознакомьтесь с документацией TimescaleDB для деталей.

Архитектура ClickHouse

Выбор engine — критический момент. Для парсинг-данных чаще всего используются MergeTree, ReplacingMergeTree (дедупликация) и SummingMergeTree (агрегаты).

CREATE TABLE trades (
  time      DateTime64(3),
  exchange  LowCardinality(String),
  symbol    LowCardinality(String),
  price     Decimal(20, 8),
  volume    Decimal(20, 8),
  side      Enum8('buy' = 1, 'sell' = 2)
)
ENGINE = MergeTree()
PARTITION BY toYYYYMM(time)
ORDER BY (symbol, exchange, time);

ORDER BY в ClickHouse — это одновременно и первичный ключ (sparse index), и физический порядок хранения. Выбирайте по паттернам запросов: если чаще фильтруете по (symbol, time) — именно такой ORDER BY.

ClickHouse materialized views — триггерные, обновляются при insert (не по расписанию как в TimescaleDB). Уникальная функция — ASOF JOIN для джойна по ближайшему значению времени.

Типы данных. Используйте LowCardinality(String) для полей с малой кардинальностью (exchange, symbol, side) — экономия 2–10x по размеру и ускорение фильтрации. Decimal вместо Float для финансовых значений — нет проблем с точностью.

Партиционирование. По месяцам (toYYYYMM) — стандарт для большинства финансовых данных. Позволяет дропать старые партиции без DELETE.

Параметр	TimescaleDB	ClickHouse
Тип полей	Стандартные PostgreSQL	LowCardinality, Decimal, Enum
Индексация	B-tree по символу+время	ORDER BY (sparse index)
Сжатие	10–20x (compression policy)	5–10x (LZ4, ZSTD)
Партиционирование	По дням (chunk_interval)	По месяцам (toYYYYMM)

Почему важно комбинировать TimescaleDB и ClickHouse?

Хранение всех данных в одной СУБД — компромисс. TimescaleDB отлично держит точечные запросы и OLTP-загрузку, но проигрывает в аналитике при 100+ миллиардах строк. ClickHouse, наоборот, неэффективен для частых обновлений и транзакций. Комбинируя их, вы получаете: операционные данные на TimescaleDB (горячий слой 30 дней) и аналитический слой на ClickHouse (история за всё время). Затраты на инфраструктуру снижаются на 40% за счёт разнесения нагрузки. Получите консультацию по выбору СУБД для ваших данных.

Что входит в нашу работу

Аудит текущих данных и типовых запросов
Проектирование схемы (hypertable / MergeTree) с выбором партиционирования, индексов и компрессии
Скрипты миграции с контролем целостности
Настройка continuous aggregates или materialized views
Интеграция с Grafana: дашборды по размеру таблиц, количеству частей, времени выполнения запросов
Документация по эксплуатации и рекомендации по дальнейшему масштабированию
Обучение команды заказчика

Процесс работы

Аналитика — собираем метрики нагрузки, объёмов, частоты запросов. Определяем горячие и холодные данные.
Проектирование — выбираем СУБД, схему и политики ретенции/компрессии.
Реализация — разворачиваем кластер, пишем ETL-пайплайн.
Тестирование — нагрузочное тестирование на объёмах, близких к реальным.
Деплой — миграция данных, подключение мониторинга, передача документации.

Сроки и стоимость

Сроки: от 1 недели на проектирование схемы до 3 недель при миграции существующих данных. Стоимость рассчитывается индивидуально под ваш объём и сложность. Свяжитесь с нами — обсудим детали.

Развертывание блокчейн-инфраструктуры: ноды, RPC, индексация

Subgraph упал в 3:47 ночи. К утру пользователи видели устаревшие балансы, транзакции «висели» в UI, поддержка получила 47 тикетов за час. Причина: handler в subgraph упал на транзакции с нестандартным event log — и весь индекс встал. Мы сталкивались с такими ситуациями десятки раз. Наш опыт показывает: блокчейн-инфраструктура не прощает gaps в observability. Гарантировать uptime без многослойного мониторинга и fault‑tolerant архитектуры невозможно. За 8 лет работы с Ethereum, Polygon и Solana мы выработали подход, который позволяет предсказуемо развёртывать инфраструктуру любого масштаба — от одиночной ноды до мультичейн‑сетки с десятками субграфов.

Архитектура RPC-слоя

Каждое взаимодействие dApp с блокчейном идёт через RPC — JSON‑RPC API, которую предоставляет нода. Три варианта:

Managed providers — Alchemy, QuickNode, Infura, Ankr. Минимальные операционные расходы, SLA, встроенный мониторинг. Ограничения: rate limits (Alchemy Free: 300 RU/sec), vendor lock, потенциальные downtime при инцидентах провайдера. Для большинства проектов — правильный выбор на старте.

Собственные ноды — полный контроль, нет rate limits, нет зависимости от третьих сторон. Стоимость: архивная нода Ethereum занимает 2.5–3TB SSD, требует мощный сервер и DevOps‑поддержку. Sync с нуля на Ethereum через Geth/Nethermind — 3–7 дней. Оправдано при высокой нагрузке или требованиях к latency.

Гибрид — собственная нода как primary, managed provider как fallback. Стандарт для протоколов с TVL от $10M. Правильная балансировка может сократить расходы на 20–30% по сравнению с чисто managed‑схемой. При нагрузке 10 млн запросов в месяц гибрид экономит от $1500 до $3000.

Провайдер	Сильная сторона	Ограничение
Alchemy	Supernode, Enhanced APIs, webhooks	Дорогой на high-volume
QuickNode	Низкая latency, multi-chain	Дороже Alchemy на базовом плане
Infura	Историческая надёжность	Rate limits на бесплатном, один крупный инцидент остановил пол‑DeFi
Ankr	Дешёвый, 40+ чейнов	Менее стабильный

Как настроить RPC-слой без единой точки отказа?

Минимум два провайдера, DNS round‑robin с health check каждые 5 секунд, автоматическое переключение на fallback при latency >500 мс. На практике это даёт 99.99% доступности при любом сбое провайдера. Для протоколов с TVL от $10M мы рекомендуем собственный HA‑прокси (nginx или Envoy) перед двумя managed‑провайдерами.

Почему гибридная RPC-схема выгоднее чисто managed?

При 50 млн запросов в месяц Alchemy стоит $2000+, QuickNode — $2500+, собственная нода — $400–600 за хостинг + DevOps. Гибрид: primary — своя нода ($500), fallback — QuickNode ($500), итого ~$1000. Экономия 50–60% без потери SLA.

Клиенты нод Ethereum

Execution clients: Geth (наиболее используемый), Nethermind (C#, быстрая sync), Besu (Java, enterprise), Erigon (самый быстрый sync, архивный режим эффективен по диску — ~2TB вместо 3TB).

Consensus clients (post‑Merge): Lighthouse (Rust), Prysm (Go), Teku (Java), Nimbus (Nim). Каждая нода после The Merge требует пары execution + consensus client.

Для DevOps: eth‑docker — Docker Compose конфигурации для всех комбинаций клиентов. Настройка мониторинга через Grafana + Prometheus — обязательна, стандартный дашборд есть в репозитории каждого клиента.

The Graph: индексация событий

The Graph Protocol — decentralized indexing. Subgraph описывает какие события с каких контрактов индексировать и как трансформировать их в GraphQL схему.

Структура subgraph:

subgraph.yaml — манифест: адреса контрактов, startBlock, события которые обрабатываются
schema.graphql — GraphQL схема entities
src/mapping.ts — AssemblyScript обработчики событий

dataSources:
  - kind: ethereum
    name: UniswapV3Pool
    network: mainnet
    source:
      address: "0x88e6A0c2dDD26FEEb64F039a2c41296FcB3f5640"
      abi: UniswapV3Pool
      startBlock: 12370624
    mapping:
      eventHandlers:
        - event: Swap(indexed address,indexed address,int256,int256,uint160,uint128,int24)
          handler: handleSwap

AssemblyScript handlers — не TypeScript. Нет nullable types, нет closures, нет многих стандартных API. Ошибка в handler останавливает индексацию subgraph-а на той транзакции. Важно: добавлять try‑catch на операции которые могут падать (например store.get() для entity которая может не существовать).

Как избежать остановки индексации субграфа?

Лог файлы Graph Node мониторятся в реальном времени, при hasIndexingErrors = true срабатывает алерт и автоматический рестарт ноды (через systemd или Kubernetes). Типичный downtime при ошибке — 150–300 секунд до восстановления. Дополнительно: для production ставим watchdog, который перезапускает Graph Node если subgraph lag превышает 50 блоков.

Выбор между Hosted Service и Decentralized Network

Graph Hosted Service (бесплатный, централизованный) deprecated в пользу Subgraph Studio + Graph Network. Для продакшн: деплой на Graph Network с GRT curation signal — субграф получает indexers пропорционально curation.

Альтернативы The Graph: Ponder (TypeScript, self-hosted, проще дебагать), Envio (ultra‑fast indexer, поддерживает EVM + non‑EVM), Subsquid (TypeScript, своя сеть), Moralis Streams (managed, webhook‑based). Наш опыт показывает: для высоконагруженных проектов с уникальной логикой эффективнее Ponder или Envio — они дают полный контроль над процессом и не требуют токеномики GRT.

Webhooks и real-time нотификации

Alchemy Webhooks и QuickNode Streams позволяют получать события в реальном времени через HTTP webhook или WebSocket. Для мониторинга адресов, новых транзакций, минтов — это быстрее чем polling RPC.

Tenderly — платформа для мониторинга и алертов. Можно настроить alert на конкретный event из контракта, на изменение баланса, на вызов функции с определёнными параметрами. Симуляция транзакций через Tenderly API — бесценно для debugging.

Мониторинг и observability

Минимальный стек мониторинга для протокола:

On‑chain: OpenZeppelin Defender Sentinel — watches contract events, вызывает webhook или Autotask при срабатывании условий. Forta Network — community‑maintained боты детектируют аномалии (большие withdrawals, flash loans, governance attacks).

Infrastructure: Grafana + Prometheus для нод, Datadog или Grafana Cloud для managed метрик. Alert на: нода отстала на 10+ блоков, RPC latency > 500ms, subgraph lag > 100 блоков.

Uptime: Better Uptime или PagerDuty на RPC endpoint и subgraph health endpoint (The Graph предоставляет _meta { hasIndexingErrors, block { number } }).

Почему мониторинг без Tenderly недостаточен?

Tenderly даёт симуляцию транзакций и детальные трейсы — это критично для отладки ошибок в субграфах и смарт‑контрактах. Forta же фокусируется на аномалиях в сети, а не на вашей инфраструктуре. Комбинация Tenderly + собственный дашборд Grafana покрывает 90% сценариев инцидентов.

Мультичейн инфраструктура

Протокол на 5 чейнах = 5 отдельных RPC endpoints, 5 subgraphs, 5 мониторинг‑конфигов. Это управляемо, но нужна автоматизация деплоя.

Для subgraph multi‑network деплой: graph deploy --network mainnet, graph deploy --network arbitrum-one и т.д. с единой кодовой базой и network‑specific адресами в отдельных файлах конфигурации.

Chainlink CCIP и LayerZero для cross‑chain messaging требуют мониторинга состояния обоих чейнов и транзакций на intermediate relayers. Реорг на source chain при уже подтверждённом минте на target chain — классическая проблема мостов. Решение: ждать finality (на Ethereum ~15 минут после Merge для экономической finality) перед подтверждением на target chain.

Процесс настройки инфраструктуры

Аудит текущего стека — определяем чейны, объём запросов, требования к latency и доступности.
Проектирование архитектуры — выбор провайдеров, балансировка, redundancy.
Разработка subgraph — манифест → схема → handlers → тестирование на локальной Graph Node → деплой на testnet → mainnet.
Конфигурация мониторинга — Tenderly alerts, Grafana дашборд, PagerDuty интеграция.
Документация и runbook — что делать при: subgraph fell behind, RPC downtime, нода desync.
Передача в эксплуатацию — обучение команды, передача доступов, поддержка первый месяц.

Что входит в работу

Развёртывание managed или self‑hosted нод Ethereum, Polygon, BNB Chain
Настройка RPC‑слоя с primary/fallback и load balancing
Разработка и деплой subgraph под ваш протокол
Подключение мониторинга (Tenderly, Grafana, алерты)
Создание runbook и документации по эксплуатации
Обучение команды (до 4 часов онлайн)
Поддержка в течение 30 дней после сдачи

Сроки

Работа	Срок
Настройка RPC и базового мониторинга	1–2 недели
Subgraph для одного протокола	2–4 недели
Self-hosted нода с мониторингом	2–3 недели
Полная инфраструктура (multi-chain, мониторинг, runbooks)	6–10 недель

Все проекты ведутся в репозитории на GitHub/GitLab с CI/CD, код конфигураций остаётся у вас. Закажите развертывание инфраструктуры — расскажем, как сократить расходы на 20–30% без потери надёжности. JSON‑RPC спецификация, документация The Graph. Получите консультацию — покажем, как мы развёртывали инфраструктуру для протокола с TVL $50M+ на Ethereum и Arbitrum.

Свяжитесь с нами.