Налаштування Elasticsearch-фасетної агрегації 1С-Бітрікс

Наша компанія займається розробкою, підтримкою та обслуговуванням рішень на Бітрікс та Бітрікс24 будь-якої складності. Від простих односторінкових сайтів до складних інтернет-магазинів, CRM систем з інтеграцією 1С та телефонії. Досвід розробників підтверджено сертифікатами від вендора.
Пропоновані послуги
Показано 1 з 1 послугУсі 1626 послуг
Налаштування Elasticsearch-фасетної агрегації 1С-Бітрікс
Проста
~1 робочий день
Часті питання

Наші компетенції:

Етапи розробки

Останні роботи

  • image_website-b2b-advance_0.png
    Розробка сайту компанії B2B ADVANCE
    1262
  • image_bitrix-bitrix-24-1c_fixper_448_0.png
    Розробка веб-сайту для компанії ФІКСПЕР
    851
  • image_bitrix-bitrix-24-1c_development_of_an_online_appointment_booking_widget_for_a_medical_center_594_0.webp
    Розробка на базі Бітрікс, Бітрікс24, 1С для компанії Development of an Online
    585
  • image_bitrix-bitrix-24-1c_mirsanbel_458_0.webp
    Розробка на базі 1С Підприємство для компанії МИРСАНБЕЛ
    751
  • image_crm_dolbimby_434_0.webp
    Розробка сайту на CRM Бітрікс24 для компанії DOLBIMBY
    657
  • image_crm_technotorgcomplex_453_0.webp
    Розробка на базі Бітрікс24 для компанії ТЕХНОТОРГКОМПЛЕКС
    989

Налаштування Elasticsearch-фасетної агрегації у 1С-Bitrix

Фільтр каталогу з 50 000 товарів через CIBlockElement::GetList з групуванням по властивостям — це хвилини на MySQL. Elasticsearch вирішує ту ж задачу за десятки мілісекунд через aggregations API. Але стандартний модуль пошуку Bitrix (search) не підтримує фасети з коробки. Потрібна користувацька інтеграція.

Як фасети працюють в Elasticsearch

Aggregations — запит, який одночасно повертає результати пошуку та статистику по полям: кількість документів для кожного значення фільтра. Один запит до Elasticsearch замінює N запитів до MySQL для підрахунку по кожному фасету.

Приклад: каталог ноутбуків. Один запит повертає:

  • 240 товарів, які задовольняють поточному фільтру
  • По бренду: ASUS (45), Dell (38), HP (31)...
  • По RAM: 8 ГБ (89), 16 ГБ (104), 32 ГБ (47)
  • По діагоналі: 15.6" (130), 14" (65)...

Це й є фасети.

Маппінг для фасетних полів

Для фасетної агрегації поля повинні бути або keyword (точне значення), або integer/float для числових діапазонів. Поля типу text не агрегуються (або агрегуються по токенам, що безглуздо для фасетів).

Маппінг при створенні індексу:

curl -X PUT http://localhost:9200/bitrix_catalog_s1 \
  -H "Content-Type: application/json" \
  -d '{
  "mappings": {
    "properties": {
      "title": {
        "type": "text",
        "analyzer": "russian",
        "fields": {
          "keyword": {"type": "keyword"}
        }
      },
      "brand": {"type": "keyword"},
      "price": {"type": "float"},
      "category_id": {"type": "integer"},
      "properties": {
        "type": "nested",
        "properties": {
          "code": {"type": "keyword"},
          "value": {"type": "keyword"},
          "value_num": {"type": "float"}
        }
      }
    }
  }
}'

Властивості товару зберігаємо як nested об'єкти — це дозволяє коректно фільтрувати по комбінації значень однієї властивості.

Запит з агрегаціями з PHP

Клас для роботи з Elasticsearch через офіційний клієнт elasticsearch/elasticsearch:

use Elasticsearch\ClientBuilder;

class CatalogElasticSearch
{
    private $client;
    private $index = 'bitrix_catalog_s1';

    public function __construct()
    {
        $this->client = ClientBuilder::create()
            ->setHosts(['localhost:9200'])
            ->build();
    }

    public function getFacets(array $filters = [], string $query = ''): array
    {
        $must = [];

        if ($query) {
            $must[] = ['match' => ['title' => $query]];
        }

        // Застосовуємо вибрані фільтри
        foreach ($filters as $code => $values) {
            $must[] = [
                'nested' => [
                    'path' => 'properties',
                    'query' => [
                        'bool' => [
                            'must' => [
                                ['term' => ['properties.code' => $code]],
                                ['terms' => ['properties.value' => (array)$values]]
                            ]
                        ]
                    ]
                ]
            ];
        }

        $params = [
            'index' => $this->index,
            'body' => [
                'query' => ['bool' => ['must' => $must]],
                'aggs' => [
                    'brands' => [
                        'terms' => ['field' => 'brand', 'size' => 50]
                    ],
                    'price_range' => [
                        'range' => [
                            'field' => 'price',
                            'ranges' => [
                                ['to' => 10000],
                                ['from' => 10000, 'to' => 30000],
                                ['from' => 30000, 'to' => 60000],
                                ['from' => 60000]
                            ]
                        ]
                    ],
                    'properties_facets' => [
                        'nested' => ['path' => 'properties'],
                        'aggs' => [
                            'prop_codes' => [
                                'terms' => ['field' => 'properties.code', 'size' => 20],
                                'aggs' => [
                                    'prop_values' => [
                                        'terms' => ['field' => 'properties.value', 'size' => 100]
                                    ]
                                ]
                            ]
                        ]
                    ]
                ],
                'size' => 24,
                'from' => 0
            ]
        ];

        return $this->client->search($params);
    }
}

Індексування товарів Bitrix

Дані для індексування збираємо через CIBlockElement::GetList та відправляємо у Elasticsearch батчами через Bulk API:

function indexCatalogToElastic(int $iblockId): void
{
    $client = ClientBuilder::create()->setHosts(['localhost:9200'])->build();
    $batchSize = 200;
    $offset = 0;

    do {
        $res = CIBlockElement::GetList(
            [],
            ['IBLOCK_ID' => $iblockId, 'ACTIVE' => 'Y'],
            false,
            ['nTopCount' => $batchSize, 'nPageSize' => $batchSize, 'iNumPage' => ($offset / $batchSize) + 1],
            ['ID', 'NAME', 'DETAIL_TEXT', 'PROPERTY_BRAND', 'PROPERTY_*']
        );

        $body = [];
        $count = 0;
        while ($el = $res->GetNextElement()) {
            $fields = $el->GetFields();
            $props = $el->GetProperties();

            $properties = [];
            foreach ($props as $code => $prop) {
                if (!empty($prop['VALUE'])) {
                    $properties[] = [
                        'code' => $code,
                        'value' => is_array($prop['VALUE']) ? implode(', ', $prop['VALUE']) : $prop['VALUE']
                    ];
                }
            }

            $body[] = ['index' => ['_index' => 'bitrix_catalog_s1', '_id' => $fields['ID']]];
            $body[] = [
                'title' => $fields['NAME'],
                'brand' => $props['BRAND']['VALUE'] ?? '',
                'properties' => $properties
            ];
            $count++;
        }

        if (!empty($body)) {
            $client->bulk(['body' => $body]);
        }

        $offset += $batchSize;
    } while ($count === $batchSize);
}

Post-filter для незалежних фасетів

Стандартна проблема: при виборі фільтра «Бренд: ASUS» в агрегації по брендам повинні залишитися всі бренди з актуальними кількостями — інакше користувач не може переключитися на Dell. Для цього використовуйте post_filter: фільтрація застосовується до результатів, але не до агрегацій.

{
  "query": {"match_all": {}},
  "post_filter": {"term": {"brand": "ASUS"}},
  "aggs": {
    "brands": {"terms": {"field": "brand"}}
  }
}

Агрегація рахується по всій базі, результати фільтруються по ASUS. Користувач бачить повний список брендів та може переключатися.