Налаштування Elasticsearch-фасетної агрегації у 1С-Bitrix
Фільтр каталогу з 50 000 товарів через CIBlockElement::GetList з групуванням по властивостям — це хвилини на MySQL. Elasticsearch вирішує ту ж задачу за десятки мілісекунд через aggregations API. Але стандартний модуль пошуку Bitrix (search) не підтримує фасети з коробки. Потрібна користувацька інтеграція.
Як фасети працюють в Elasticsearch
Aggregations — запит, який одночасно повертає результати пошуку та статистику по полям: кількість документів для кожного значення фільтра. Один запит до Elasticsearch замінює N запитів до MySQL для підрахунку по кожному фасету.
Приклад: каталог ноутбуків. Один запит повертає:
- 240 товарів, які задовольняють поточному фільтру
- По бренду: ASUS (45), Dell (38), HP (31)...
- По RAM: 8 ГБ (89), 16 ГБ (104), 32 ГБ (47)
- По діагоналі: 15.6" (130), 14" (65)...
Це й є фасети.
Маппінг для фасетних полів
Для фасетної агрегації поля повинні бути або keyword (точне значення), або integer/float для числових діапазонів. Поля типу text не агрегуються (або агрегуються по токенам, що безглуздо для фасетів).
Маппінг при створенні індексу:
curl -X PUT http://localhost:9200/bitrix_catalog_s1 \
-H "Content-Type: application/json" \
-d '{
"mappings": {
"properties": {
"title": {
"type": "text",
"analyzer": "russian",
"fields": {
"keyword": {"type": "keyword"}
}
},
"brand": {"type": "keyword"},
"price": {"type": "float"},
"category_id": {"type": "integer"},
"properties": {
"type": "nested",
"properties": {
"code": {"type": "keyword"},
"value": {"type": "keyword"},
"value_num": {"type": "float"}
}
}
}
}
}'
Властивості товару зберігаємо як nested об'єкти — це дозволяє коректно фільтрувати по комбінації значень однієї властивості.
Запит з агрегаціями з PHP
Клас для роботи з Elasticsearch через офіційний клієнт elasticsearch/elasticsearch:
use Elasticsearch\ClientBuilder;
class CatalogElasticSearch
{
private $client;
private $index = 'bitrix_catalog_s1';
public function __construct()
{
$this->client = ClientBuilder::create()
->setHosts(['localhost:9200'])
->build();
}
public function getFacets(array $filters = [], string $query = ''): array
{
$must = [];
if ($query) {
$must[] = ['match' => ['title' => $query]];
}
// Застосовуємо вибрані фільтри
foreach ($filters as $code => $values) {
$must[] = [
'nested' => [
'path' => 'properties',
'query' => [
'bool' => [
'must' => [
['term' => ['properties.code' => $code]],
['terms' => ['properties.value' => (array)$values]]
]
]
]
]
];
}
$params = [
'index' => $this->index,
'body' => [
'query' => ['bool' => ['must' => $must]],
'aggs' => [
'brands' => [
'terms' => ['field' => 'brand', 'size' => 50]
],
'price_range' => [
'range' => [
'field' => 'price',
'ranges' => [
['to' => 10000],
['from' => 10000, 'to' => 30000],
['from' => 30000, 'to' => 60000],
['from' => 60000]
]
]
],
'properties_facets' => [
'nested' => ['path' => 'properties'],
'aggs' => [
'prop_codes' => [
'terms' => ['field' => 'properties.code', 'size' => 20],
'aggs' => [
'prop_values' => [
'terms' => ['field' => 'properties.value', 'size' => 100]
]
]
]
]
]
],
'size' => 24,
'from' => 0
]
];
return $this->client->search($params);
}
}
Індексування товарів Bitrix
Дані для індексування збираємо через CIBlockElement::GetList та відправляємо у Elasticsearch батчами через Bulk API:
function indexCatalogToElastic(int $iblockId): void
{
$client = ClientBuilder::create()->setHosts(['localhost:9200'])->build();
$batchSize = 200;
$offset = 0;
do {
$res = CIBlockElement::GetList(
[],
['IBLOCK_ID' => $iblockId, 'ACTIVE' => 'Y'],
false,
['nTopCount' => $batchSize, 'nPageSize' => $batchSize, 'iNumPage' => ($offset / $batchSize) + 1],
['ID', 'NAME', 'DETAIL_TEXT', 'PROPERTY_BRAND', 'PROPERTY_*']
);
$body = [];
$count = 0;
while ($el = $res->GetNextElement()) {
$fields = $el->GetFields();
$props = $el->GetProperties();
$properties = [];
foreach ($props as $code => $prop) {
if (!empty($prop['VALUE'])) {
$properties[] = [
'code' => $code,
'value' => is_array($prop['VALUE']) ? implode(', ', $prop['VALUE']) : $prop['VALUE']
];
}
}
$body[] = ['index' => ['_index' => 'bitrix_catalog_s1', '_id' => $fields['ID']]];
$body[] = [
'title' => $fields['NAME'],
'brand' => $props['BRAND']['VALUE'] ?? '',
'properties' => $properties
];
$count++;
}
if (!empty($body)) {
$client->bulk(['body' => $body]);
}
$offset += $batchSize;
} while ($count === $batchSize);
}
Post-filter для незалежних фасетів
Стандартна проблема: при виборі фільтра «Бренд: ASUS» в агрегації по брендам повинні залишитися всі бренди з актуальними кількостями — інакше користувач не може переключитися на Dell. Для цього використовуйте post_filter: фільтрація застосовується до результатів, але не до агрегацій.
{
"query": {"match_all": {}},
"post_filter": {"term": {"brand": "ASUS"}},
"aggs": {
"brands": {"terms": {"field": "brand"}}
}
}
Агрегація рахується по всій базі, результати фільтруються по ASUS. Користувач бачить повний список брендів та може переключатися.







