Налаштування Elasticsearch для нечіткого пошуку (Fuzzy Search)

Наша компанія займається розробкою, підтримкою та обслуговуванням сайтів будь-якої складності. Від простих односторінкових сайтів до масштабних кластерних систем, побудованих на мікро сервісах. Досвід розробників підтверджено сертифікатами від вендорів.

Розробка та обслуговування будь-яких видів сайтів:

Інформаційні сайти або веб-програми
Сайти візитки, landing page, корпоративні сайти, онлайн каталоги, квіз, промо-сайти, блоги, ресурси новин, інформаційні портали, форуми, агрегатори
Сайти або веб-програми електронної комерції
Інтернет-магазини, B2B-портали, маркетплейси, онлайн-обмінники, кешбек-сайти, біржі, дропшиппінг-платформи, парсери товарів
Веб-програми для управління бізнес-процесами
CRM-системи, ERP-системи, корпоративні портали, системи управління виробництвом, парсери інформації
Сайти або веб-програми електронних послуг
Дошки оголошень, онлайн-школи, онлайн-кінотеатри, конструктори сайтів, портали надання електронних послуг, відеохостинги, тематичні портали

Це лише деякі з технічних типів сайтів, з якими ми працюємо, і кожен із них може мати свої специфічні особливості та функціональність, а також бути адаптованим під конкретні потреби та цілі клієнта.

Пропоновані послуги
Показано 1 з 1 послугУсі 2065 послуг
Налаштування Elasticsearch для нечіткого пошуку (Fuzzy Search)
Середня
~2-3 робочих дні
Часті питання

Наші компетенції:

Етапи розробки

Останні роботи

  • image_website-b2b-advance_0.png
    Розробка сайту компанії B2B ADVANCE
    1262
  • image_web-applications_feedme_466_0.webp
    Розробка веб-додатків для компанії FEEDME
    1171
  • image_websites_belfingroup_462_0.webp
    Розробка веб-сайту для компанії БЕЛФІНГРУП
    874
  • image_ecommerce_furnoro_435_0.webp
    Розробка інтернет магазину для компанії FURNORO
    1094
  • image_crm_enviok_479_0.webp
    Розробка веб-додатків для компанії Enviok
    831
  • image_bitrix-bitrix-24-1c_fixper_448_0.png
    Розробка веб-сайту для компанії ФІКСПЕР
    851

Нечіткий пошук в Elasticsearch

Нечіткий пошук збігається з опечатками та помилками: "elasticsearch" збігається з "elasti*searh", "elastikserch".

Fuzzy запит

GET /products/_search
{
  "query": {
    "fuzzy": {
      "name": {
        "value": "elasticsearch",
        "fuzziness": "AUTO",    // авто-налаштування за довжиною терму
        "max_expansions": 50,
        "prefix_length": 0      // 0 = дозвіл на префіксну невідповідність
      }
    }
  }
}

Значення fuzziness:

  • 0 - точний збіг тільки
  • 1 - 1 редакційна відстань (видалення, вставка або заміна)
  • 2 - 2 редакційні відстані
  • AUTO - налаштовується за довжиною терму (0-2)

Match запит з fuzziness

GET /articles/_search
{
  "query": {
    "match": {
      "title": {
        "query": "databse design",
        "fuzziness": "1",
        "operator": "and"       // всі терми повинні збігатися
      }
    }
  }
}

Комбінований: нечіткий + синоніми + мова

PUT /documents
{
  "settings": {
    "analysis": {
      "filter": {
        "my_synonyms": {
          "type": "synonym",
          "synonyms": ["db => database", "elasticsearch => es"]
        }
      },
      "analyzer": {
        "my_search_analyzer": {
          "type": "custom",
          "tokenizer": "standard",
          "filter": ["lowercase", "my_synonyms"]
        }
      }
    }
  },
  "mappings": {
    "properties": {
      "content": {
        "type": "text",
        "analyzer": "my_search_analyzer"
      }
    }
  }
}

GET /documents/_search
{
  "query": {
    "match": {
      "content": {
        "query": "databse",
        "fuzziness": "AUTO"
      }
    }
  }
}
// Збігається: "database", "databases", "db"