Впровадження AI-системи крос-селінгу для продажів
Крос-селінг рекомендує додаткові товари до того, що клієнт уже купує або переглядає. Класичний приклад: до принтера — картриджи, до ноутбука — сумку. ML-підхід знаходить нетривіальні пари товарів через аналіз спільних покупок (market basket analysis) і додає персоналізацію через профіль користувача.
Market Basket Analysis + персоналізація
import pandas as pd
import numpy as np
from mlxtend.frequent_patterns import apriori, association_rules
from mlxtend.preprocessing import TransactionEncoder
from sklearn.ensemble import GradientBoostingClassifier
class CrossSellRecommender:
def __init__(self, min_support: float = 0.01, min_confidence: float = 0.1):
self.min_support = min_support
self.min_confidence = min_confidence
self.rules = None
self.cross_sell_map = {}
self.personalization_model = None
def fit_association_rules(self, orders_df: pd.DataFrame,
order_col: str = "order_id",
item_col: str = "item_id"):
"""Пошук асоціативних правил через Apriori"""
# Кошики трансакцій
baskets = orders_df.groupby(order_col)[item_col].apply(list).tolist()
te = TransactionEncoder()
te_array = te.fit_transform(baskets)
df_encoded = pd.DataFrame(te_array, columns=te.columns_)
# Часті набори товарів
frequent_itemsets = apriori(
df_encoded,
min_support=self.min_support,
use_colnames=True,
max_len=3
)
# Правила асоціації
self.rules = association_rules(
frequent_itemsets,
metric="lift",
min_threshold=1.2
)
self.rules = self.rules[self.rules['confidence'] >= self.min_confidence]
self.rules = self.rules.sort_values('lift', ascending=False)
# Маппінг: товар → список рекомендацій з метриками
for _, rule in self.rules.iterrows():
for antecedent in rule['antecedents']:
if antecedent not in self.cross_sell_map:
self.cross_sell_map[antecedent] = []
for consequent in rule['consequents']:
if antecedent != consequent:
self.cross_sell_map[antecedent].append({
'item_id': consequent,
'confidence': rule['confidence'],
'lift': rule['lift'],
'support': rule['support']
})
# Сортування за lift
for item in self.cross_sell_map:
self.cross_sell_map[item].sort(key=lambda x: x['lift'], reverse=True)
def recommend_cross_sell(self, cart_items: list[str],
user_history: list[str] = None,
n: int = 5) -> list[dict]:
"""Крос-селінг для поточного кошика"""
candidates = {}
for item_id in cart_items:
related = self.cross_sell_map.get(item_id, [])
for rec in related:
rec_id = rec['item_id']
# Пропускаємо товари вже в кошику або в історії
if rec_id in cart_items:
continue
if user_history and rec_id in user_history:
continue
if rec_id not in candidates:
candidates[rec_id] = {'score': 0, 'triggers': []}
candidates[rec_id]['score'] += rec['lift']
candidates[rec_id]['triggers'].append(item_id)
# Нормалізація
if not candidates:
return []
sorted_candidates = sorted(
[{'item_id': k, **v} for k, v in candidates.items()],
key=lambda x: x['score'],
reverse=True
)
return sorted_candidates[:n]
def get_complementary_categories(self, category: str) -> list[str]:
"""Взаємодоповняльні категорії"""
category_rules = self.rules[
self.rules['antecedents'].apply(lambda x: category in str(x))
]['consequents'].apply(lambda x: list(x)).explode().value_counts()
return category_rules.head(5).index.tolist()
Часові паттерни: наступна покупка
class NextPurchasePredictor:
"""Прогнозування наступної покупки на основі історії"""
def predict_next_items(self, user_id: str,
purchase_history: list[dict],
catalog_features: pd.DataFrame) -> list[tuple]:
"""
purchase_history: [{item_id, date, quantity, category}]
Повертає: [(item_id, probability)]
"""
if len(purchase_history) < 3:
return []
# Паттерн повторних покупок
item_intervals = {}
for i in range(1, len(purchase_history)):
item = purchase_history[i]['item_id']
prev_same = [h for h in purchase_history[:i] if h['item_id'] == item]
if prev_same:
days_between = (
pd.to_datetime(purchase_history[i]['date']) -
pd.to_datetime(prev_same[-1]['date'])
).days
if item not in item_intervals:
item_intervals[item] = []
item_intervals[item].append(days_between)
# Прогнозування повторних покупок
predictions = []
last_purchase_date = pd.to_datetime(purchase_history[-1]['date'])
today = pd.Timestamp.now()
days_since_last = (today - last_purchase_date).days
for item_id, intervals in item_intervals.items():
avg_interval = np.mean(intervals)
std_interval = np.std(intervals) if len(intervals) > 1 else avg_interval * 0.3
# Ймовірність через нормальний розподіл
from scipy.stats import norm
prob = norm.cdf(days_since_last + 7, avg_interval, std_interval + 1)
prob -= norm.cdf(days_since_last - 7, avg_interval, std_interval + 1)
prob = min(max(prob, 0), 1)
if prob > 0.1:
predictions.append((item_id, prob))
return sorted(predictions, key=lambda x: x[1], reverse=True)[:10]
Правила асоціації з min_support=0.01, min_confidence=0.1 зазвичай дають 500-5000 значущих правил на 100K замовлень. Lift > 2.0 — сильна асоціація. Крос-селінг через правила дає середній uplift кошика 15-25%. Комбінація з персоналізацією (історія користувача) додає ще 5-10% до acceptance rate.







