Інтеграція DeepSeek API
DeepSeek — китайський провайдер LLM з моделями, що конкурують з GPT-4o при значно менших витратах. DeepSeek-R1 — reasoning-модель з відкритими вагами, порівнянна з o1 від OpenAI. DeepSeek Coder V2 — спеціалізована кодова модель. Важливо: дані обробляються в Китаї, що критично для задач, чутливих до compliance.
Базова інтеграція (OpenAI-сумісний API)
from openai import OpenAI
# DeepSeek повністю сумісний з OpenAI SDK
client = OpenAI(
api_key="DEEPSEEK_API_KEY",
base_url="https://api.deepseek.com",
)
# Chat
response = client.chat.completions.create(
model="deepseek-chat", # DeepSeek-V3
messages=[
{"role": "system", "content": "Ти — досвідчений Python розробник"},
{"role": "user", "content": "Напиши async функцію для batch-запитів до API"},
],
temperature=0.1,
)
print(response.choices[0].message.content)
# Reasoning (deepseek-reasoner = R1)
response = client.chat.completions.create(
model="deepseek-reasoner",
messages=[{"role": "user", "content": "Доведи що sqrt(2) іраціональний"}],
)
# R1 повертає reasoning_content (ланцюг думок) + content (відповідь)
print(response.choices[0].message.reasoning_content) # Міркування
print(response.choices[0].message.content) # Фінальна відповідь
Потокова передача
with client.chat.completions.stream(
model="deepseek-chat",
messages=[{"role": "user", "content": "Довгий відповідь..."}],
) as stream:
for chunk in stream.text_stream:
print(chunk, end="", flush=True)
Заповнення коду (FIM) — DeepSeek Coder
response = client.completions.create(
model="deepseek-chat",
prompt="<|fim▁begin|>def calculate_tax(income: float",
suffix="<|fim▁end|>",
max_tokens=128,
stop=["<|fim▁end|>"],
)
print(response.choices[0].text)
Вартість DeepSeek (2025)
| Модель | Вхід (1M) | Вихід (1M) | Примітка |
|---|---|---|---|
| DeepSeek-V3 | $0.27 | $1.10 | Кешований вхід $0.07 |
| DeepSeek-R1 | $0.55 | $2.19 | Reasoning модель |
Для порівняння: GPT-4o $2.50/$10, що робить DeepSeek в 5–10× дешевшим з порівнянною якістю.
Коли використовувати
- Завдання, що вимагають обчислень або глибокого аналізу — R1
- Код, SQL, аналіз даних — DeepSeek-V3 або Coder V2
- Високонавантажені сценарії з цінною чутливістю — DeepSeek-V3
- Вимоги compliance з зберіганням даних в РФ/ЄС — не підходить
Локальне розгортання
ollama pull deepseek-r1:7b # 4.7 GB
ollama pull deepseek-r1:70b # 43 GB (потребує GPU з 40GB VRAM)
Терміни
- Базова інтеграція: 0.5 дня (OpenAI-сумісний API)
- Тестування якості на конкретних завданнях: 1–2 дні







