AI-аналіз якості коду
Статичні аналізатори (ruff, SonarQube, ESLint) знаходять синтаксичні порушення та відомі антипаттерни. AI-аналіз працює на вищому рівні: розуміє семантику коду, бачить архітектурні проблеми, помічає невідповідність між іменем функції та її поведінкою, виявляє приховані залежності. Це не заміна лінтеру — це наступний шар аналізу.
Архітектура аналізатора
from anthropic import Anthropic
import ast
import subprocess
from pathlib import Path
from dataclasses import dataclass
from typing import Literal
import json
client = Anthropic()
@dataclass
class QualityIssue:
file: str
line: int | None
severity: Literal["critical", "major", "minor", "info"]
category: str
title: str
description: str
recommendation: str
class CodeQualityAnalyzer:
def analyze_file(self, file_path: str) -> list[QualityIssue]:
"""Повний аналіз файлу: статичний + AI"""
source = Path(file_path).read_text()
# Рівень 1: швидкий статичний аналіз
static_issues = self._run_static_analysis(file_path, source)
# Рівень 2: AI-аналіз для глибоких проблем
ai_issues = self._run_ai_analysis(file_path, source)
return static_issues + ai_issues
def _run_static_analysis(self, file_path: str, source: str) -> list[QualityIssue]:
"""ruff + radon для метрик складності"""
issues = []
# Запускаємо ruff
result = subprocess.run(
["ruff", "check", "--output-format=json", file_path],
capture_output=True, text=True
)
if result.stdout:
for item in json.loads(result.stdout):
issues.append(QualityIssue(
file=file_path,
line=item["location"]["row"],
severity="minor",
category="style",
title=item["code"],
description=item["message"],
recommendation="See ruff documentation",
))
# Cyclomatic complexity через radon
result = subprocess.run(
["radon", "cc", "-j", file_path],
capture_output=True, text=True
)
if result.stdout:
data = json.loads(result.stdout)
for funcs in data.values():
for func in funcs:
if func.get("complexity", 0) > 10:
issues.append(QualityIssue(
file=file_path,
line=func.get("lineno"),
severity="major" if func["complexity"] > 15 else "minor",
category="complexity",
title=f"High complexity: {func['name']}",
description=f"Cyclomatic complexity: {func['complexity']} (threshold: 10)",
recommendation="Decompose into smaller functions",
))
return issues
def _run_ai_analysis(self, file_path: str, source: str) -> list[QualityIssue]:
"""AI-аналіз архітектурних та семантичних проблем"""
response = client.messages.create(
model="claude-sonnet-4-5",
max_tokens=4096,
system="""Ти — senior code reviewer. Аналізуй код на:
1. АРХІТЕКТУРНІ ПРОБЛЕМИ: порушення SOLID, God Object, Feature Envy
2. ПРИХОВАНІ БАГИ: race conditions, off-by-one, неправильна обробка None
3. БЕЗПЕКА: SQL injection, XSS, незахищені credentials
4. ПРОДУКТИВНІСТЬ: N+1 queries, блокуючі операції в async, memory leaks
5. СЕМАНТИКА: невідповідність імені та поведінки, misleading comments
Поверни JSON масив проблем:
[{
"line": <number або null>,
"severity": "critical|major|minor|info",
"category": "architecture|bug|security|performance|semantics",
"title": "<короткий заголовок>",
"description": "<що саме не так>",
"recommendation": "<як виправити>"
}]""",
messages=[{
"role": "user",
"content": f"Проаналізуй якість коду:\n\n```python\n{source[:5000]}\n```"
}]
)
text = response.content[0].text
try:
# Витягуємо JSON
start = text.find("[")
end = text.rfind("]") + 1
issues_data = json.loads(text[start:end])
return [QualityIssue(
file=file_path,
line=item.get("line"),
severity=item.get("severity", "info"),
category=item.get("category", "general"),
title=item.get("title", ""),
description=item.get("description", ""),
recommendation=item.get("recommendation", ""),
) for item in issues_data]
except Exception:
return []
Аналіз технічного боргу
class TechDebtAnalyzer:
def analyze_module(self, module_path: str) -> dict:
"""Оцінює технічний борг модуля"""
source = Path(module_path).read_text()
response = client.messages.create(
model="claude-sonnet-4-5",
max_tokens=2048,
messages=[{
"role": "user",
"content": f"""Оцінь технічний борг цього модуля.
Поверни JSON:
{{
"debt_score": <0-100, де 100 = максимальний борг>,
"estimated_hours": <оцінка годин на рефакторинг>,
"top_issues": [
{{"category": "...", "description": "...", "impact": "high|medium|low"}}
],
"quick_wins": ["<що можна покращити за 30 хв>"],
"requires_redesign": <true/false>
}}
Код:
```python
{source[:4000]}
```"""
}]
)
text = response.content[0].text
start = text.find("{")
end = text.rfind("}") + 1
return json.loads(text[start:end])
def generate_refactoring_plan(self, module_path: str, debt_report: dict) -> str:
"""Генерує план рефакторингу на основі аналізу боргу"""
response = client.messages.create(
model="claude-sonnet-4-5",
max_tokens=2048,
messages=[{
"role": "user",
"content": f"""На основі аналізу технічного боргу складіть план рефакторингу.
Звіт:
{json.dumps(debt_report, ensure_ascii=False, indent=2)}
Формат: пріоритизований список завдань з оцінкою часу та очікуваним результатом.
Групуй за: Quick Wins (< 2г), Medium Tasks (2–8г), Major Refactoring (> 8г)."""
}]
)
return response.content[0].text
Метрики якості на дашборді
def generate_quality_report(project_root: str) -> dict:
"""Генерує звіт про якість для всього проекту"""
analyzer = CodeQualityAnalyzer()
all_issues = []
file_metrics = {}
for py_file in Path(project_root).rglob("*.py"):
if any(skip in str(py_file) for skip in ["migrations", "__pycache__", ".venv"]):
continue
issues = analyzer.analyze_file(str(py_file))
all_issues.extend(issues)
file_metrics[str(py_file)] = {
"critical": len([i for i in issues if i.severity == "critical"]),
"major": len([i for i in issues if i.severity == "major"]),
"minor": len([i for i in issues if i.severity == "minor"]),
}
# Топ проблемних файлів
worst_files = sorted(
file_metrics.items(),
key=lambda x: x[1]["critical"] * 10 + x[1]["major"] * 3 + x[1]["minor"],
reverse=True
)[:10]
return {
"total_issues": len(all_issues),
"by_severity": {
"critical": len([i for i in all_issues if i.severity == "critical"]),
"major": len([i for i in all_issues if i.severity == "major"]),
"minor": len([i for i in all_issues if i.severity == "minor"]),
},
"by_category": {},
"worst_files": worst_files,
"quality_score": calculate_quality_score(all_issues, len(file_metrics)),
}
def calculate_quality_score(issues: list, file_count: int) -> float:
"""Єдиний скор якості коду (0-100)"""
if file_count == 0:
return 100.0
penalty = sum({
"critical": 10,
"major": 3,
"minor": 1,
"info": 0,
}.get(i.severity, 0) for i in issues)
# Нормалізуємо за кількістю файлів
score = max(0, 100 - penalty / file_count)
return round(score, 1)
Практичний кейс: платіжний сервіс
Завдання: Legacy-платіжний сервіс, 15000 рядків Python, 4 роки без рефакторингу. Перед додаванням нових платіжних провайдерів — аудит якості.
Результати AI-аналізу за 2 години:
- 3 критичні проблеми безпеки (hardcoded API keys у тестах, що попали в репозиторій, SQL без параметризації в одному місці, логування даних карт у debug режимі)
- 12 архітектурних проблем (God Object PaymentProcessor з 2800 рядків, циклічні імпорти)
- 47 проблем з обробкою помилок
Пріоритизація:
- Sprint 1: критичні security issues (3 дні)
- Sprint 2: декомпозиція PaymentProcessor (2 тижні)
- Sprint 3: error handling + тести (1 тиждень)
Якість коду до/після: score 31/100 → 72/100 після трьох спринтів.
Без AI-аналізу ручний аудит займав би 3–5 днів одного senior-розробника.
Строки
- Базовий аналізатор (статичний + AI для одного файлу): 2–3 дні
- Проектний аналіз з звітом: 1 тиждень
- Дашборд з історичними метриками: 2 тижні
- Інтеграція в CI/CD з quality gate: 1 тиждень







