Автонаповнення блогу із зовнішніх джерел 1С-Бітрікс
Корпоративний блог потребує регулярних публікацій — це і SEO-трафік, і демонстрація експертизи. Але внутрішні ресурси для створення контенту обмежені. Автонаповнення із зовнішніх джерел (галузеві новини, статті партнерів, публікації в професійних спільнотах) дозволяє підтримувати активність розділу з мінімальною участю редактора.
Відмінність від RSS-агрегації новин
Блог — це не новинна стрічка. Ключові відмінності в підході до контенту:
- Новини: актуальність важливіша за якість, публікується швидко, часто анонс+посилання
- Блог: якість важливіша за швидкість, потрібен унікальний кут зору, довгі матеріали
Для блогу автоматичний імпорт — це чернетка, а не фінальний матеріал. Система створює записи зі статусом ACTIVE = N, редактор переглядає та публікує вручну (або з мінімальними правками).
Джерела контенту для блогу
Професійні платформи (Habr, Medium, dev.to) — через RSS API. Habr надає RSS за хабами: https://habr.com/ru/rss/hubs/php/articles/.
YouTube-канали — через YouTube Data API v3. Беремо транскрипт відео через youtube-transcript-api (Python) або сторонні сервіси → адаптуємо в текст.
Telegram-канали — через MTProto API (Telethon/Pyrogram) або публічні канали через RSS-конвертери (rsshub.app).
Власна база статей кількома мовами — якщо у компанії є блог однією мовою, автоматичний переклад іншими мовами через DeepL API або GPT.
Обробка та адаптація контенту
Агрегований матеріал не можна публікувати as-is. Мінімальний pipeline обробки:
- Очищення HTML — HTMLPurifier з дозволеним набором тегів (p, h2-h4, ul, ol, li, strong, em, a, img)
- Видалення брендингу джерела — regex-заміна згадок компанії-джерела
- Адаптація заголовка — переформулювання через AI або шаблонне додавання тематики сайту
- Додавання вступу — AI генерує 1-2 вступних абзаци в стилі блогу сайту
- Додавання CTA — автоматично в кінець матеріалу додається блок з посиланням на профільну послугу або товар
Робочий процес з редактором
Система працює як помічник редактора, а не його заміна:
- Система створює чернетку в інфоблоці блогу (
ACTIVE = N,ACTIVE_FROM = дата+3дні) - Редактор отримує сповіщення про нові чернетки (daily digest через
\Bitrix\Main\Mail\Event) - Редактор переглядає, за необхідності править, публікує
- Якщо чернетка не переглянута 7 днів — повторне сповіщення
Додатково: AI-скоринг кожної чернетки за параметрами (унікальність, читабельність, релевантність тематиці сайту). Редактор бачить оцінку та може фільтрувати за нею.
Технічні компоненти в 1С-Бітрікс
Блог реалізований через стандартний інфоблок. Додаткові властивості під автонаповнення:
-
SOURCE_URL— посилання на оригінал -
SOURCE_NAME— назва джерела -
AUTO_DRAFT— прапорець автоматично створеної чернетки -
CONTENT_SCORE— оцінка якості контенту (0–100) -
PUBLICATION_DATE_PLANNED— дата запланованої публікації
Таймлайн робіт
| Етап | Термін |
|---|---|
| Розробка колекторів (RSS, YouTube, Telegram) | 3–5 днів |
| Pipeline обробки контенту | 2–3 дні |
| Система чернеток та сповіщень для редактора | 1–2 дні |
| Адміністративний інтерфейс, AI-скоринг | 1–2 дні |
Разом: 7–12 робочих днів залежно від набору джерел.







