Які платформи підтримує голосове керування IoT?

Ми розробляємо під iOS (Swift, SwiftUI) та Android (Kotlin, Jetpack Compose), а також кросплатформенні рішення на Flutter та React Native. Інтеграція можлива з будь-якими IoT-пристроями через MQTT, HTTP або BLE.

Скільки часу займає розробка голосового керування?

Базовий push-to-talk з хмарним розпізнаванням — 2–3 тижні. Повне офлайн-рішення з wake word та TTS — 6–10 тижнів. Терміни уточнюються після аудиту проєкту.

Чи потрібен інтернет для роботи голосового керування?

Ні. Ми використовуємо локальне розпізнавання на пристрої (SFSpeechRecognizer on-device, Vosk, Whisper.cpp) та офлайн NLU. Це забезпечує роботу навіть за відсутності інтернету, а також знижує затримки до 300–800 мс.

Як обробляються нерозпізнані команди?

Якщо пристрій не розпізнано, система повертає голосову відповідь через TTS, перераховує зрозумілі елементи та просить уточнити. Це особливо важливо для сценаріїв hands-free.

Які мови підтримуються?

Основні мови: українська, російська, англійська, німецька, французька. Можливе додавання інших — точність залежить від якості навчальної вибірки. Для рідкісних мов застосовуємо fine-tuning на fastText або Rasa.

Які платформи підтримує голосове керування IoT?

Ми розробляємо під iOS (Swift, SwiftUI) та Android (Kotlin, Jetpack Compose), а також кросплатформенні рішення на Flutter та React Native. Інтеграція можлива з будь-якими IoT-пристроями через MQTT, HTTP або BLE.

Скільки часу займає розробка голосового керування?

Базовий push-to-talk з хмарним розпізнаванням — 2–3 тижні. Повне офлайн-рішення з wake word та TTS — 6–10 тижнів. Терміни уточнюються після аудиту проєкту.

Чи потрібен інтернет для роботи голосового керування?

Ні. Ми використовуємо локальне розпізнавання на пристрої (SFSpeechRecognizer on-device, Vosk, Whisper.cpp) та офлайн NLU. Це забезпечує роботу навіть за відсутності інтернету, а також знижує затримки до 300–800 мс.

Як обробляються нерозпізнані команди?

Якщо пристрій не розпізнано, система повертає голосову відповідь через TTS, перераховує зрозумілі елементи та просить уточнити. Це особливо важливо для сценаріїв hands-free.

Які мови підтримуються?

Основні мови: українська, російська, англійська, німецька, французька. Можливе додавання інших — точність залежить від якості навчальної вибірки. Для рідкісних мов застосовуємо fine-tuning на fastText або Rasa.

Голосове керування IoT-пристроями через мобільний застосунок

TRUETECH займається розробкою, підтримкою та обслуговуванням мобільних додатків iOS, Android, PWA. Маємо великий досвід та експертизу для публікації мобільних додатків до популярних маркетів Google Play, App Store, Amazon, AppGallery та інші.

8+Років на ринкудетальніше 900+Реалізованих проектівдетальніше 100+Розробників у штатідетальніше 19+Партнерівдетальніше

Розробка та підтримка будь-яких видів мобільних додатків:

Інформаційні та розважальні мобільні програми

Новинки, ігри, довідники, онлайн-каталоги, погодні, фітнес та здоров'я, туристичні, освітні, соціальні мережі та месенджери, квіз, блоги та подкасти, форуми, агрегатори

Мобільні програми електронної комерції

Інтернет-магазини, B2B-додатки, маркетплейси, онлайн-обмінники, кешбек-сервіси, біржі, дропшиппінг-платформи, програми лояльності, доставка їжі та товарів, платіжні системи

Мобільні програми для управління бізнес-процесами

CRM-системи, ERP-системи, управління проектами, інструменти для команди продажів, облік фінансів, управління виробництвом, логістика та доставка, управління персоналом, системи моніторингу даних

Мобільні програми електронних послуг

Дошки оголошень, онлайн-школи, онлайн-кінотеатри, платформи надання електронних послуг, платформи кешбеку, відеохостинги, тематичні портали, платформи онлайн-бронювання та запису, платформи онлайн-торгівлі

Це лише деякі з типів мобільних додатків, з якими ми працюємо, і кожен із них може мати свої специфічні особливості та функціональність, а також бути адаптованим під конкретні потреби та цілі клієнта.

Послуги, які ми пропонуємо

Показано 1 з 1Усі 1734 послуг

Голосове керування IoT-пристроями через мобільний застосунок

Складний

~3-5 днів

Часті запитання

Наші компетенції:

Безкоштовна консультація

Замовте безкоштовну консультацію, якщо у вас є питання. Профільний спеціаліст вас проконсультує.

Розрахунок вартості

Якщо ви знаєте, що вам потрібно розробити, або у вас вже є готове технічне завдання.

Етапи розробки

Останні роботи

Розробка мобільного додатка для компанії FEEDME
860
Розробка мобільного додатку для компанії XOOMER
746
Розробка мобільного додатку для компанії RHL
1163
Розробка мобільного додатку для компанії ZIPPY
1035
Розробка мобільного додатку для компанії Affhome
970
Розробка мобільного додатку для компанії FLAVORS
564

Показати більше робіт

Голосове керування IoT-пристроями через мобільний застосунок

Під час розробки голосового керування IoT-пристроями в мобільному застосунку ми часто бачимо, що замовники обмежуються вбудованими асистентами. Але це лише вершина айсберга. Повноцінне рішення включає розпізнавання мови, вилучення намірів (NLU), мапінг на команди пристроїв і зворотний зв'язок — кожен етап може зламатися без правильної архітектури. Замовте розробку голосового керування для вашого IoT-проєкту — ми проведемо аудит і запропонуємо архітектуру за 1 день.

Як голосове керування IoT працює на мобільних пристроях?

Архітектура типового рішення: користувач вимовляє команду → мікрофон → двигун розпізнавання мови (локальний або хмарний) → NLU (вилучення інтенту та сутностей) → мапінг на команди пристроїв → відправка через MQTT/HTTP/BLE на пристрій → зворотний зв'язок через TTS. Кожен етап може бути реалізований по-різному, і вибір визначає затримку, автономність і точність.

Два принципово різних підходи

Вбудовані голосові асистенти (Siri Shortcuts, Google Assistant Actions) працюють через хмару і вимагають явного дозволу користувача. Siri Shortcuts на iOS доступні через INPlayMediaIntent та INSendMessageIntent, але для довільних IoT-команд потрібен AppIntent (iOS 16+) — Swift-фреймворк з описом інтентів. Приклад: «Hey Siri, вимкни світло на кухні» → Siri викликає TurnOffLightIntent у вашому застосунку, який відправляє MQTT-команду. Затримка — 2–4 секунди через хмару Apple, немає гарантій при відключеному інтернеті.

Локальне розпізнавання — інший рівень. На iOS це SFSpeechRecognizer з SFSpeechAudioBufferRecognitionRequest. З iOS 13 підтримує on-device режим (requiresOnDeviceRecognition = true) без відправки аудіо в хмару. На Android — SpeechRecognizer API (через хмару Google) або Vosk / Whisper.cpp для повністю офлайн-розпізнавання.

Для IoT-застосунків, де важлива робота в локальній мережі без інтернету, вибір очевидний — локальне розпізнавання + офлайн NLU.

Чому локальне розпізнавання ефективніше за хмарне?

Локальна обробка дає три ключові переваги:

Затримка: 300–800 мс проти 1.5–3 секунд у хмарних рішень.
Офлайн-робота: повна автономність при відключенні інтернету.
Конфіденційність: аудіодані не покидають пристрій.

Порівняємо обидва підходи:

Параметр	Вбудовані асистенти (хмарні)	Локальне розпізнавання на пристрої
Затримка від натискання до відгуку	2–4 с	0.3–0.8 с
Робота без інтернету	Ні	Так
Точність на українській мові	Добре (Google) / середньо (Apple)	94% після навчання (fastText)
Складність інтеграції	Низька (через SDK)	Середня (моделі, навчання)
Вартість володіння	Оплата за запити	Одноразові витрати на розробку

Зазначимо: як видно, локальне розпізнавання в 3–5 разів швидше і забезпечує економію до 30% на хмарних сервісах при великих обсягах команд. Отримайте консультацію по вашому проєкту — оцінимо можливості та терміни за 1 день.

NLU: від тексту до команди пристрою

Розпізнали «увімкни світло на кухні та підніми температуру до двадцяти двох» — тепер потрібно вилучити:

інтент: turn_on, set_temperature
сутності: device_type=light, location=kitchen, device_type=thermostat, value=22

Для простих кейсів вистачає rule-based підходу: словник дієслів-намірів + словник пристроїв і кімнат з бази користувача. Будуємо регулярні вирази або simple intent matcher на той самий список пристроїв, що вже є в системі.

Для складних сценаріїв — Rasa NLU (self-hosted) або Duckling для числових значень. На Flutter інтегруємо через HTTP-запит до локального сервера в домашній мережі або через dart:ffi для вбудованої моделі.

Реальний приклад: проєкт розумної квартири, 35 пристроїв, українська мова. Навчили просту модель на fastText з ~500 прикладами команд, конвертували в .tflite, запустили через tflite_flutter. Точність на побутових командах — 94% (за даними внутрішнього тестування). Промахи були на складених командах (дві дії в одній фразі) — вирішили попередньою обробкою через розбиття за сполучниками «і», «потім», «після».

Які етапи включає розробка голосового інтерфейсу?

Процес складається з шести кроків:

Аналіз — визначаємо список пристроїв, команди, мови, вимоги до офлайну.
Вибір архітектури — хмарне vs локальне, вибір NLU-двигуна.
Проєктування — мапінг команд, обробка помилок, діалоговий сценарій.
Реалізація — код, інтеграція MQTT, навчання моделі (при необхідності).
Тестування — перевірка на реальних пристроях, стрес-тести на шум та акценти.
Деплой — публікація в App Store / Google Play, налаштування CI/CD.

Для наочності порівняємо NLU-двигуни:

NLU Engine	Тип	Офлайн	Точність (укр)	Складність
Rule-based	Свій код	Так	70–80%	Низька
Rasa NLU	Self-hosted	Так	85–90%	Середня
fastText + tflite	In-app модель	Так	90–95%	Висока
Duckling	Числові entity	Так	>95%	Низька

Детальний опис етапів тестування

Тестування включає перевірку на реальних пристроях, стрес-тести на шум та акценти, а також оцінку роботи wake word при рівні шуму 60 дБ.

Зворотний зв'язок та edge cases

Push to talk vs always-on. Always-on на мобільному — вбивця батареї. Рекомендуємо push-to-talk кнопку в застосунку + опціональне wake word через Porcupine SDK (PicoVoice). Porcupine працює локально, споживає <5% CPU на idle.

Що робити, якщо пристрій не розпізнано?

Не мовчати. Повертаємо голосову відповідь через AVSpeechSynthesizer (iOS) / TextToSpeech (Android), перераховуємо що було зрозуміло, просимо уточнити. Користувач не бачить екран — йому потрібен аудіозворотний зв'язок.

На Flutter використовуємо flutter_tts для синтезу та speech_to_text як unified API поверх платформних двигунів. Важливо: на Android 11+ SpeechRecognizer вимагає RECORD_AUDIO permission з явним поясненням в onRequestPermissionsResult. Без внятного rationale — Google Play консоль позначає як порушення політики.

Інтеграція з MQTT

Голосова команда → NLU → команда пристрою → публікація в MQTT-топік. Затримка від натискання кнопки до відгуку пристрою: розпізнавання на пристрої ~300–800ms, NLU ~50ms, MQTT publish < 50ms при локальному брокері. Разом — відчувається як миттєвий відгук.

При хмарному розпізнаванні додаємо 1.5–3 секунди. На українській мові хмарне Google Speech-to-Text працює добре, Apple Speech — гірше на специфічних IoT-термінах на кшталт «димер», «приймач», «реле».

Приклад публікації MQTT на Swift:

let client = CocoaMQTT(clientID: "iPhone", host: "192.168.1.100", port: 1883)
client.connect()
client.publish("home/kitchen/light", withString: "on", qos: .qos1)

Що входить в роботу

Розробка модуля розпізнавання (iOS/Android/Flutter) з обраним підходом.
Навчання NLU-моделі під ваші команди та пристрої (до 500+ прикладів).
Інтеграція з MQTT-брокером та існуючою IoT-інфраструктурою.
Налаштування wake word (опціонально) та TTS-зворотного зв'язку.
Документація з архітектури та інструкція з додавання нових команд.
Підтримка протягом 30 днів після деплою.

Отримайте консультацію по вашому проєкту — оцінимо можливості та терміни за 1 день.

Строки

Push-to-talk з хмарним розпізнаванням і простим мапінгом команд — 2–3 тижні. Офлайн-розпізнавання + NLU + wake word + TTS зворотний зв'язок — 6–10 тижнів. Вартість залежить від кількості мов, платформ та вимог до офлайн-роботи. Зв'яжіться з нами для оцінки вашого проєкту — ми підготуємо пропозицію за 1 день. Наша команда має понад 30 реалізованих проєктів з голосовим керуванням у сфері IoT.

Apple Developer Documentation, Google Speech API

Інтеграція з залізом: BLE, NFC, IoT та HomeKit у мобільних додатках

Коли задача — зв’язати смартфон з фізичним пристроєм, половина проблем знаходиться не в коді, а в прошивці заліза, характеристиках BLE-сервісів та затримках протоколу. Ми, як мобільні розробники, працюємо на стику з firmware-командою, і без розуміння стеку знизу вгору результат непередбачуваний. Ось чому ми завжди починаємо з HCI-логу та специфікації GATT — Apple Developer: Core Bluetooth Framework — це єдиний спосіб уникнути реверс-інжинірингу в польових умовах.

Чому BLE-інтеграція — найчастіша точка відмови?

Bluetooth Low Energy — основний протокол для носимих, медичних пристроїв, розумних замків та промислових датчиків. Core Bluetooth на iOS та BluetoothGatt на Android реалізують одну специфікацію, але поводяться по-різному в крайніх випадках. Статистика наших проектів: більше 70% звернень у підтримку по BLE пов’язані саме з низькорівневими помилками GATT, а не з логікою додатку.

Сценарій	iOS (Core Bluetooth)	Android (BluetoothGatt)
Управління підключенням	CBCentralManager потребує сильного посилання протягом всієї сесії; втрата об’єкта → розрив з’єднання	disconnect() та close() викликаються окремо; close() без disconnect() → пристрій позначається зайнятим
Типова помилка	Немає попередження при втраті посилання — з’єднання мовчки розривається	Помилка 133 (GATT_ERROR) — виникає при переповненні черги GATT або некоректному закритті попередньої сесії
Сканування	NSBluetoothAlwaysUsageDescription обов’язковий у Info.plist (з iOS 13); без нього сканування не стартує	BLUETOOTH_SCAN потребує neverForLocation (Android 12+), інакше користувач бачить запит геолокації

Що робити з помилкою 133 в Android?

Помилка 133 — найчастіша в Android BLE-розробці. Це не «щось пішло не так», а конкретний індикатор переповнення черги GATT або некоректного закриття попереднього з’єднання. Ми лікуємо її двома прийомами: використовуємо чергу операцій над GATT (write, read, notification subscribe строго послідовно через операційну чергу) та завжди викликаємо disconnect() перед close(). Наша черга GATT-операцій у 3 рази знижує кількість помилок ATT_INSUFFICIENT_RESOURCES порівняно з конкурентними запитами. MTU за замовчуванням — 23 байти. Запит на збільшення (MTU exchange) обов’язковий для передачі даних об’ємом понад 20 байт. На iOS MTU запитується автоматично при підключенні, на Android потрібно явно викликати requestMtu(). Без цього ви не зможете передати, наприклад, зображення або лог через характеристику.

NFC: CoreNFC та Android NFC API

iOS підтримує NFC-читання через CoreNFC з версії iOS 11, запис — з iOS 13. Важливе обмеження: сесія сканування активна лише поки живий об’єкт NFCNDEFReaderSession і показує системний UI. Фонове сканування доступне лише для додатків з entitlement com.apple.developer.nfc.readersession.formats і лише для ISO 14443 (банківські картки, паспорти) — і цей entitlement видається не всім. На Android все простіше: NfcAdapter.enableForegroundDispatch() ловить теги у foreground без системного UI. Фоновий запуск додатку по NFC-тегу реалізується через intent-filter з ACTION_NDEF_DISCOVERED. Порівняння платформ по NFC:

Функція	iOS (CoreNFC)	Android (NfcAdapter)
Фонове читання	Тільки з entitlement та ISO 14443	Через intent-filter ACTION_NDEF_DISCOVERED
Запис	З iOS 13 (NDEF)	З коробки (API 10+)
Сесія	Триває до 5 хвилин з системним UI	Необмежено у foreground, background по тегу
Запуск додатку	Тільки foreground	Автоматично при виявленні тегу

HomeKit та Matter

HomeKit — екосистема Apple для розумного дому. Для інтеграції пристрій повинен мати MFi-сертифікацію (або працювати через Software Authentication для Matter). Мобільний додаток використовує HomeKit framework: HMHomeManager → HMHome → HMRoom → HMAccessory → HMService → HMCharacteristic. Matter (раніше CHIP) — крос-платформний стандарт, який підтримують Apple, Google, Amazon та Samsung. На iOS Matter-пристрої додаються через MTRDeviceController, на Android — через Google Home SDK або Matter SDK безпосередньо. Перевага Matter: один пристрій працює з HomeKit, Google Home та Alexa без перепрошивки, а конфігурація налаштовується в 4 рази швидше порівняно з власним HAP-протоколом.

Параметр	HomeKit	Matter
Сертифікація	MFi — апаратний чіп	Software Authentication (ключі)
Підтримка платформ	Тільки Apple	Apple, Google, Amazon, Samsung
Додавання пристрою	HMHomeManager	MTRDeviceController / Google Home SDK
Протокол	HAP (IP, BLE)	IP-based (Wi-Fi, Thread)

Для Flutter та React Native використовуємо flutter_blue_plus та react-native-ble-plx відповідно — обидва активно підтримуються і покривають 90% сценаріїв, але для роботи з GATT-нотифікаціями у background на Android все одно потрібен foreground service. Переконайтеся, що deep linking (Universal Links на iOS, App Links на Android) налаштовані для коректного пробудження додатку при скануванні NFC-тегу або отриманні push-повідомлення від IoT-пристрою. Вимоги ATT (App Tracking Transparency) для інтеграції з залізом зазвичай не застосовуються, але якщо додаток збирає анонімну аналітику — додайте запит. Отримайте консультацію нашого інженера — він розбере вашу специфікацію за 2 дні.

Як ми інтегруємо BLE та NFC?

Аналітика — отримуємо від firmware-команди повну специфікацію BLE GATT (список сервісів, характеристик, формати даних) або HCI-лог. Без цього розробка перетворюється на реверс-інжиніринг через nRF Connect або Wireshark over HCI.
Проектування — визначаємо архітектуру підключень: чергу GATT-операцій, фонові сервіси для Android, перепідключення при втраті зв’язку. Враховуємо MTU-узгодження та обробку помилок ATT_INSUFFICIENT_RESOURCES.
Реалізація — кодимо на Swift/Kotlin з урахуванням особливостей платформ (Universal Links, App Links, push-повідомлення через APNs/FCM для тригерів). Для захисту Android-коду використовуємо ProGuard / R8 (shrink).
Тестування — на реальних пристроях з першого дня. Емулятор BLE в симуляторах не відтворює edge cases перепідключення, втрати сигналу, зміни MTU. Використовуємо автоматизацію на базі XCTest та Espresso.
Деплой — завантаження в App Store Connect / Google Play Console з правильним code signing та provisioning profile. Для iOS — TestFlight, для Android — Firebase App Distribution.

Що входить в роботу (deliverables)

Вихідний код мобільного додатку з інтеграцією BLE, NFC або IoT (Swift / Kotlin / Flutter / React Native)
Документація по протоколу GATT (карта сервісів та характеристик)
Навантажувальне тестування на 10+ реальних пристроях (помилка 133, перепідключення, MTU-узгодження)
Аналіз та усунення edge cases (помилка ATT_INSUFFICIENT_RESOURCES, втрата з’єднання на фоні, конфлікт з background fetch)
Інструкція зі збірки та деплою (code signing, TestFlight, Firebase App Distribution)
Місяць підтримки після релізу

Строки та орієнтовна вартість

Проста інтеграція з одним BLE-периферійним пристроєм (показання + команди керування) — від 2 до 4 тижнів. Типова вартість такої задачі розраховується індивідуально, включаючи налагодження GATT-профілю та обробку edge cases. Повноцінний IoT-додаток з декількома типами пристроїв, firmware OTA-оновленнями та HomeKit-підтримкою — від 2 місяців. Вартість розраховується індивідуально під ваш проект.

Ми займаємося мобільною розробкою кілька років — досвід 45+ проектів з BLE/NFC/HomeKit. Наші інженери сертифіковані Apple та Google, а кожен етап роботи фіксується в issue tracker з прив’язкою до комітів. Ми гарантуємо прозорість процесу та дотримання строків. Використовуємо підхід «інженер клієнту»: без маркетингових пауз, з прямим доступом до розробника.

Закажіть оцінку — отримайте консультацію інженера з розбором вашої специфікації. Замовте інтеграцію під ключ: ми проаналізуємо HCI-лог, перевіримо GATT-характеристики та запропонуємо архітектуру за 2 дні.