Какие форматы исходных моделей поддерживаются?

Поддерживаются PyTorch (TorchScript), TensorFlow (SavedModel, Frozen Graph), Keras, ONNX. Через промежуточную конвертацию можно преобразовать практически любую модель. Главное — избежать нестандартных операций, не поддерживаемых coremltools.

Какой формат Core ML лучше: mlprogram или neuralnetwork?

Рекомендуем mlprogram — это новый IR, поддерживающий FP16 и операции на ANE (Neural Engine). Он требует iOS 15+. neuralnetwork — старый формат, совместим с iOS 12+. Для новых проектов выбирайте mlprogram.

Можно ли конвертировать модель с динамическими размерами входа?

Да, Core ML поддерживает переменные размеры через RangeDim или EnumeratedShapes. Однако оптимизация графа для каждого размера работает лучше при перечислении конкретных значений. RangeDim даёт гибкость, но может снизить производительность.

Что делать, если coremltools выдаёт ошибку при конвертации?

Типичные причины: нестандартные операции (например, einsum), неподдерживаемые паттерны (словарь на выходе), динамические ветки. Решения: обернуть модель, заменить операцию на стандартную, использовать ONNX как промежуточный шаг.

Как проверить, что конвертация не изменила точность модели?

Сравните выходы оригинальной модели и Core ML на тестовом наборе. Для численной оценки используйте максимальную разницу (max diff) — значение менее 0.01 для FP16 считается допустимым. Если разница больше, проверьте настройки нормализации и квантования.

Какие форматы исходных моделей поддерживаются?

Поддерживаются PyTorch (TorchScript), TensorFlow (SavedModel, Frozen Graph), Keras, ONNX. Через промежуточную конвертацию можно преобразовать практически любую модель. Главное — избежать нестандартных операций, не поддерживаемых coremltools.

Какой формат Core ML лучше: mlprogram или neuralnetwork?

Рекомендуем mlprogram — это новый IR, поддерживающий FP16 и операции на ANE (Neural Engine). Он требует iOS 15+. neuralnetwork — старый формат, совместим с iOS 12+. Для новых проектов выбирайте mlprogram.

Можно ли конвертировать модель с динамическими размерами входа?

Да, Core ML поддерживает переменные размеры через RangeDim или EnumeratedShapes. Однако оптимизация графа для каждого размера работает лучше при перечислении конкретных значений. RangeDim даёт гибкость, но может снизить производительность.

Что делать, если coremltools выдаёт ошибку при конвертации?

Типичные причины: нестандартные операции (например, einsum), неподдерживаемые паттерны (словарь на выходе), динамические ветки. Решения: обернуть модель, заменить операцию на стандартную, использовать ONNX как промежуточный шаг.

Как проверить, что конвертация не изменила точность модели?

Сравните выходы оригинальной модели и Core ML на тестовом наборе. Для численной оценки используйте максимальную разницу (max diff) — значение менее 0.01 для FP16 считается допустимым. Если разница больше, проверьте настройки нормализации и квантования.

Конвертация ML-модели в Core ML для iOS

TRUETECH занимается разработкой, поддержкой и обслуживанием мобильных приложений iOS, Android, PWA. Имеем большой опыт и экспертизу для публикации мобильных приложений в популярные маркеты Google Play, App Store, Amazon, AppGallery и другие.

8+Лет на рынкеподробнее 900+Реализованных проектовподробнее 100+Разработчиков в штатеподробнее 19+Партнеровподробнее

Разработка и поддержка любых видов мобильных приложений:

Информационные и развлекательные мобильные приложения

Новостные приложения, игры, справочники, онлайн-каталоги, погодные, фитнес и здоровье, туристические, образовательные, социальные сети и мессенджеры, квиз, блоги и подкасты, форумы, агрегаторы

Мобильные приложения электронной коммерции

Интернет-магазины, B2B-приложения, маркетплейсы, онлайн-обменники, кэшбэк-сервисы, биржи, дропшиппинг-платформы, программы лояльности, доставка еды и товаров, платежные системы

Мобильные приложения для управления бизнес-процессами

CRM-системы, ERP-системы, управление проектами, инструменты для команды продаж, учет финансов, управление производством, логистика и доставка, управление персоналом, системы мониторинга данных

Мобильные приложения электронных услуг

Доски объявлений, онлайн-школы, онлайн-кинотеатры, платформы предоставления электронных услуг, платформы кешбека, видеохостинги, тематические порталы, платформы онлайн-бронирования и записи, платформы онлайн-торговли

Это лишь некоторые из типы мобильных приложений, с которыми мы работаем, и каждый из них может иметь свои специфические особенности и функциональность, а также быть адаптированным под конкретные потребности и цели клиента.

Услуги, которые мы предлагаем

Показано 1 из 1Все 1734 услуг

Конвертация ML-модели в Core ML для iOS

Средний

от 1 дня до 3 дней

Часто задаваемые вопросы

Наши компетенции:

Бесплатная консультация

Закажите бесплатную консультацию если у вас есть вопросы. Профильный специалист вас проконсультирует.

Расчет стоимости

Если вы знаете, что именно вам нужно разработать, или у вас уже есть готовое техническое задание.

Этапы разработки

Последние работы

Разработка мобильного приложения для компании FEEDME
858
Разработка мобильного приложения для компании XOOMER
745
Разработка мобильного приложения для компании RHL
1162
Разработка мобильного приложения для компании ZIPPY
1034
Разработка мобильного приложения для компании Affhome
968
Разработка мобильного приложения для компании FLAVORS
563

Показать больше работ

Проблемы конвертации в Core ML

Получить .mlpackage из PyTorch или TensorFlow — задача с конкретными шагами, где каждый может сломаться по неочевидной причине. coremltools не поддерживает все операции — например, einsum, свёртки с динамическими размерами или ветвления в графе. Прямая конвертация часто выдаёт ошибку или приводит к падению точности на 5–10 %. Мы накопили опыт решения таких кейсов: за 5 лет работы мы конвертировали более 50 моделей для финансового сектора, ритейла и AR-приложений. В среднем инференс на iPhone ускоряется на 30–50 % после оптимизации под Apple Neural Engine. Закажите конвертацию — получите готовый .mlpackage с верификацией точности.

Почему конвертация в Core ML требует знаний?

coremltools не поддерживает все операции PyTorch/TensorFlow, а для других требуется правильная настройка параметров. Прямая конвертация часто приводит к ошибкам или ухудшению точности. Мы решаем эти проблемы, подбирая оптимальные параметры и при необходимости используя кастомные слои.

Подготовка модели к конвертации

Перед конвертацией модель должна быть в eval-режиме с фиксированными весами. torch.jit.trace требует примера входных данных — он записывает граф для конкретного shape:

import torch
import torchvision
import coremltools as ct

model = MyModel()
model.load_state_dict(torch.load("weights.pth", map_location="cpu"))
model.eval()

# trace — фиксирует граф для конкретного shape
example_input = torch.zeros(1, 3, 224, 224)
traced_model = torch.jit.trace(model, example_input)

# Для ветвлений (if/else) используйте torch.jit.script:
# scripted_model = torch.jit.script(model)

# Конвертация в mlprogram
mlmodel = ct.convert(
    traced_model,
    inputs=[ct.ImageType(
        name="input",
        shape=ct.Shape(shape=(1, 3, 224, 224)),
        color_layout=ct.colorlayout.RGB,
        bias=[-0.485/0.229, -0.456/0.224, -0.406/0.225],
        scale=1/(255.0 * 0.229)
    )],
    outputs=[ct.TensorType(name="logits")],
    compute_precision=ct.precision.FLOAT16,
    minimum_deployment_target=ct.target.iOS16,
    convert_to="mlprogram"
)

mlmodel.short_description = "Image classifier"
mlmodel.input_description["input"] = "RGB image 224x224"
mlmodel.output_description["logits"] = "Class probabilities"
mlmodel.save("MyModel.mlpackage")

Если прямая конвертация не работает, используйте ONNX как промежуточный шаг: torch.onnx.export(model, example_input, "model.onnx", opset_version=17), затем ct.converters.onnx.convert.

Как проверить корректность конвертации?

Сравните выходы оригинальной модели и Core ML на тестовом изображении:

import numpy as np
import PIL.Image

img = PIL.Image.open("test.jpg").resize((224, 224))

transform = torchvision.transforms.Compose([
    torchvision.transforms.ToTensor(),
    torchvision.transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])
])
tensor = transform(img).unsqueeze(0)
with torch.no_grad():
    pytorch_out = model(tensor).numpy()

coreml_out = mlmodel.predict({"input": img})["logits"]

max_diff = np.max(np.abs(pytorch_out - coreml_out))
print(f"Max difference: {max_diff}")

Норма для FP16 — меньше 0.01. Если разница больше 0.05 — проверьте нормализацию в ct.ImageType.

Как настроить переменные размеры входа?

# Диапазон размеров
flexible_shape = ct.Shape(
    shape=(1, 3, ct.RangeDim(min_val=64, max_val=1024), ct.RangeDim(min_val=64, max_val=1024))
)

# Набор конкретных размеров
enumerated_shapes = ct.EnumeratedShapes(
    shapes=[
        ct.Shape(shape=(1, 3, 224, 224)),
        ct.Shape(shape=(1, 3, 384, 384)),
        ct.Shape(shape=(1, 3, 512, 512)),
    ]
)

mlmodel = ct.convert(traced_model, inputs=[ct.TensorType(name="input", shape=enumerated_shapes)])

Кастомные операции

Если модель содержит операцию, которую coremltools не знает, добавьте кастомный слой на Swift. На Python регистрируем операцию:

@ct.converters.mil.register_torch_op()
def my_custom_op(context, node):
    x = context[node.inputs[0]]
    result = mb.custom(params={"...": "..."}, inputs={"x": x}, ...)
    context.add(result)

import CoreML

@objc(MyCustomLayer)
class MyCustomLayer: NSObject, MLCustomLayer {
    required init(parameters: [String: Any]) throws { }
    func setWeightData(_ weights: [Data]) throws { }
    func outputShapes(forInputShapes inputShapes: [[NSNumber]]) throws -> [[NSNumber]] { ... }
    func evaluate(inputs: [MLMultiArray], outputs: [MLMultiArray]) throws { }
}

Кастомный слой выполняется на CPU — для производительности лучше использовать стандартные операции.

Сравнение производительности на устройствах

Apple Neural Engine ускоряет инференс в 10–20 раз по сравнению с CPU. Результаты для модели ResNet-50 (224x224):

Устройство	CPU (ms)	GPU (ms)	ANE (ms)
iPhone 14 Pro	45	30	12
iPhone 13	60	40	18
iPhone SE (3rd gen)	90	65	30

Сравнение форматов Core ML

Параметр	mlprogram	neuralnetwork
iOS версия	15+	12+
ANE поддержка	Да	Нет
FP16	Да	Только FP32
Размер	Меньше	Больше
Производительность	Выше	Ниже

Что входит в работу по конвертации?

Аудит модели — анализ графа, выявление несовместимых операций, рекомендации по рефакторингу. Проверка на поддержку ANE.
Конвертация — подбор точности (FP16/INT8), размера входа, решение ошибок coremltools. При необходимости — кастомные слои.
Верификация точности — сравнение на 100+ тестовых примерах, отчёт с max diff и метриками (accuracy, mAP).
Оптимизация под ANE — замена Reshape/Permute на ANE-совместимые, устранение узких мест, квантование.
Документация — описание параметров модели, интеграции в Xcode, пример использования.

Чек-лист конвертации

[ ] Модель в eval-режиме, веса заморожены
[ ] Пример входных данных подготовлен
[ ] Выбран format mlprogram (если iOS >= 15)
[ ] Проверена поддержка операций через PYTORCH_OPS_REGISTRY
[ ] Выполнена численная верификация (max diff < 0.01)
[ ] Протестировано на целевых устройствах (CPU/GPU/ANE)
[ ] Результаты сравнения времени инференса задокументированы

Квантование: INT8 vs FP16

Помимо конвертации в mlprogram, квантование позволяет дополнительно уменьшить размер модели и ускорить инференс. FP16 (float16) сокращает объём весов вдвое без заметной потери точности — это наш стандарт по умолчанию. INT8 уменьшает модель ещё в 2 раза, но требует калибровочного датасета для оценки погрешности квантования. На Apple Neural Engine INT8 работает особенно быстро: прирост скорости составляет 1,5–2× по сравнению с FP16. Для задач классификации и детекции объектов потеря точности при INT8 обычно не превышает 1–2%. Для задач с текстом или генерацией — FP16 предпочтительнее.

# Квантование в INT8 через coremltools
mlmodel_int8 = ct.compression_utils.affine_quantize_weights(mlmodel, mode="linear_symmetric")
mlmodel_int8.save("MyModel_INT8.mlpackage")

Наша команда проводит сравнительное тестирование обоих форматов на вашем конкретном устройстве и выбирает оптимальный вариант. Стоимость квантования включена в стоимость конвертации и не тарифицируется отдельно.

Получите консультацию инженера по вашей модели — оценим сложность конвертации и подберём оптимальные параметры. Обращайтесь к нам для аудита и конвертации.

AI и ML в мобильных приложениях: CoreML, TFLite и on-device модели

Мы различаем два принципиально разных подхода: приложение с on-device AI и приложение, которое просто вызывает облачное API. Первое работает без интернета, не отправляет данные пользователя на сторонние серверы и отвечает за 50 миллисекунд. Второе зависит от задержки сети и тарифного плана. Выбор архитектуры — ключевой этап, который напрямую влияет на стоимость, приватность и пользовательский опыт. Наш опыт показывает: в 70% проектов on-device инференс оказывается дешевле в долгосрочной перспективе за счёт исключения серверных затрат.

Как выбрать между CoreML и TFLite для on-device инференса?

CoreML — нативный фреймворк Apple для запуска ML-моделей на устройстве. Поддерживает Neural Engine (начиная с A11 Bionic), GPU и CPU как fallback. Модели конвертируются в формат .mlmodel через coremltools из PyTorch, ONNX или TensorFlow. Конвертация — не всегда тривиальна: кастомные слои требуют реализации MLCustomLayer, а квантизация до INT8 иногда заметно роняет точность на специфических данных. Мы гарантируем, что итоговая модель проходит валидацию на реальных данных до и после конвертации.

TensorFlow Lite — кросс-платформенная альтернатива для Android и Flutter. На Android использует NNAPI (Neural Networks API) для хардварного ускорения — с Android 10 NNAPI стабильнее, до этого лучше явно использовать GPU delegate через GpuDelegate. Типичная ошибка: модель обучена на нормализованных данных в диапазоне [0,1], а в приложении на вход подаётся [0,255] — инференс работает, но с бессмысленными результатами без ошибки. Мы включаем модуль автоматической валидации входных данных в SDK.

Для задач классификации изображений, детекции объектов и сегментации доступны готовые оптимизированные модели. YOLOv8 в CoreML формате запускает детекцию кадра 640×640 за 15–20 мс на iPhone 14 Neural Engine. MobileNetV3 на TFLite с GPU delegate — около 8 мс на Pixel 7 при классификации.

Параметр	CoreML	TFLite
Платформы	iOS, macOS, watchOS	Android, iOS, Linux, embedded
Хардварное ускорение	Neural Engine, GPU, CPU	NNAPI, GPU (OpenCL/OpenGL), CPU
Поддержка квантизации	FP16, INT8 (с coremltools)	FP16, INT8, dynamic range
Кастомные операции	Через MLCustomLayer (Swift)	Через делегаты (Java/Kotlin)
Размер бандла модели	~3–5 МБ (MobileNetV2 quantized)	~2–4 МБ

Что делать, если нужна генерация текста на устройстве?

Запуск небольших языковых моделей на устройстве стал реальностью в последние несколько лет. Apple Intelligence использует собственные модели через Private Cloud Compute, но для сторонних разработчиков доступны другие пути.

llama.cpp с Metal backend на iOS — работающий подход для phi-3-mini (3.8B параметров, 4-bit квантизация, ~2.3 ГБ). Инференс: 15–25 токенов/секунду на iPhone 15 Pro. Для интеграции в Swift используем Swift Package llama.swift или обёртку через C-интерфейс llama.h. Бинарник к приложению не прикладываем — модель скачивается при первом запуске и хранится в Application Support. Наши сертифицированные разработчики настраивают инкрементальную загрузку, чтобы не блокировать первый запуск.

На Android аналог — Google AI Edge (бывший MediaPipe LLM Inference API) с поддержкой Gemma-2B. Работает через GPU delegate, на Tensor G3 чипе Pixel 8 Pro — около 20 токенов/секунду.

Ограничения реальны: модели больше 4B параметров на мобильных устройствах по-прежнему медленны. Для сложных задач рассуждения on-device LLM уступает GPT-4o в качестве. Гибридный подход — on-device для коротких задач и приватных данных, облако для сложных запросов — часто оптимален. Оценим ваш кейс и предложим баланс производительности и приватности — пишите.

Интеграция OpenAI API и других облачных моделей

Для сценариев, где cloud inference допустим, интеграция OpenAI, Anthropic или Google Gemini — это HTTP клиент + streaming SSE. В Swift удобно через AsyncThrowingStream для стриминговых ответов. В Kotlin — через Flow.

Критически важно: API-ключи никогда не хранятся в бандле приложения. Даже обфусцированный ключ извлекается из IPA за 10 минут через strings или frida. Правильная архитектура: мобильное приложение → собственный backend → OpenAI API. Backend контролирует rate limiting, логирует запросы, защищает ключ.

Что входит в работу (deliverables)

Обученная и квантизированная модель под целевое устройство (документация по метрикам)
SDK для интеграции (Swift/Kotlin/Flutter) с примерами вызова
Тесты производительности на 3–5 реальных устройствах
Инструкция по обновлению модели OTA
Поддержка при прохождении модерации App Store / Google Play (проверка соответствия Guidelines 4.2, 5.1)
2 недели технической поддержки после релиза

Типичный пайплайн проекта

Анализ задачи — замеряем latency, privacy, size, поддерживаемые устройства.
Прототипирование модели — в Python, оценка accuracy на целевых данных.
Конвертация и квантизация — под CoreML/TFLite с валидацией.
Интеграция в приложение — модель оборачивается в сервисный слой (легко подменять CoreML → TFLite → облако).
Тестирование — на реальных девайсах, замер FPS, RAM, батареи.
Деплой — через TestFlight / Firebase App Distribution, мониторинг метрик.

Сроки: интеграция готовой CoreML/TFLite модели — 1–2 недели, разработка кастомной модели с мобильной оптимизацией — от 6 недель, on-device LLM чат с персонализацией — 4–8 недель.

Почему мы беремся за сложные кейсы?

10+ лет опыта в мобильной разработке, 50+ внедрённых AI/ML решений, гарантия совместимости с актуальными версиями iOS и Android. Все проекты проходят code review и нагрузочное тестирование. В стоимость уже входит подготовка документации для модерации и обучение вашей команды.

Свяжитесь с нами — мы поможем выбрать архитектуру и внедрить ML в ваше приложение под ключ. Закажите аудит существующего решения — бесплатно оценим потенциал экономии серверных затрат (в некоторых проектах экономия достигает $10k в месяц).