Три модели. Три разных ответа на вопрос «какой AI поставить в основу чат-бота». Ошибка выбора стоит дорого: переписать интеграцию на другую модель — это 40–80 часов работы, потеря наработанных промптов и разочарование клиентов. Разбираем честно, без маркетинга.
TL;DR: сравнительная таблица AI-моделей для чат-ботов 2026
| Критерий | GPT-4o | GigaChat Pro | YandexGPT Pro |
|---|---|---|---|
| Качество русского языка | ★★★★★ | ★★★★☆ | ★★★★☆ |
| Цена (input / 1М токенов) | $2.50 | ≈ 600 ₽ | ≈ 400 ₽ |
| Цена (output / 1М токенов) | $10.00 | ≈ 1 600 ₽ | ≈ 1 200 ₽ |
| 152-ФЗ compliance | ✗ (сервера США) | ✓ (данные в РФ) | ✓ (данные в РФ) |
| Function calling / JSON mode | ★★★★★ | ★★★☆☆ | ★★★☆☆ |
| RAG / embeddings (RU) | ★★★★☆ | ★★★★☆ | ★★★★★ |
| Зрелость API | ★★★★★ | ★★★☆☆ | ★★★★☆ |
| Контекстное окно | 128K токенов | 32K токенов | 32K токенов |
| Для чего лучше всего | Сложные агенты, B2B, инфобизнес | Банки, гос, медицина, юр. сервисы | Экосистема Яндекса, Алиса |
Почему выбор AI-модели — это не только техника?
Для российского бизнеса выбор языковой модели — это вопрос не только качества ответов, но и юридических рисков, операционной стабильности и реальных денег.
Регуляторика. Федеральный закон 152-ФЗ «О персональных данных» требует хранить и обрабатывать персональные данные граждан РФ на серверах, расположенных в России. Это напрямую касается чат-ботов в медицинских клиниках, банках, госсервисах и любых системах, где пользователь вводит ФИО, номер телефона, паспортные данные. Отправка такого запроса в OpenAI технически нарушает закон.
Санкционные риски. OpenAI ограничивает доступ для ряда российских юрлиц. Оплата через зарубежные карты становится всё сложнее. Риск «завтра сервис недоступен» реален — и закладывать такой риск в production-систему без fallback неразумно.
Качество русского языка. GPT-4o обучен на огромном корпусе русского текста и понимает нюансы, идиомы, профессиональный жаргон лучше, чем GigaChat или YandexGPT. Разница особенно заметна в сложных диалогах, где важна точность формулировок.
GPT-4o: когда нужна максимальная мощность
В чём реальное преимущество GPT-4o?
GPT-4o остаётся эталоном по качеству понимания контекста на русском языке в 2026 году. Несколько конкретных точек, где разрыв с конкурентами ощутим:
- Function calling и JSON mode. GPT-4o стабильно возвращает структурированный JSON по инструкции — даже в сложных многошаговых сценариях. Это критично для AI-агентов, которые вызывают внешние API, работают с CRM или выполняют последовательности действий.
- Контекстное окно 128K токенов. В чат-ботах с длинной историей диалога или RAG-поиском по большому корпусу документов это реальное преимущество.
- Vision. Пользователь может прислать фото документа, скриншота или товара — бот обработает. GigaChat и YandexGPT vision-возможностями в production пока уступают.
- Экосистема инструментов. Тысячи готовых интеграций, промпт-инженеринг сообщество, обновляемая документация — скорость разработки выше.
Какие риски у GPT-4o для бизнеса в России?
- 152-ФЗ. Данные уходят на серверы Microsoft Azure (США). Для медицины, финансов и государственных проектов — это стоп-фактор.
- Доступность оплаты. Оплатить OpenAI API из России в 2026 году — задача с несколькими обходными маршрутами (зарубежные карты, посредники). Стабильность платёжной цепочки не гарантирована.
- Нестабильность доступа. Геополитическая ситуация может изменить правила в любой момент.
Цены GPT-4o в 2026 году
| Модель | Input | Output |
|---|---|---|
| GPT-4o | $2.50 / 1М токенов | $10.00 / 1М токенов |
| GPT-4o mini | $0.15 / 1М токенов | $0.60 / 1М токенов |
Для среднего бот-проекта (50 000 сообщений/месяц, ~500 токенов на диалог) расход на GPT-4o составит $150–300/мес. GPT-4o mini снизит это до $15–40/мес, но с заметной потерей качества на сложных задачах.
Когда выбирать GPT-4o?
- B2B-боты без строгих требований к локализации данных
- Инфобизнес, онлайн-школы, коучинг
- Сложные AI-агенты с многошаговой логикой
- Проекты, где качество русского языка критично для конверсии
- Стартапы, которым нужна скорость разработки
GigaChat: compliance-first решение от Сбера
Почему GigaChat — выбор для regulated-бизнеса?
GigaChat от Сбера — это единственная крупная языковая модель с явной гарантией обработки данных на российских серверах и поддержкой требований 152-ФЗ на уровне соглашений об уровне сервиса (SLA). Для отдельных категорий бизнеса это не «плюс», а обязательное условие.
- Данные остаются в РФ. Сбер размещает инфраструктуру в российских дата-центрах. Это можно зафиксировать в договоре.
- Рублёвая оплата. Нет валютных рисков, нет проблем с зарубежными картами — оплата через стандартные российские инструменты.
- Интеграция со Сбером. Если бизнес работает с экосистемой СберБизнес, СберЛогистики или другими продуктами банка, синергия очевидна.
- Корпоративный договор. Возможность заключить полноценный B2B-договор с российским юрлицом — важно для госзаказчиков и enterprise.
Где у GigaChat ограничения?
- Качество ответов. GigaChat Pro заметно уступает GPT-4o в сложных диалогах, работе с нестандартными запросами, точности при function calling. В простых FAQ-ботах разница незначительна, в агентах — существенна.
- API зрелость. Документация менее подробная, sdk менее зрелые, количество готовых интеграций меньше. Разработка занимает больше времени.
- Контекстное окно. 32K токенов против 128K у GPT-4o — ограничение для длинных документов и сложных RAG-сценариев.
Цены GigaChat в 2026 году
| Модель | Input | Output |
|---|---|---|
| GigaChat Lite | ≈ 100 ₽ / 1М токенов | ≈ 400 ₽ / 1М токенов |
| GigaChat Pro | ≈ 600 ₽ / 1М токенов | ≈ 1 600 ₽ / 1М токенов |
| GigaChat Max | ≈ 2 000 ₽ / 1М токенов | ≈ 6 000 ₽ / 1М токенов |
Когда выбирать GigaChat?
- Банки и финансовые сервисы
- Медицинские клиники и телемедицина
- Государственные и муниципальные проекты
- Юридические компании, работающие с персональными данными
- Любой бизнес, где DPA (соглашение об обработке данных) с российским юрлицом — требование заказчика
YandexGPT: мощь экосистемы Яндекса
В чём сила YandexGPT?
YandexGPT — это языковая модель, встроенная в Yandex Cloud с корпоративным SLA и полным набором облачных инструментов. Данные обрабатываются в России, оплата в рублях.
- Интеграция с Yandex Cloud. Если инфраструктура проекта уже на Yandex Cloud (Object Storage, Managed PostgreSQL, Cloud Functions), добавить YandexGPT — минимальные усилия.
- Яндекс 360 и B2B-продукты. Для корпоративных ботов внутри экосистемы Яндекса — нативная интеграция.
- Алиса. Если нужен голосовой бот, YandexGPT + Алиса — очевидный выбор.
- Балансировка нагрузки. Yandex Cloud обеспечивает хорошую доступность и горизонтальное масштабирование.
- Embeddings для русского текста. Модель
text-search-doc-v1от Яндекса показывает сильные результаты на русскоязычных корпусах — подробнее в разделе про RAG.
Где YandexGPT уступает?
- Function calling. Поддержка инструментов есть, но по гибкости и надёжности уступает GPT-4o — сложные AI-агенты с многошаговыми цепочками требуют больше усилий.
- Quality gap. На задачах, требующих глубокого рассуждения, понимания неявного контекста или нестандартных формулировок, GPT-4o стабильно выдаёт лучший результат.
Цены YandexGPT в 2026 году
| Модель | Input | Output |
|---|---|---|
| YandexGPT Lite | ≈ 20 ₽ / 1М токенов | ≈ 60 ₽ / 1М токенов |
| YandexGPT Pro | ≈ 400 ₽ / 1М токенов | ≈ 1 200 ₽ / 1М токенов |
Когда выбирать YandexGPT?
- Компании, чья инфраструктура уже в Yandex Cloud
- Голосовые боты через Алису
- Внутренние корпоративные ассистенты в экосистеме Яндекса
- Проекты с требованием 152-ФЗ и ограниченным бюджетом
Как мы используем AI-модели в BotKraft: гибридный подход
На практике мы редко советуем клиентам выбирать одну модель и ставить на неё всё. Наш типовой подход — гибридная архитектура.
Пример для медицинской клиники:
- Классификация запроса и логика диалога — YandexGPT Pro (данные в РФ, дешевле)
- Сложные клинические вопросы с нюансами — GigaChat Pro (compliance + качество выше Lite-версий)
- Запись на приём, работа с расписанием — rule-based логика без AI (100% предсказуемо)
Пример для B2B SaaS-компании:
- Основной диалог — GPT-4o (максимальное качество, клиент не против зарубежных серверов)
- Fallback при недоступности — YandexGPT Pro
- Embeddings для базы знаний — text-embedding-3-small от OpenAI (сильные результаты на смешанных RU/EN корпусах)
Такой подход позволяет балансировать между качеством, стоимостью и compliance-требованиями.
RAG-возможности: у кого лучше embeddings для русского текста?
RAG (Retrieval-Augmented Generation) — это архитектура, при которой бот ищет релевантные фрагменты из базы знаний и подставляет их в контекст запроса. Качество поиска напрямую зависит от качества векторных представлений (embeddings).
| Модель embeddings | Качество на RU | Цена | Рекомендация |
|---|---|---|---|
text-embedding-3-small (OpenAI) | ★★★★☆ | $0.02 / 1М токенов | Лучший баланс цена/качество |
text-embedding-3-large (OpenAI) | ★★★★★ | $0.13 / 1М токенов | Когда нужна максимальная точность |
text-search-doc-v1 (Яндекс) | ★★★★★ | ≈ 10 ₽ / 1М токенов | Лучший выбор для чисто русских корпусов |
| GigaChat embeddings | ★★★☆☆ | в составе тарифа | Для compliance-проектов в экосистеме Сбера |
Вывод по RAG: для русскоязычных баз знаний модели Яндекса (text-search-doc-v1) показывают конкурентный результат при минимальной стоимости. Для смешанных RU/EN корпусов или международных проектов — text-embedding-3-small от OpenAI.
Сколько стоит AI-модуль в чат-боте?
Ответ на вопрос «сколько будет стоить AI» состоит из двух частей: разовые затраты на интеграцию и операционные расходы.
Разовая интеграция AI в чат-бот: от 20 000 ₽
Это минимальная стоимость подключения готовой языковой модели к существующему боту: настройка промптов, обработка ошибок, мониторинг. Если нужен RAG с базой знаний, function calling или сложная агентная логика — от 60 000 ₽.
Операционные расходы на AI (в месяц):
| Масштаб | Сообщений/месяц | Стоимость (GPT-4o) | Стоимость (YandexGPT Pro) |
|---|---|---|---|
| Малый бизнес | 5 000 | $10–30 | 200–600 ₽ |
| Средний бизнес | 50 000 | $100–300 | 2 000–6 000 ₽ |
| Высокая нагрузка | 500 000 | $1 000–3 000 | 20 000–60 000 ₽ |
Расчёт приблизительный: зависит от длины диалогов, сложности промптов и доли RAG-запросов.
Итог: дерево решений — какую модель выбрать?
Есть требования 152-ФЗ или данные нельзя покидать РФ?
│
├─ ДА
│ ├─ Инфраструктура уже на Yandex Cloud? → YandexGPT Pro
│ ├─ Банк, медицина, гос-сектор → GigaChat Pro
│ └─ Нужен максимальный контроль → GigaChat Max / гибрид
│
└─ НЕТ
├─ Сложный AI-агент с function calling → GPT-4o
├─ Нужен баланс цена/качество → GPT-4o mini + GPT-4o для сложных запросов
└─ Экосистема Яндекса / Алиса → YandexGPT Pro
Три правила выбора:
- Compliance определяет ограничения, бизнес-задача — выбор внутри них. Сначала ответьте на вопрос 152-ФЗ, потом выбирайте из оставшихся вариантов.
- Не экономьте на embeddings. Плохой поиск в RAG убивает качество бота дешевле, чем дорогая генеративная модель его спасёт.
- Гибрид — это не усложнение, а страховка. Fallback с дорогой модели на дешёвую при пиковой нагрузке экономит деньги. Fallback с зарубежной на российскую при недоступности — экономит нервы.
Если вы не уверены, какая модель подойдёт для вашего проекта — мы разберём задачу, посчитаем реальную стоимость и предложим архитектуру. Без лишних слов и маркетинга.