От выделенного шлюза с гарантиями SLA до полного on-premise развёртывания в вашем контуре. Без зависимости от зарубежных облаков, с инструментами контроля данных и соответствия 152-ФЗ.
OpenAI, Anthropic, Google периодически блокируют российские IP. Команды используют VPN — это риск, неудобство и нарушение корпоративных политик безопасности.
Разработчики отправляют запросы напрямую в внешние API — контракты, персональные данные клиентов, внутренние документы. Это нарушение 152-ФЗ и внутренних политик ИБ.
Разные команды используют разные ключи и модели. Нет единой аналитики расходов, нет аудита запросов, нет возможности ограничить доступ к определённым моделям.
Финансовые компании, госструктуры, медицина — часть отраслей не может использовать внешние облачные сервисы. Данные должны оставаться в сертифицированном контуре.
Изолированный экземпляр Jetstream, развёрнутый в нашей инфраструктуре — только для вашей компании. Полная изоляция ресурсов, гарантированная полоса, SLA.
Jetstream разворачивается в вашем контуре — на серверах компании, в частном облаке или в сертифицированной инфраструктуре. Полный контроль над данными.
Полная изоляция от интернета. Шлюз маршрутизирует запросы только к локальным моделям — Ollama, vLLM, LM Studio, Triton. Ни один байт не покидает периметр. Режим для закрытых контуров и государственных систем.
Чувствительные запросы идут к локальным моделям, остальные — через зашифрованный канал к внешним API. Маршрутизация настраивается по правилам: наличие PII, тип задачи, команда, тег запроса.
Шлюз в вашем контуре, полный доступ к внешним моделям. Все запросы проходят через ваш инспектор трафика, логируются и фильтруются по корпоративным политикам перед отправкой.
Инструменты защиты встроены в маршрутизатор запросов. Правила применяются до того, как запрос покидает периметр — не после.
Шлюз анализирует каждый запрос на наличие PII-паттернов: ФИО, паспортные данные, СНИЛС, ИНН, КПП, номера телефонов, адреса электронной почты, реквизиты банковских карт, адреса. Поддержка регулярных выражений и ML-классификатора для нестандартных форматов.
Вместо блокировки запрос очищается: персональные данные заменяются на псевдонимы-placeholder'ы ([PERSON_1], [PHONE_1]) перед отправкой во внешний API. В ответе модели placeholder'ы автоматически восстанавливаются. Модель работает с обезличенным текстом — результат возвращается с реальными данными.
Запросы, соответствующие условиям политики, не отправляются вообще — клиент получает явную ошибку с кодом причины. Правила гибкие: можно блокировать по наличию PII, по ключевым словам, по типу контента, по комбинации условий. Политики настраиваются без перезапуска шлюза.
Фильтрация нежелательного контента на входе и выходе: запросы на генерацию вредоносного контента, промпт-инъекции, попытки обойти системный промпт. Настраиваемый уровень строгости, разные профили для разных команд и приложений.
100% логирование метаданных каждого запроса: время, модель, провайдер, API-ключ, команда, количество токенов, стоимость, статус, код блокировки. Содержимое запросов не сохраняется — только метаданные. Экспорт в SIEM-системы, интеграция с Elasticsearch, Grafana.
Инструменты деперсонализации и блокировки спроектированы для соответствия требованиям закона о персональных данных. On-premise режим полностью исключает трансграничную передачу данных. Договор с юрлицом, закрывающие документы, NDA по запросу.
| Jetstream Cloud | Dedicated Gateway | On-Premise | |
|---|---|---|---|
| Инфраструктура | |||
| Изоляция ресурсов | Shared | Dedicated | Full |
| Размещение | Облако Jetstream | Облако Jetstream | Ваш контур |
| Локальные модели (Ollama, vLLM) | — | — | ✓ |
| Air-gapped режим | — | — | ✓ |
| Управление | |||
| Иерархия API-ключей | ✓ | ✓ расширенная | ✓ расширенная |
| Квоты на команды / проекты | — | ✓ | ✓ |
| Ограничение по моделям | — | ✓ | ✓ |
| Безопасность | |||
| PII-детекция | — | ✓ | ✓ |
| Деперсонализация | — | ✓ | ✓ |
| Блокировка по правилам | — | ✓ | ✓ |
| Контентная модерация | — | ✓ | ✓ |
| Трансграничная передача данных | Есть | Есть | Нет (air-gapped) |
| Поддержка | |||
| SLA uptime | 99.5% | 99.9% | По договору |
| Выделенный менеджер | — | ✓ | ✓ |
| Договор и закрывающие документы | ✓ | ✓ | ✓ |
Бесплатная консультация, оценка архитектуры и пилот — без обязательств. Обычно от первого разговора до работающего прототипа 1–2 недели.