Как с нуля запустить собственного ИИ-агента: архитектура, ПО, инфраструктура и мощности

Автор: Инженер ИИ

ИИ-агент — это не чат-бот и не «подключили API и поехали».
Это программная система, которая:

  • понимает контекст,
  • принимает решения,
  • взаимодействует с системами,
  • выполняет действия без постоянного участия человека.

Разберёмся, что реально нужно, если вы начинаете с нуля.


1. Что такое ИИ-агент на практике

В инженерном смысле ИИ-агент — это связка из:

  1. Модели (LLM или ML-модель)
  2. Логики (agent framework)
  3. Инструментов (tools, actions)
  4. Данных (knowledge, memory)
  5. Инфраструктуры (серверы, сети, СХД)

Если убрать любой слой — агент перестаёт быть агентом.


2. Базовые термины — без маркетинга

API (Application Programming Interface)

API — это контракт взаимодействия между программами.

Пример:

  • ИИ-агент → API CRM → создать задачу
  • ИИ-агент → API 1С → получить остатки
  • ИИ-агент → API почты → отправить письмо

👉 Без API агент ничего не может делать, он может только «разговаривать».


Open Source

Open Source — это программное обеспечение:

  • с открытым кодом,
  • без лицензионных ограничений на использование,
  • которое можно развернуть у себя.

Ключевой плюс: контроль, безопасность, независимость.
Ключевой минус: нужна экспертиза и инфраструктура.


Proprietary / Cloud AI (закрытые модели)

Это:

  • OpenAI, Anthropic, Google, Azure AI и т.д.

Плюсы:

  • быстро,
  • мощно,
  • минимум инфраструктуры.

Минусы:

  • зависимость от вендора,
  • вопросы ИБ и комплаенса,
  • стоимость при масштабировании.

3. Какой подход выбрать: open source или API

Если коротко:

ЗадачаЧто выбирать
Быстрый MVPAPI (облачные модели)
Работа с чувствительными даннымиOpen Source
Интеграция с внутренними системамиOpen Source / Hybrid
Контроль затратOpen Source
ЭкспериментыAPI

👉 В реальных проектах почти всегда используется гибрид.


4. Архитектура ИИ-агента (упрощённо)

Пользователь / Система
        ↓
Agent Logic (оркестрация)
        ↓
LLM / ML модель
        ↓
Инструменты (API, БД, 1С, CRM)
        ↓
Инфраструктура (серверы, СХД, сеть)

5. Программное обеспечение: что реально понадобится

5.1. Ядро агента

  • LangChain / LangGraph
  • LlamaIndex
  • AutoGen
  • CrewAI

Задача:
управлять логикой, памятью, цепочками действий.


5.2. Модели (LLM)

Open Source:

  • LLaMA
  • Mistral
  • Mixtral
  • Qwen
  • Phi

Закрытые (через API):

  • GPT
  • Claude
  • Gemini

👉 Выбор зависит от:

  • языка,
  • объёма контекста,
  • требований к скорости,
  • бюджета.

5.3. Векторные базы данных (память агента)

Без них агент «глупеет».

Используются для:

  • поиска по документам,
  • RAG (Retrieval Augmented Generation),
  • корпоративных знаний.

Популярные:

  • FAISS
  • Milvus
  • Weaviate
  • Qdrant

5.4. Базы данных и хранилища

  • PostgreSQL / MySQL — метаданные
  • Object Storage — документы, файлы
  • Redis — быстрый контекст и сессии

5.5. Интеграции и инструменты

  • API CRM / ERP / 1С
  • Почта, календари
  • BI-системы
  • Документооборот
  • Service Desk

ИИ-агент ценен не интеллектом, а действиями.


6. Инфраструктура: какие мощности нужны

6.1. Серверы

Минимальный старт (PoC)

  • 1 сервер
  • CPU: 2× Xeon / EPYC
  • RAM: 128–256 ГБ
  • GPU: 1× NVIDIA A10 / L40 / RTX 6000
  • NVMe: от 3–6 ТБ

Корпоративный уровень

  • Кластер из 2–4 серверов
  • GPU: A100 / H100 / L40S
  • RAM: 512 ГБ+
  • Резервирование питания и сети

6.2. GPU — ключевой элемент

GPU определяет:

  • скорость отклика,
  • размер модели,
  • количество одновременных агентов.

Без GPU:

  • inference медленный,
  • обучение практически невозможно.

6.3. Системы хранения данных (СХД)

Для ИИ важны:

  • высокая скорость IOPS,
  • NVMe,
  • масштабируемость.

Используются:

  • All-Flash СХД
  • NVMe over Fabrics
  • Object Storage

6.4. Сеть и коммутация

Минимум:

  • 10/25 GbE между серверами
  • низкие задержки
  • резервирование

Для кластеров:

  • 25/40/100 GbE
  • RDMA (опционально)

7. Безопасность и контроль

ИИ-агент — это новая точка риска.

Нужно учитывать:

  • разграничение прав,
  • контроль API-ключей,
  • логирование действий агента,
  • аудит запросов,
  • изоляцию моделей.

Без этого ИИ становится неконтролируемым исполнителем.


8. Эксплуатация и сопровождение

Нужно заранее заложить:

  • мониторинг (Prometheus, Grafana),
  • алерты,
  • контроль затрат GPU,
  • обновление моделей,
  • управление версиями.

ИИ без эксплуатации — это демо, а не система.


9. Типовые ошибки при запуске

❌ Начинают с модели, а не с задачи
❌ Не закладывают инфраструктуру
❌ Нет API у внутренних систем
❌ Игнорируют безопасность
❌ Думают, что ИИ «сам всё сделает»


10. С чего начать правильно

Шаг 1 — описать бизнес-задачу
Шаг 2 — определить, какие действия должен выполнять агент
Шаг 3 — выбрать архитектуру (cloud / on-prem / hybrid)
Шаг 4 — подготовить данные
Шаг 5 — подобрать инфраструктуру
Шаг 6 — только потом выбирать модель


Подход Primum movens

Primum movens рассматривает ИИ-агента как:

  • часть ИТ-ландшафта,
  • элемент автоматизации,
  • вычислительную нагрузку,
  • объект ИБ.

Мы начинаем не с «какую модель взять», а с:

  • архитектуры,
  • инфраструктуры,
  • масштабирования,
  • стоимости владения.

Итог

Запуск собственного ИИ-агента — это:

  • ИТ-проект,
  • инженерная задача,
  • инфраструктурное решение,
    а не покупка подписки.

Сделанный правильно, агент:

  • снижает нагрузку на людей,
  • ускоряет процессы,
  • становится цифровым сотрудником,
  • масштабируется вместе с бизнесом.