Все кейсыAI / E-commerce

AI Seller Bot

SaaS-платформа AI чат-бота для e-commerce с RAG-архитектурой, ReAct Agent, мультитенантностью и встраиваемым виджетом. 87 API-эндпоинтов, 6 LLM-провайдеров, 20 000+ embeddings, real-time WebSocket чат.

Клиент: Внутренний продукт
Год: 2025
Срок: 4 месяца
PythonFastAPIPreactpgvectorRedisCeleryNext.jsSQLAlchemyWebSocketDockerPostgreSQL
aisellerbot.ru
87
API-эндпоинтов
20 000+
embeddings в базе
6
LLM-провайдеров
< 5 мс
vector search
7 100+
товаров в каталоге
12 700+
KAG-правил

Задача клиента

1AI-бот, который понимает контекст товаров и отвечает как живой консультант
2RAG-архитектура с семантическим поиском по каталогу и базе знаний
3Мультитенантность — один бот обслуживает несколько магазинов с изоляцией данных
4Автоматический импорт товаров из YML, CSV, XML, JSON, CommerceML (1С)
5Real-time WebSocket чат со streaming-ответами посимвольно
6Встраиваемый виджет — одна строка JS на сайт клиента
Фича 1

ReAct Agent

Reasoning + Acting, 8 инструментов

Бот не просто ищет по ключевым словам — он рассуждает. ReAct Agent анализирует запрос, выбирает нужный инструмент (поиск товаров, проверка наличия, база знаний), получает результат и формулирует ответ. До 8 итераций на сложный запрос.

Поиск товаров (vector similarity)
Проверка наличия в реальном времени
Поиск по базе знаний (hybrid search)
Захват лидов и контактов
agent.py — ReAct Loop
ThinkПользователь ищет краску для кухни до 3000₽
Act→ search_products(query='краска кухня', max_price=3000)
Observe← Найдено 12 товаров, топ: Tikkurila Harmony
ThinkНужно проверить наличие лучшего варианта
Act→ check_availability(product_id=4521)
Observe← В наличии: 23 шт, 2.7л = 1 890₽
AnswerРекомендую Tikkurila Harmony 2.7л...
Фича 2

RAG + KAG

20 000+ embeddings, Qwen3-Embedding

Retrieval-Augmented Generation с self-hosted embedding моделью Qwen3 (1024d). Гибридный поиск: семантический (vector cosine) + полнотекстовый (русская морфология). Уникальная KAG-система: 12 700+ бизнес-правил, извлечённых AI из описаний товаров.

HNSW-индексы для <5ms поиска
Hybrid search (semantic + keyword)
12 700+ KAG-правил из товаров
Chunking ~500 tokens, 75 overlap
RAG Pipeline
Queryкраска для влажных помещений
EmbedQwen3 → vector[1024]
Searchpgvector cosine <5ms
Chunks4 релевантных фрагмента
LLMCerebras 120B → ответ
Фича 3

Data Ingestion

5 парсеров + Web Crawler

Автоматический импорт из любых источников: Yandex Market (YML), Google Merchant (XML), 1С (CommerceML), CSV, JSON. Web crawler парсит структуру сайта, находит страницы доставки/оплаты/FAQ и создаёт статьи базы знаний автоматически.

60+ алиасов полей RU/EN
LLM-assisted маппинг нестандартных полей
Hourly delta-sync (только изменения)
Auto-embed при обновлении товаров
Data Sources
📦
YML
Yandex Market
📊
CSV
Auto-detect
🏷️
XML
Google Merchant
🏢
CommerceML
📋
JSON
Custom feeds
🕷️
Web
Site crawler
60+ алиасов полей RU/EN · hourly delta-sync
Фича 4

Multi-LLM Fallback

6 провайдеров, автопереключение

Цепочка из 6 LLM-провайдеров с автоматическим переключением при rate limit или downtime. Cerebras (120B) → Groq (70B) → SambaNova (235B). Поддержка OpenAI, Anthropic для enterprise. SOCKS5-прокси для geo-blocked API.

Cerebras gpt-oss-120B — primary
Auto fallback при rate limit
Streaming responses (SSE)
Cost tracking по модели
LLM Fallback Chain
Cerebrasgpt-oss-120B
Primary
Groqllama-3.3-70B
Fallback 1
SambaNovaQwen3-235B
Fallback 2
OpenAIGPT-4o
Enterprise
AnthropicClaude Opus
Enterprise

Встраиваемый виджет

Одна строка JS для установки на любой сайт
Desktop: 380×550px, Mobile: fullscreen
WebSocket со streaming-ответами
Автореконнект + offline-очередь
Markdown в сообщениях
Quick reply кнопки
Light/Dark тема
152-ФЗ: cookie consent
AI
AI Консультант
Онлайн
AI
Здравствуйте! Я AI-консультант. Помогу подобрать товар, проверить наличие или ответить на вопросы.
Ищу краску для кухни до 3000₽
AI
Tikkurila Harmony 2.7л — 1 890 ₽. Идеальна для кухни: моющаяся, матовая, без запаха. В наличии 23 шт.
Напишите сообщение...

Настраиваемое поведение

Каждый аспект бота конфигурируется через admin-панель

Greeting Rules

Сценарии приветствия по типу визитора

Funnel Rules

Воронка: бюджет → категория → товар

Domain Hints

Контекст предметной области

Brand Priorities

Приоритеты брендов в рекомендациях

Escalation

Условия передачи оператору

Follow-Up

Автонапоминания через N минут

Архитектура

FastAPI Backend
87 API endpoints, async/await
PostgreSQL + pgvector
15 таблиц, HNSW-индексы
Redis + Celery
Очереди задач, scheduling
WebSocket Chat
Real-time streaming, heartbeat
Preact Widget
~3KB loader, iframe embed
Next.js Admin
15+ страниц, SWR, Recharts

Технический стек

FastAPI
Backend
Python 3.12, async
PostgreSQL
Database
16 + pgvector
Redis
Cache
Celery broker
Celery
Workers
Beat scheduler
Preact
Widget
3KB loader, iframe
Next.js 14
Admin
App Router, SWR
SQLAlchemy
ORM
2.0 async
Qwen3-Embed
Embedding
1024d, self-hosted
Docker
Deploy
Compose, 5 services
WebSocket
Real-time
Streaming chat

Результаты

95%
точность ответов (22/23 тест-кейсов)
< 5 мс
vector search по 20K+ embeddings
< 1.5 сек
среднее время ответа бота
87
API-эндпоинтов в production

"AI-консультант, который знает весь каталог из 7 000+ товаров, отвечает за 1.5 секунды и работает 24/7 без выходных — это не фантастика, а production-система с 20 000+ embeddings"

Нужен похожий проект?

Обсудим вашу задачу и предложим оптимальное решение.