RAG-ассистент по нормативной базе и документам
AI-ассистент, который отвечает на вопросы по вашей нормативной базе, регламентам и документам со ссылкой на источник и пункт. Работающее демо по охране труда и промбезопасности. Отечественная LLM в изолированном контуре под 152-ФЗ.
Задача клиента
Ответ строго по вашим документам, со ссылкой на пункт
Гибридный поиск (вектор + полнотекст + реранкер) и GigaChat
Пользователь задаёт вопрос обычным языком. Ассистент ищет ответ по загруженной базе: векторный и полнотекстовый поиск, объединение результатов и переранжирование, затем ответ строится только по найденным фрагментам со ссылкой на конкретный документ и пункт. Если в базе ответа нет, ассистент прямо говорит об этом и не фантазирует. Живое демо встроено ниже: задайте вопрос прямо сейчас.
Живое демо: задайте вопрос прямо здесь
Это рабочий RAG-ассистент по охране труда и промышленной безопасности. Тот же движок собирается под любую нормативную базу и документы клиента: внутренние регламенты, ГОСТы, приказы, политики.
Реальный ассистент с ответами из нормативной базы, ссылками на пункт и контролем актуальности норм. Спросите своё или нажмите на пример в окне выше.
Цитаты, первоисточник и контроль актуальности
У каждого документа статус и срок действия
Каждое утверждение подкреплено карточкой источника: документ, пункт и переход к первоисточнику. У каждого документа в базе есть статус и срок, поэтому ассистент предупреждает об истекающих и утративших силу нормах прямо в ответе. Это снимает риск опереться на устаревший документ.
Каждое утверждение со ссылкой на пункт
Ответ строится только из загруженных документов. После каждого тезиса стоит ссылка на источник, а у источника виден документ, пункт, статус актуальности и ссылка на первоисточник.
Скорость, навигация и измеримость
Фильтры по разделам, подсказки, кэш и страница метрик
Поиск можно сузить до нужного раздела базы. Под ответом подсказываются смежные вопросы, частые запросы отдаются мгновенно из кэша. Есть страница метрик использования. Главное: точность измеряется, а не декларируется. На контрольном наборе из 45 вопросов hit-rate@4 равен 96 процентам, и этот замер повторяем при изменении базы.
Измеримое качество и удобная навигация
Качество поиска проверяется на наборе контрольных вопросов, поиск сужается по разделам базы, а ассистент сам подсказывает смежные вопросы.
по умолчанию ищем по всей базе, поиск можно сузить до раздела
после ответа ассистент предлагает смежные вопросы, чтобы вести пользователя по теме
Под ваш контур: 152-ФЗ и self-hosted
Отечественная LLM, свои эмбеддинги, guardrails
Языковая модель работает через GigaChat в изолированном контуре под требования 152-ФЗ и КИИ, данные не уходят в зарубежные облака. Эмбеддинги и реранкер развёрнуты на собственном оборудовании, без внешних API. Защита включает порог релевантности, фильтрацию посторонних инструкций и контроль утечек. Тот же движок собирается под любой набор документов клиента за дни.
Подо что подходит
Тот же движок собирается под любой набор документов и нормативки
Архитектура
Бэкенд: FastAPI
Python, потоковые ответы, кэш и метрики
PostgreSQL + pgvector
документы и фрагменты с векторным и полнотекстовым поиском
Qwen3-Embedding (self-hosted)
эмбеддинги 1024 измерения на своём оборудовании
BGE-reranker (self-hosted)
переранжирование результатов поиска
GigaChat-2-Max
генерация ответа в изолированном контуре под 152-ФЗ
Redis
кэш и прогрев частых вопросов для мгновенных ответов