AI-ассистент

RAG-ассистент по нормативной базе и документам

AI-ассистент, который отвечает на вопросы по вашей нормативной базе, регламентам и документам со ссылкой на источник и пункт. Работающее демо по охране труда и промбезопасности. Отечественная LLM в изолированном контуре под 152-ФЗ.

Клиент: Собственная разработка

Год: 2026

Срок: недели

FastAPIPython 3.12PostgreSQL 16 + pgvectorQwen3-EmbeddingBGE-rerankerGigaChat-2-MaxRedis

magmadev.ru/otipb/

96%

точность ответа (hit-rate@4) на 45 контрольных вопросах

[N]

ссылка на документ и пункт в каждом ответе

RAG

гибридный поиск: вектор, полнотекст и реранкер

152-ФЗ

отечественная LLM в изолированном контуре

self-hosted

свои эмбеддинги и реранкер, без внешних API

дни

срок сборки под новый домен документов

Задача клиента

1Сотрудники тратят время на ручной поиск по сотням страниц нормативки, регламентов и инструкций

2Обычный чат с нейросетью выдумывает: нужны ответы строго по вашим документам со ссылкой на источник и пункт

3Нормы и регламенты устаревают: ответ должен предупреждать об истекающих и утративших силу документах

4Данные чувствительные: обработка только в изолированном контуре под 152-ФЗ, без зарубежных облаков

5Решение должно собираться под любой домен (охрана труда, юридические документы, регламенты, база знаний) за дни

6Качество нужно измерять, а не верить на слово

Фича 1

Ответ строго по вашим документам, со ссылкой на пункт

Гибридный поиск (вектор + полнотекст + реранкер) и GigaChat

Пользователь задаёт вопрос обычным языком. Ассистент ищет ответ по загруженной базе: векторный и полнотекстовый поиск, объединение результатов и переранжирование, затем ответ строится только по найденным фрагментам со ссылкой на конкретный документ и пункт. Если в базе ответа нет, ассистент прямо говорит об этом и не фантазирует. Живое демо встроено ниже: задайте вопрос прямо сейчас.

Ответ берётся только из загруженных документов, а не из общих знаний модели

Ссылка на документ и пункт в каждом ответе

Честное «в базе нет» при отсутствии ответа

Текст печатается потоком, без зависания на ожидании модели

Демо интерфейса

Живое демо: задайте вопрос прямо здесь

Это рабочий RAG-ассистент по охране труда и промышленной безопасности. Тот же движок собирается под любую нормативную базу и документы клиента: внутренние регламенты, ГОСТы, приказы, политики.

magmadev.ru/otipb/

live

Реальный ассистент с ответами из нормативной базы, ссылками на пункт и контролем актуальности норм. Спросите своё или нажмите на пример в окне выше.

Фича 2

Цитаты, первоисточник и контроль актуальности

У каждого документа статус и срок действия

Каждое утверждение подкреплено карточкой источника: документ, пункт и переход к первоисточнику. У каждого документа в базе есть статус и срок, поэтому ассистент предупреждает об истекающих и утративших силу нормах прямо в ответе. Это снимает риск опереться на устаревший документ.

Карточки источников: документ, пункт, переход к первоисточнику

Предупреждение об истекающих и утративших силу нормах

Группировка ответа по документам, ссылка строго соответствует источнику

Подходит для аудита: видно, на чём основан ответ

Демо интерфейса

Каждое утверждение со ссылкой на пункт

Ответ строится только из загруженных документов. После каждого тезиса стоит ссылка на источник, а у источника виден документ, пункт, статус актуальности и ссылка на первоисточник.

RAG-ассистент по нормативной базе

ответ со ссылкой на документ и пункт

источников: 3

Какие требования к наряду-допуску при работе на высоте?

Работы на высоте от 1,8 м выполняются по наряду-допуску, который оформляется до начала работ и определяет место, содержание, условия и время их проведения^[1]. Наряд-допуск выдаёт уполномоченное должностное лицо, а ответственный руководитель работ назначается приказом^[2]. Срок действия наряда-допуска не более 15 календарных дней со дня начала работ, с возможностью продления один раз на тот же срок^[1]. Работники, выполняющие работы на высоте, проходят обучение и проверку знаний с присвоением группы безопасности^[3].

Актуальность: источник [2] действует до 01.09.2031, проверьте при ссылке на него после этой даты.

Источники

[1]Правила по охране труда при работе на высотедействуетпервоисточник ↗

Приказ Минтруда России, утверждены приказом ведомства

п. 17, п. 31, п. 34

[2]Положение о системе управления охраной труда организацииистекает 01.09.2031первоисточник ↗

Внутренний регламент, раздел «Организация работ повышенной опасности»

п. 5.2, п. 5.4

[3]Порядок обучения по охране труда и проверки знанийдействуетпервоисточник ↗

Постановление Правительства, требования к обучению

п. 46, приложение 2

Иллюстрация интерфейса. Числа условные.

Фича 3

Скорость, навигация и измеримость

Фильтры по разделам, подсказки, кэш и страница метрик

Поиск можно сузить до нужного раздела базы. Под ответом подсказываются смежные вопросы, частые запросы отдаются мгновенно из кэша. Есть страница метрик использования. Главное: точность измеряется, а не декларируется. На контрольном наборе из 45 вопросов hit-rate@4 равен 96 процентам, и этот замер повторяем при изменении базы.

Фильтр поиска по разделам базы

Подсказки «спросите также» под ответом

Мгновенные ответы на частые вопросы из кэша

Замеряемая точность и страница метрик использования

Демо интерфейса

Измеримое качество и удобная навигация

Качество поиска проверяется на наборе контрольных вопросов, поиск сужается по разделам базы, а ассистент сам подсказывает смежные вопросы.

Точность извлечения

96%hit-rate@4

на 45 контрольных вопросах нужный документ попадает в топ-4 источника

Искать в разделе

по умолчанию ищем по всей базе, поиск можно сузить до раздела

вся базараздел Aраздел B

Ответы по примерам

мгновенно из кэша, без ожидания модели

Спросите также

после ответа ассистент предлагает смежные вопросы, чтобы вести пользователя по теме

Как оформить наряд-допуск на работы повышенной опасности?Какова периодичность обучения по охране труда?Что входит в план ликвидации аварий?

Иллюстрация интерфейса. Числа условные.

Фича 4

Под ваш контур: 152-ФЗ и self-hosted

Отечественная LLM, свои эмбеддинги, guardrails

Языковая модель работает через GigaChat в изолированном контуре под требования 152-ФЗ и КИИ, данные не уходят в зарубежные облака. Эмбеддинги и реранкер развёрнуты на собственном оборудовании, без внешних API. Защита включает порог релевантности, фильтрацию посторонних инструкций и контроль утечек. Тот же движок собирается под любой набор документов клиента за дни.

GigaChat в изолированном контуре под 152-ФЗ и КИИ

Self-hosted эмбеддинги и реранкер, без внешних API

Guardrails: порог релевантности и защита от посторонних инструкций

Сборка под ваш домен и документы за дни

Подо что подходит

Тот же движок собирается под любой набор документов и нормативки

Охрана труда и промбезопасность

нормативка, инструкции, наряды-допуски, планы (живое демо)

Юридические документы

договоры, регламенты, нормативная база

Внутренние регламенты

процедуры, инструкции, стандарты компании

Нормативная база отрасли

ГОСТ, СП, приказы, законы

База знаний поддержки

ответы операторам и клиентам по документации

Закупки и тендеры

тендерная и закупочная документация

HR и кадры

кадровые политики и внутренние положения

Техническая документация

руководства, спецификации, мануалы

Архитектура

Бэкенд: FastAPI

Python, потоковые ответы, кэш и метрики

PostgreSQL + pgvector

документы и фрагменты с векторным и полнотекстовым поиском

Qwen3-Embedding (self-hosted)

эмбеддинги 1024 измерения на своём оборудовании

BGE-reranker (self-hosted)

переранжирование результатов поиска

GigaChat-2-Max

генерация ответа в изолированном контуре под 152-ФЗ

Redis

кэш и прогрев частых вопросов для мгновенных ответов

Технический стек

Бэкенд

FastAPI

Python, стриминг ответа

База данных

PostgreSQL

pgvector, полнотекст по русскому языку

Эмбеддинги

Qwen3-Embedding

self-hosted, 1024 измерения

Реранкер

BGE-reranker

self-hosted, уточнение релевантности

Поиск

RRF

объединение векторного и полнотекстового поиска

LLM

GigaChat-2-Max

изолированный контур, 152-ФЗ

Кэш

Redis

кэш ответов и прогрев примеров

Защита

Guardrails

порог релевантности, анти-инъекции

Результаты

96%

hit-rate@4 на контрольном наборе из 45 вопросов

[N]

ссылка на документ и пункт в каждом ответе

152-ФЗ

отечественная LLM в изолированном контуре

дни

на сборку под новый набор документов

Нужен похожий проект?

Обсудим вашу задачу и предложим оптимальное решение.

Обсудить проект

RAG-ассистент по нормативной базе и документам

Клиент: Собственная разработка

Год: 2026

Срок: недели

FastAPIPython 3.12PostgreSQL 16 + pgvectorQwen3-EmbeddingBGE-rerankerGigaChat-2-MaxRedis

magmadev.ru/otipb/

Задача клиента

1Сотрудники тратят время на ручной поиск по сотням страниц нормативки, регламентов и инструкций

2Обычный чат с нейросетью выдумывает: нужны ответы строго по вашим документам со ссылкой на источник и пункт

3Нормы и регламенты устаревают: ответ должен предупреждать об истекающих и утративших силу документах

4Данные чувствительные: обработка только в изолированном контуре под 152-ФЗ, без зарубежных облаков

6Качество нужно измерять, а не верить на слово