[drive-download] О чат-боте Constitution RAG 190326.docx
Сущности
О чат-боте Constitution RAG<br>
Чат‑бот создан как прикладной инструмент для ответов на вопросы граждан о новой Конституции и связанных с ней изменениях в законодательстве. Он дополняет сайт constitution.my, переводя его материалы в формат диалога «вопрос–ответ» на понятном, человекоцентричном языке. Основные задачи:<br>
доинформирование граждан по вопросам Конституции, переходных положений и новых институтов;<br>
снижение нагрузки на колл‑центры и приёмные за счёт автоматизации типовых ответов;<br>
оперативное сопровождение изменений законов, связанных с вступлением Конституции в силу.<br>
Бот создавался под конец референдумной кампании как инструмент разъяснения. В текущей конфигурации он может использоваться как точка входа для граждан по вопросам реформ до конца 2026 года и далее.<br>
Система ориентирована на те же группы, что и сайт: граждане «что будет лично для меня», сомневающиеся и скептически настроенные, жители регионов, молодёжь и активные интернет‑пользователи. Типовые запросы:<br>
простые объяснения конституционных норм без юридического языка;<br>
вопросы о Курултае, вице‑президенте, Народном совете и новых органах;<br>
вопросы о правах граждан, цифровые права и процессуальные гарантии;<br>
вопросы о сроках вступления изменений в силу и переходном периоде;<br>
вопросы о том, как гражданин может участвовать (петиции, общественный контроль, обращения в Конституционный суд).<br>
Ответы формируются в формате коротких, нейтральных и максимально простых объяснений, без политических оценок и агитации.<br>
Бот построен как трёхслойная система:<br>
1. Дата‑слой: механическая загрузка, нормализация и импорт документов в PostgreSQL (текст Конституции 2026 года на двух языках, комментарии, FAQ, историческая редакция 1995 года как помеченный «deprecated» слой).<br>
2. Слой поиска: классификация, выбор нужного слоя (норма, комментарий, FAQ, исторический контекст), гибридный поиск по тексту и метаданным, жёсткий приоритет норм 2026 года над редакцией 1995 года.<br>
3. Ответный слой: языковая модель, которая только переписывает найденные фрагменты «по‑человечески», без добавления новой фактической информации и без опоры на внешние знания.<br>
Ключевые принципы:<br>
«grounded» ответы – каждый ответ опирается на конкретные фрагменты из базы данных, а не на общее «знание» модели;<br>
приоритет источников: сначала норма 2026 года, затем комментарии и FAQ, историческая редакция 1995 года используется только в режиме сравнения и всегда помечается как устаревшая;<br>
защита от галлюцинаций – при слабом поиске бот отдаёт безопасный ответ «не знаю / нет данных» с указанием на ограничения;<br>
запрет на подмену нормы комментариями – комментарии и FAQ используются как вспомогательные, но не как источник правового содержания для статей Конституции.<br>
Для бота заданы явные правила обработки рискованных сценариев (широкие вопросы, политически окрашенные формулировки, запросы о 1995 году и т.п.). Отдельно контролируются:<br>
отсутствие эффекта «полного перечня» при ответах на широкие вопросы (бот явно помечает ответ как неполный перечень, если это так);<br>
отсутствие утечек устаревшей редакции 1995 в обычном режиме ответов;<br>
нейтральность формулировок при политически чувствительных запросах;<br>
отказ от ответов при недостаточной опоре на корпус (safe‑failure вместо выдуманных фактов).<br>
Функционирование проходит через формализованный QA‑контур (smoke‑ тесты, топ‑10 критических кейсов, red‑team сценарии, фикс‑планы и ретесты).<br>
Потенциал повторного использования<br>
Архитектура бота не привязана к Конституции как таковой. Любой корпус документов может быть подключён при условии:<br>
наличия структурированных исходников (законы, подзаконные акты, FAQ, методички и т.д.);<br>
прохождения стандартного конвейера: инвентаризация, нормализация, импорт в PostgreSQL, настройка политики поиска и приоритета источников;<br>
определения правил, где ИИ может только переформулировать текст, а где должен отвечать отказом.<br>
Так, бот может быть развёрнут для других тематик без изменения общей архитектуры. Основное преимущество – механическое, воспроизводимое управление источниками и логикой поиска, а не «чёрный ящик» ИИ.