[drive-download] SG-Index-Technical draft.docx

Google Docs neutral 21 чанков ~32 мин чтения
S-G Index v2.1c<br> ПОЛНАЯ ТЕХНИЧЕСКАЯ СПЕЦИФИКАЦИЯ<br> ОГЛАВЛЕНИЕ<br> Архитектурный обзор<br> Определение и нормирование входов (C, T, V, P, D, R)<br> Математическое ядро (2 уровня: физический и управленческий)<br> Модули неопределённости (UQ) и Monte Carlo<br> Процедуры калибровки параметров<br> Стресс-тесты и валидация<br> Регламент версионирования и anti-manipulation gates<br> Шаблон управленческого отчёта<br> Приложения (таблицы, псевдокод)<br> 1. АРХИТЕКТУРНЫЙ ОБЗОР<br> 1.1 Назначение модели<br> S-G Index (Sovereignty-Guard Index) — композитная модель для оценки способности государственной системы удерживать информационное пространство при наличии:<br> Внешних информационных атак (дезинформационные кампании)<br> Давления иностранного контента<br> Внутренних ограничений (ресурсы, доверие)<br> Динамических вызовов (новые платформы, методики)<br> Целевая аудитория:<br> Лица, принимающие управленческие решения (ЛПР)<br> Стратегические аналитики и медиа-политологи<br> Независимые аудиторы и исследователи<br> Область применения:<br> Ежемесячный мониторинг информационного суверенитета РК<br> Обоснование приоритизации инвестиций в контент и инфраструктуру<br> Оценка эффективности контрмер против дезинформации<br> Долгосрочное стратегическое планирование<br> Границы применимости:<br> ❌ НЕ предназначена для анализа отдельных тем (климат, политика, экономика)<br> ❌ НЕ показывает региональные или демографические различия<br> ❌ НЕ является заменой экспертным оценкам по специальным вопросам<br> ⚠️ Требует надлежащего качества данных входов (при Low confidence выводы ограничены)<br> 1.2 Структура: два уровня<br> Уровень 1: Физический (техническое ядро)<br> $$S_{\text{raw}} = S_{\text{pot}} \times F_{\text{lin}} \times F_{\text{soft}}$$<br> Где:<br> S_pot — потенциал системы (внутренняя способность: производство контента, доверие, видимость)<br> F_lin — демпфер угроз (как нагрузка иностранного давления и атаки снижают потенциал)<br> F_soft — режим мягкого порога (плавный переход в перегрузку вместо резкого "щелчка")<br> Результат: число S_raw ∈ [0, 1.5], где 1.0 = базовый уровень.<br> Уровень 2: Управленческий (KPI)<br> $$S_{\text{KPI}} = 100 \times \text{clip}{[0,1.5]}\left(\frac{\log{10}(S_{\text{raw}} + \delta_{\text{ad}}) - \log_{10}(S_{\text{min}})}{\log_{10}(S_{\text{max}}) - \log_{10}(S_{\text{min}})}\right)$$<br> Результат: число S_KPI ∈ [0, 150], где:<br> 🔴 [0, 25] — Критический режим<br> 🟡 [25, 40] — Уязвимость<br> 🟢 [40, 60] — Управляемая устойчивость (норма)<br> 🔵 [60, 100] — Высокая устойчивость<br> 🟣 [100, 150] — Отличная устойчивость<br> 1.3 Преимущества двухуровневой архитектуры<br> 2. ОПРЕДЕЛЕНИЕ И НОРМИРОВАНИЕ ВХОДОВ<br> 2.1 Шесть входных переменных (C, T, V, P, D, R)<br> C — Capacity (Мощность производства контента)<br> Определение: Способность национальной системы производить, поддерживать и распространять информационный контент достаточного объёма и качества.<br> Измерение:<br> C = 0.6 × norm(Supply) + 0.4 × norm(Quality)<br> Где:<br> Supply = объём производства (единиц контента/месяц)<br> Источник: статистика<br> Нормирование: по историческому диапазону (10 лет) или плану на 2030 год<br> Пример: если историческая норма = 500 ед/мес, текущее = 400 ед → norm(Supply) = 0.80<br> Quality = факт-корректность и соответствие стандартам<br> Источник: Платформа фактчека РК или независимый аудит<br> Измерение: доля материалов без опровержений / критических замечаний<br> Пример: если 95% контента прошли проверку → Quality = 0.95<br> Валидационные границы:<br> Min (критическая низость): C = 0.15 (система парализована)<br> Max (плато насыщения): C = 0.95 (невозможно превысить)<br> Защита от хрупкости: применяется clamping к ε = 0.01 перед логарифмированием.<br> T — Trust (Доверие аудитории)<br> Определение: Доля респондентов (возрастная группа 14–65 лет), которые "в основном или полностью доверяют" национальным новостным источникам.<br> Измерение:<br> T = (численность доверяющих) / (панель опроса, исключая "не знаю")<br> Источник данных:<br> Регулярные опросы общественного мнения (ежемесячно или ежеквартально)<br> Поставщик: МКИ, аккредитованный социологический центр<br> Объём выборки: ≥ 1000 респондентов (минимум 500)<br> Доверительный интервал (МОЕ): ± 3–4%<br> Нормирование: уже в [0, 1], если опрос проводится как доля.<br> Пример расчёта:<br> Опрос N = 1200 респондентов<br> Ответивших: 1150 (50 = "не знаю")<br> Доверяющих: 782<br> T = 782 / 1150 ≈ 0.68<br> Валидационные границы:<br> Min: T = 0.10 (практически никто не верит)<br> Max: T = 0.95 (почти все доверяют, реалистичный потолок для любого источника)<br> Флаги качества:<br> ⚠️ Если МОЕ > 5%, доверие к T снижается (Medium confidence)<br> ⚠️ Если выборка < 500, переход на Low confidence<br> ⚠️ Если формулировка вопроса менялась, отметить как новая мета-версия<br> V — Visibility (Видимость национального контента)<br> Определение: Доля национальных источников в потребляемом контенте (взвешенная по платформам).<br> Измерение (3-компонентная модель):<br> V = V_soc^0.5 × V_gen^0.3 × V_search^0.2<br> Где каждая компонента нормирована в [0, 1]:<br> V_soc — Видимость в соцсетях (вес 50%)<br> Источник: анализ TikTok, Instagram, Facebook, ВКонтакте, Telegram, WhatsApp<br> Метрика: (просмотры национального контента) / (всего просмотров в категории "новости")<br> Объём: выборка 10,000+ видео/постов в день<br> Пример: если из 100K просмотров в категории "политика", 40K от национальных источников → V_soc = 0.40<br> V_gen — Видимость в генеративном поиске (вес 30%)<br> Источник: тестирование LLM (ChatGPT, Claude, Yandex.GPT, локальные модели)<br> Метрика: Доля ссылок на национальные источники в ответах на стандартные вопросы о РК<br> Методология:<br> Выбираются 100 репрезентативных вопросов о РК (история, политика, экономика, культура)<br> Для каждого LLM проводится по 100 тестов<br> Подсчитывается доля национальных ссылок в ответах<br> Результаты усредняются по всем LLM<br> Пример: V_gen = 0.62 означает, что 62% цитируемых источников — национальные<br> V_search — Видимость в поисковых системах (вес 20%)<br> Источник: анализ Google, Yandex, Bing по стандартным поисковым запросам о РК<br> Метрика: (национальные домены в топ-10) / 10<br> Запросы: выборка из 50 популярных запросов типа "Казахстан экономика", "политика РК", "история"<br> Пример: если в топ-10 результатов по "Казахстан 2026" 7 национальных источников → V_search = 0.70<br> Агрегация V:<br> V = 0.40^0.5 × 0.62^0.3 × 0.70^0.2<br> ≈ 0.632 × 0.852 × 0.927<br> ≈ 0.50 (средняя видимость)<br> Защита от методических дрейфов:<br> Если добавляется новая платформа (TikTok раньше было 5%, теперь 30%), это = новая мета-версия V<br> Если LLM существенно обновляет индексацию (например, ChatGPT добавляет новые источники), это = новая мета-версия V_gen<br> Все переходы документируются с "bridge formula" для исторической сопоставимости<br> P — Pressure (Нагрузка иностранного потребления)<br> Определение: Доля иностранного контента в структуре потребления аудитории (взвешенная по времени просмотра).<br> Измерение:<br> P = (время просмотра иностранного контента) / (общее время потребления контента)<br> Источники данных:<br> Панель просмотра (Media panelists) или агрегированные логи платформ<br> Платформы: YouTube (глобальный трафик), TikTok, Instagram, Facebook, ВКонтакте, Telegram<br> Выборка: 5,000+ активных пользователей, ежедневный мониторинг<br> Категоризация контента:<br> Национальный: создатель/издатель физически зарегистрирован в РК<br> Иностранный: создатель/издатель в других странах (включая русскоязычный контент из РУ, США и т.п.)<br> Пример расчёта:<br> Отслеживается 5000 пользователей в течение месяца<br> Общее время просмотра (видео, новости, тексты): 500,000 часов<br> Время просмотра иностранного контента: 210,000 часов<br> P = 210,000 / 500,000 = 0.42<br> Уточнения:<br> Включаются только "информационные" категории (новости, аналитика, социальные комментарии)<br> Развлечение (фильмы, музыка) исключаются, т.к. это не "информационное давление"<br> Учитывается время просмотра, а не количество просмотров (1 часовое видео = 60 минут, 100 коротких роликов = может быть 5–10 минут)<br> Валидационные границы:<br> Min: P = 0.10 (очень высокая "информационная изоляция" — нереалистична)<br> Max: P = 0.90 (население почти полностью потребляет иностранное)<br> D — Disinformation (Интенсивность дезинформационных атак)<br> Определение: Интегральная метрика мощности дезинформационных кампаний, учитывающая объём, координацию, сложность и воздействие.<br> Измерение (4-компонентная модель):<br> D = 0.3 × Volume + 0.25 × Sophistication + 0.25 × Coordination + 0.2 × Impact<br> Где каждая компонента нормирована в [0, 1]:<br> Volume (Объём) — вес 30%<br> Метрика: количество обнаруженных ложных утверждений в день / базовый уровень<br> Источник: детекторы дезинформации, платформы (YouTube, Facebook, TikTok), Платформа фактчека РК<br> Пример: если обычно 50 фейков/день, а в день кампании 500 → Volume = min(500/500, 1.0) = 1.0<br> Sophistication (Сложность) — вес 25%<br> Метрика: оценка технической и нарративной сложности атак<br> 0.1 = примитивные фейки ("глупый фейк", явная ложь)<br> 0.5 = средние фейки (деконтекстуализация, selective omission)<br> 1.0 = высокие фейки (синтетика, deepfake, сложный нарратив)<br> Источник: экспертная оценка (группа из 3–5 специалистов по дезинформации)<br> Процедура: еженедельно эксперты оценивают 50–100 примеров, выводят среднюю оценку<br> Coordination (Координация) — вес 25%<br> Метрика: измеряет, насколько атаки организованы<br> 0.1 = случайные, разрозненные фейки<br> 0.5 = заметная синхронизация (одновременные посты в разных платформах)<br> 1.0 = полная координация (centralized command, бот-сеть, инструктажи)<br> Источник: анализ временных меток, ip-адресов, поведения аккаунтов (pattern matching)<br> Инструмент: НЛП (Natural Language Processing) на предмет одинаковых фрагментов текста, одинаковых хэштегов, одинаковых временных окон публикации<br> Impact (Воздействие) — вес 20%<br> Метрика: как фейки распространяются и влияют на аудиторию<br> 0.1 = низкое (посты получают 100–500 просмотров)<br> 0.5 = среднее (10K–100K просмотров, заметное участие в комментариях)<br> 1.0 = высокое (>500K просмотров, тренды в соцсетях, упоминания в ТВ)<br> Источник: анализ engagement (лайки, репосты, комментарии)<br> Агрегация D:<br> Пример: D = 0.3 × 0.90 + 0.25 × 0.70 + 0.25 × 0.80 + 0.2 × 0.60<br> = 0.27 + 0.175 + 0.20 + 0.12<br> = 0.755 (мощная скоординированная кампания)<br> Защита от методических ошибок:<br> ⚠️ Если детектор дезинформации меняет версию (новый алгоритм), это = новая мета-версия D<br> ✅ Обязательна ежемесячная верификация (50 случайных примеров проверяются человеком)<br> R — Resilience (Устойчивость системы)<br> Определение: Способность системы быстро реагировать на атаки, охватывать контрмерами и подготавливать аудиторию к дезинформации.<br> Структура (3 субиндекса):<br> R = R_response^0.40 × R_coverage^0.35 × R_capability^0.25<br> R_response — Скорость реакции (вес 40%, наиболее важен)<br> $$R_{\text{response}} = \frac{1}{1 + \left(\frac{\tau}{\tau_0}\right)^2}$$<br> Где:<br> τ = среднее время реагирования на дезинформацию (дни)<br> Определение: от момента выявления фейка до публикации официального опровержения/контр-контента<br> Источник: логи МКИ, официальные заявления, медиа-мониторинг<br> Пример: если обнаружили фейк в среду 12:00, опровергли в четверг 10:00 → τ = 0.92 дня<br> τ₀ = целевой уровень скорости (фиксируется = 1 день)<br> τ₀ = 1.0 означает, что идеальная реакция — в течение суток<br> Примеры:<br> τ = 0.5 дня (реагируем в течение 12 часов) → R_response = 1/(1+(0.5/1)^2) ≈ 0.80<br> τ = 1.0 день (реагируем в течение 24 часов) → R_response = 1/(1+1^2) = 0.50<br> τ = 2.0 дня (реагируем в течение 48 часов) → R_response = 1/(1+4) = 0.20<br> τ = 5.0 дней (реагируем через 5 дней) → R_response = 1/(1+25) ≈ 0.04<br> R_coverage — Охват контрмер (вес 35%)<br> $$R_{\text{coverage}} = \text{clip}_{[0,1]}\left(\frac{CR}{AR + \epsilon}\right)$$<br> Где:<br> CR = количество человек, охватываемых опровержением (reach)<br> Источник: статистика просмотров официальных постов, упоминания в медиа<br> Пример: если опровержение МКИ получило 500K просмотров на TikTok, YouTube, Facebook<br> CR = 500K<br> AR = количество человек, охватываемых оригинальным фейком (attacked reach)<br> Источник: анализ фейк-постов в социальных сетях<br> Пример: если фейк распространялся и собрал 2М просмотров, комментариев, репостов<br> AR = 2M<br> Пример расчёта:<br> R_coverage = min(1, 500K / (2M + 0.01)) = min(1, 0.25) = 0.25<br> (Означает, что охватываем только 25% от числа людей, видевших фейк)<br> R_capability — Способность аудитории/системы (вес 25%)<br> $$R_{\text{capability}} = \sqrt{ML}$$<br> Где:<br> ML = Media Literacy (доля населения с хорошей медиаграмотностью)<br> Определение: люди, которые могут критически анализировать контент, распознавать предвзятость и проверять источники<br> Источник: опросы (ежегодно) или сертификация программ медиаобразования<br> Пример: если 36% населения имеют медиаграмотность → R_capability = √0.36 = 0.60<br> Агрегация R (пример):<br> R = 0.80^0.40 × 0.25^0.35 × 0.60^0.25<br> = 0.830 × 0.400 × 0.855<br> = 0.283 (низкая устойчивость из-за малого охвата)<br> 2.2 Защита от хрупкости: Clamping к ε<br> Проблема: если какой-то вход = 0 или близко к 0, логарифм или степень могут вызвать числовую нестабильность или дать странные результаты.<br> Решение: перед любыми операциями (степень, логарифм, произведение) все входы зажимаются:<br> $$X \leftarrow \max(X, \epsilon), \quad \epsilon = 0.01$$<br> Применяется к:<br> C, T, V, R (и всем их субиндексам)<br> НЕ применяется к:<br> P, D (так как они уже ограничены [0, 1])<br> Пример:<br> Если T = 0.002 (критически низко)<br> После clamping: T ← max(0.002, 0.01) = 0.01<br> Теперь T^0.40 = 0.01^0.40 ≈ 0.251 (вместо деления на ноль)<br> 2.3 Мета-версии методик (mx.y обозначение)<br> Проблема: если методика V_gen меняется (новый LLM, новая панель запросов), это влияет на исторический ряд.<br> Решение: введена система мета-версий:<br> Если методика меняется:<br> Пример: новая панель LLM для V_gen<br> Старая: mV.1 (ChatGPT + Yandex.GPT)<br> Новая: mV.2 (ChatGPT + Yandex.GPT + Claude)<br> Действие:<br> 1. Пересчитываются ОБНОВЛЕННЫЕ V.2 для ВСЕХ предыдущих периодов<br> 2. Вычисляется bridge factor (например, V.2 в среднем на 5% выше V.1)<br> 3. Исторические данные пересчитываются или отмечаются как "несопоставимые"<br> 4. В отчёте указывается: "Методика V_gen изменилась мета-версия mV.1 → mV.2 c [дата]"<br> 3. МАТЕМАТИЧЕСКОЕ ЯДРО (УРОВЕНЬ 1 И 2)<br> 3.1 Потенциал S_pot (физический уровень)<br> $$S_{\text{pot}} = C^{w_C} \times T^{w_T} \times V^{w_V}$$<br> Параметры:<br> w_C = 0.25 (вес производства контента)<br> w_T = 0.40 (вес доверия — САМЫЙ ВАЖНЫЙ)<br> w_V = 0.35 (вес видимости)<br> Сумма весов: 0.25 + 0.40 + 0.35 = 1.00 ✓<br> Интерпретация:<br> Мультипликативная структура (не аддитивная): недостаток в одном параметре сильно влияет<br> Степени (вес 0.25–0.40) означают, что прирост C от 0.5 до 0.6 менее значим, чем от 0.1 до 0.2 (закон убывающей предельной полезности)<br> Пример вычисления:<br> Входы: C = 0.72, T = 0.68, V = 0.65<br> S_pot = 0.72^0.25 × 0.68^0.40 × 0.65^0.35<br> = 0.9217 × 0.8265 × 0.8704<br> ≈ 0.663<br> Интерпретация: потенциал системы = 66.3% от максимума.<br> Чувствительность на веса:<br> Если w_T = 0.40 (текущее):<br> dS_pot / dT = 0.40 × T^(0.40-1) × (C^0.25 × V^0.35)<br> = 0.40 × T^(-0.60) × S_pot/T<br> ≈ 0.588 при T=0.68<br> Если w_T = 0.35 (гипотетически):<br> dS_pot / dT ≈ 0.513<br> Вывод: увеличение w_T на 5% увеличивает чувствительность на ~15%<br> 3.2 Демпфер угроз F_lin<br> $$F_{\text{lin}} = \frac{1}{1 + \alpha \cdot P + \beta \cdot D + \gamma \cdot (P \cdot D)}$$<br> Параметры:<br> α = 1.0 (интенсивность давления P)<br> β = 1.2 (интенсивность атак D, сильнее чем P)<br> γ ≥ 0 (синергия P×D; по умолчанию 0.5)<br> Интерпретация:<br> F_lin ∈ (0, 1]<br> При P=0, D=0: F_lin = 1.0 (нет атак, нет помех)<br> При P↑ или D↑: F_lin ↓ (система ослабевает)<br> При P и D одновременно↑: F_lin падает БЫСТРЕЕ (синергия)<br> Пример синергии:<br> Сценарий 1: только P<br> P = 0.40, D = 0 → F_lin = 1/(1 + 0.40) = 0.714<br> Сценарий 2: только D<br> P = 0, D = 0.40 → F_lin = 1/(1 + 1.2×0.40) = 0.677<br> Сценарий 3: P и D одновременно<br> P = 0.40, D = 0.40 → F_lin = 1/(1 + 0.40 + 0.48 + 0.5×0.16)<br> = 1/(1 + 0.40 + 0.48 + 0.08)<br> = 1/1.96 ≈ 0.510<br> Вывод: эффект вместе (0.510) гораздо хуже, чем сумма отдельных (0.714 + 0.677 = 1.391)!<br> Это "мультипликативный кризис" — большинство стратегических шоков = одновременные.<br> Почему β = 1.2 > α = 1.0?<br> Дезинформация опаснее, чем просто иностранное потребление:<br> P (иностранное потребление) = "конкуренция" (люди сами выбирают смотреть иностранное)<br> D (дезинформация) = "яд" (активная дезинформация снижает доверие к ВСЕМ источникам)<br> Коэффициент 1.2 означает, что одна единица D "давит" на 20% сильнее, чем одна единица P.<br> 3.3 Нагрузка (Load) и режим мягкого порога<br> $$\text{Load} = \frac{P + 1.5 \cdot D}{1 + R}$$<br> Интерпретация:<br> Числитель: P + 1.5·D = давление (нагрузка, которую испытывает система)<br> Множитель 1.5 означает, что D считается в полтора раза более "интенсивной"<br> Знаменатель: 1 + R = способность системы выдерживать (устойчивость буферизирует нагрузку)<br> При R = 0: Load = P + 1.5·D (максимальное воздействие)<br> При R = 1: Load = (P + 1.5·D) / 2 (половинное воздействие благодаря реакции)<br> Пример:<br> Нормальное состояние:<br> P = 0.42, D = 0.35, R = 0.78<br> Load = (0.42 + 1.5×0.35) / (1 + 0.78)<br> = (0.42 + 0.525) / 1.78<br> = 0.945 / 1.78<br> ≈ 0.531 (нагрузка ниже критического порога θ = 0.85)<br> При атаке:<br> P = 0.50, D = 0.92, R = 0.65<br> Load = (0.50 + 1.5×0.92) / (1 + 0.65)<br> = (0.50 + 1.38) / 1.65<br> = 1.88 / 1.65<br> ≈ 1.139 (нагрузка ПРЕВЫШАЕТ порог!)<br> 3.4 Мягкий порог (Softplus)<br> $$\text{Excess}_{\text{soft}} = \frac{\ln(1 + \exp(k \cdot (\text{Load} - \theta)))}{k}$$<br> Где:<br> θ = 0.85 (критический порог нагрузки, калибруется)<br> k = 2.0 (мягкость перехода, v2.1c зафиксирован)<br> Зачем "мягкий" вместо "острого"?<br> ❌ Острый порог (v2.0a):<br> Excess_sharp = max(0, Load - θ)<br> Если Load меняется 0.84 → 0.86:<br> Excess_sharp: 0 → 0.01 (лишь небольшой скачок)<br> Но F_soft = exp(-λ × Excess_sharp):<br> F_soft: 1.0 → 0.98 (малый эффект)<br> Но если индекс рассчитывается по округлению:<br> Load = 0.848 (граница сходит ± 0.002)<br> Excess_sharp = 0.002 или 0 (СКАЧОК!)<br> Система "мерцает" между зонами<br> ✅ Мягкий порог (v2.1c):<br> Excess_soft использует softplus = гладкая функция<br> Если Load меняется 0.84 → 0.86:<br> Excess_soft: 0.081 → 0.089 (плавное изменение)<br> F_soft: 0.857 → 0.847 (плавное деградирование)<br> Интерпретация: система деградирует ПЛАВНО, не "щелкает"<br> Примеры расчёта:<br> Случай 1: Load = 0.50 (безопасно)<br> Excess_soft = ln(1 + exp(2.0 × (0.50 - 0.85))) / 2.0<br> = ln(1 + exp(-0.70)) / 2.0<br> = ln(1 + 0.497) / 2.0<br> = ln(1.497) / 2.0<br> ≈ 0.201 (небольшой избыток)<br> F_soft = exp(-2.0 × 0.201) = exp(-0.402) ≈ 0.669<br> Случай 2: Load = 0.85 (ровно на пороге)<br> Excess_soft = ln(1 + exp(0)) / 2.0<br> = ln(2) / 2.0<br> ≈ 0.347<br> F_soft = exp(-2.0 × 0.347) = exp(-0.694) ≈ 0.500<br> Случай 3: Load = 1.20 (перегруз)<br> Excess_soft = ln(1 + exp(0.70)) / 2.0<br> = ln(1 + 2.014) / 2.0<br> = ln(3.014) / 2.0<br> ≈ 0.551<br> F_soft = exp(-2.0 × 0.551) = exp(-1.102) ≈ 0.332<br> График F_soft(Load):<br> F_soft<br> 1.0 |●●●●●●●●<br> | ●●●●●<br> 0.5 | ●●●●<br> | ●●●●<br> | ●●●<br> 0.0 |________________●●●●___Load<br> 0.0 0.5 1.0 1.5 2.0<br> Граница перехода: Load ≈ 0.85 (где F_soft ≈ 0.5)<br> 3.5 Итоговый сырой индекс S_raw<br> $$S_{\text{raw}} = S_{\text{pot}} \times F_{\text{lin}} \times F_{\text{soft}}$$<br> Интерпретация: произведение трёх мультипликаторов:<br> S_pot — что мы можем произвести (потенциал)<br> F_lin — на сколько это ослабляют линейные атаки (демпфер)<br> F_soft — на сколько это ослабляет нелинейная перегрузка (режим коллапса)<br> Пример (нормальное состояние):<br> S_pot = 0.663<br> F_lin = 0.814<br> F_soft = 0.669<br> S_raw = 0.663 × 0.814 × 0.669 ≈ 0.362<br> Пример (при атаке):<br> S_pot = 0.580 (упал из-за T↓)<br> F_lin = 0.510 (синергия P+D)<br> F_soft = 0.332 (режим коллапса, Load > θ)<br> S_raw = 0.580 × 0.510 × 0.332 ≈ 0.098<br> 3.6 KPI-маппинг (уровень 2): преобразование S_raw → S_KPI<br> $$S_{\text{KPI}} = 100 \times \text{clip}{[0, 1.5]}\left(\frac{\log{10}(S_{\text{raw}} + \delta_{\text{ad}}) - \log_{10}(S_{\text{min}})}{\log_{10}(S_{\text{max}}) - \log_{10}(S_{\text{min}})}\right)$$<br> Параметры (фиксированы на версию):<br> δ_ad = 0.01 × median(S_raw за 12 месяцев) (предотвращает log(0))<br> Если нет истории: δ_ad = 10^-6<br> S_min = 0.05 (якорь: когда S_raw = 0.05 → S_KPI = 0)<br> S_max = 1.5 (якорь: когда S_raw = 1.5 → S_KPI = 150)<br> Интерпретация логарифмического маппинга:<br> Логарифм сжимает динамический диапазон (S_raw [0.01, 1.5] → более управляемая шкала)<br> Якоря S_min, S_max фиксируются, чтобы обеспечить СОПОСТАВИМОСТЬ во времени<br> Если якоря менялись (rebasing), это = новая версия модели, требует явного одобрения Комитета<br> Примеры расчёта:<br> Пример 1: S_raw = 0.362 (нормальное состояние)<br> δ_ad = 0.01 × 0.35 = 0.0035 (упростим до 0.003)<br> S_KPI = 100 × clip[(log(0.362+0.003) - log(0.05)) / (log(1.5) - log(0.05))]<br> = 100 × clip[(log(0.365) - log(0.05)) / (log(1.5) - log(0.05))]<br> = 100 × clip[(-0.438 - (-1.301)) / (0.176 - (-1.301))]<br> = 100 × clip[0.863 / 1.477]<br> = 100 × clip[0.584]<br> = 58.4 → ✅ 🟢 Управляемая устойчивость<br> Пример 2: S_raw = 0.098 (при атаке)<br> S_KPI = 100 × clip[(log(0.098) - log(0.05)) / (log(1.5) - log(0.05))]<br> = 100 × clip[(-1.008 - (-1.301)) / 1.477]<br> = 100 × clip[0.293 / 1.477]<br> = 100 × clip[0.198]<br> = 19.8 → ⚠️ 🔴 Критический режим<br> Зональная классификация (на основе S_KPI):<br> 4. НЕОПРЕДЕЛЁННОСТЬ И MONTE CARLO<br> 4.1 Принцип: всегда публиковать интервалы<br> Проблема: Точечная оценка "S_KPI = 52" без интервала скрывает неопределённость и уязвима для критики.<br> Решение: Модель ВСЕГДА вычисляет распределение S_KPI через Monte Carlo, публикует:<br> Медиану S_KPI<br> 95% доверительный интервал (CI) [q₀.₀₂₅, q₀.₉₇₅]<br> Вероятности зон P(🔴), P(🟡), P(🟢), P(🔵), P(🟣)<br> Статус доверия (High/Medium/Low на основе ширины CI)<br> 4.2 Алгоритм Monte Carlo<br> Вход:<br> Текущие значения входов: C, T, V, P, D, R (точечные оценки)<br> Неопределённость каждого входа (распределения ошибок)<br> Процедура (для i = 1 до N, где N = 1000–5000 прогонов):<br> 1. Для каждого входа X ∈ {C, T, V, P, D, τ, CR, AR, ML, ...}:<br> X_i ~ распределение ошибок (зависит от X)<br> 2. Вычислить R_i из компонент R_response_i, R_coverage_i, R_capability_i<br> 3. Вычислить S_pot_i, F_lin_i, Load_i, F_soft_i, S_raw_i<br> 4. Вычислить S_KPI_i по формуле KPI-маппинга<br> 5. Сохранить S_KPI_i в массив samples[]<br> Выход:<br> samples[] = [S_KPI_1, S_KPI_2, ..., S_KPI_N]<br> Статистики:<br> median = samples[N/2] после сортировки<br> CI_low = samples[floor(N × 0.025)] (2.5-й процентиль)<br> CI_high = samples[ceil(N × 0.975)] (97.5-й процентиль)<br> P(zone) = доля samples в каждой зоне / N<br> confidence = 'High' если CI_high - CI_low ≤ 8<br> = 'Medium' если 8 < ... ≤ 15<br> = 'Low' если > 15<br> 4.3 Распределения ошибок входов<br> T (Доверие) — Normal<br> $$T_i \sim \mathcal{N}(T_{\text{point}}, \sigma_T^2)$$<br> Где σ_T = МОЕ (Margin of Error) опроса<br> Пример: T = 0.68, МОЕ = ±0.034 (95% CI = [0.646, 0.714]) → σ_T = 0.034 / 1.96 ≈ 0.0173<br> V_gen (Видимость в генеративном поиске) — Beta<br> $$V_{\text{gen},i} \sim \text{Beta}(\alpha, \beta)$$<br> Где α, β подбираются на основе выборки LLM тестов<br> Пример: из 500 тестов, 310 ссылок на национальные источники → V_gen = 0.62 → Используем Beta(310, 190) для моделирования вариаций<br> P (Давление) — Normal<br> $$P_i \sim \mathcal{N}(P_{\text{point}}, \sigma_P^2)$$<br> Где σ_P ≈ 0.03–0.05 (зависит от размера панели просмотра)<br> D (Дезинформация) — Mixed (Normal + Expert adjustment)<br> $$D_i \sim \mathcal{N}(D_{\text{point}}, \sigma_D^2) + \text{expert_noise}$$<br> Где expert_noise ∈ [-0.1, 0.1] с равномерным распределением (так как экспертные оценки субъективны)<br> τ (Время реакции) — Lognormal<br> $$\tau_i \sim \text{LogNormal}(\mu, \sigma^2)$$<br> Почему логнормальное? Потому что реакция асимметрична:<br> Быстрая реакция (0.5 дня) легче, чем очень быстрая (0.2 дня)<br> Медленная реакция возможна, но более редка<br> 4.4 Пример вычисления доверия<br> Сценарий 1: хорошие данные<br> Входы:<br> - T = 0.68, МОЕ = ±0.034 (выборка 1500)<br> - V_gen = 0.62 из 500 тестов LLM<br> - P = 0.42 из панели 10K пользователей<br> - D = 0.75 (экспертная оценка ±0.10)<br> Monte Carlo (N=2000):<br> samples[] вычислены для всех вариаций входов<br> Результаты:<br> median(S_KPI) = 52.3<br> CI_95 = [48.1, 56.8]<br> ширина = 56.8 - 48.1 = 8.7 (≈ 8, граница!)<br> confidence = 'HIGH' (еле-еле, CI ≤ 8)<br> Сценарий 2: плохие данные<br> Входы:<br> - T = 0.68, МОЕ = ±0.10 (выборка 300, мала!)<br> - V_gen = 0.62 из только 100 тестов (мало панели)<br> - P = 0.42 из панели 2K пользователей (маловато)<br> - D = 0.75, но с ±0.20 (высокая неопределённость)<br> Monte Carlo (N=2000):<br> samples[] более разреженные из-за широких входных интервалов<br> Результаты:<br> median(S_KPI) = 52.3 (точка та же!)<br> CI_95 = [40.2, 68.5]<br> ширина = 28.3<br> confidence = 'LOW' (> 15, данные ненадежны!)<br> 5. КАЛИБРОВКА ПАРАМЕТРОВ θ, λ, γ<br> 5.1 Что калибруется?<br> В версии v2.1c, следующие параметры фиксированы:<br> w_C = 0.25, w_T = 0.40, w_V = 0.35 (веса потенциала)<br> α = 1.0, β = 1.2 (интенсивности демпфера)<br> k = 2.0 (мягкость softplus)<br> S_min = 0.05, S_max = 1.5 (якоря)<br> Подлежат калибровке:<br> θ — критический порог нагрузки Load (текущая гипотеза: 0.85)<br> λ — интенсивность режима коллапса (текущая гипотеза: 2.0)<br> γ — синергия P×D в F_lin (текущая гипотеза: 0.5)<br> 5.2 Данные для калибровки<br> Требования:<br> Минимум 5–7 "эпизодов" (4–6 месячных точек данных каждый)<br> Типы эпизодов:<br> 2 "нормальных" (разные годы/сезоны, без особых шоков)<br> 2–3 "кризисных" (шоки по D/T/V, известные события)<br> 1–2 "восстановления" (система восстанавливалась после кризиса)<br> Исторические эпизоды РК (предложение):<br> COVID-19 (Q1–Q2 2020) — шок T (падение доверия) и V (изоляция), R (медленнаяреакция)<br> Январские события (Q1 2022) — шок D (массивная дезинформация), P (люди ищут информацию), R падает<br> Энергокризис (Q3–Q4 2022) — шок T (отвлечение внимания), P растёт (иностранный контент о кризисе)<br> Нормальные периоды (Q3 2021, Q3 2023) — базовые наблюдения<br> 5.3 Целевая функция (Loss)<br> $$L = 0.35 \cdot FN + 0.25 \cdot FP + 0.20 \cdot \text{ExcessRate} + 0.20 \cdot \text{JumpPenalty}$$<br> FN (False Negative Rate) — сколько дней кризиса пропустили?<br> FN = (дни в crisis_period где Load < θ) / (всего дней в crisis_periods)<br> Цель: FN < 15% (85% чувствительность)<br> Пример: если 100 дней кризиса, пропустили 10 дней → FN = 0.10 = 10%<br> FP (False Positive Rate) — ложные сигналы кризиса?<br> FP = (дни вне crisis где Load > θ) / (всего дней без crisis)<br> Цель: FP < 10% (90% специфичность)<br> Пример: если 800 дней норма, ложно пометили 40 дней → FP = 0.05 = 5%<br> ExcessRate — средний фоновый "шум" в режиме коллапса<br> ExcessRate = mean(Excess_soft для дней вне кризиса)<br> Цель: ExcessRate < 0.05 (минимум шума)<br> Если слишком высокий ExcessRate → параметры не оптимальны<br> JumpPenalty — слишком ли "скачет" индекс?<br> JumpPenalty = mean(|dS_KPI/dt|) за 7-дневные окна<br> Цель: JumpPenalty < 0.5 (≤0.5 баллов/день в среднем)<br> Пример: если S_KPI = 50 → 48 → 52 → 55 в четыре дня подряд<br> Скачки: |50-48|=2, |48-52|=4, |52-55|=3 → средний = 3 баллов/день<br> Это слишком волатильно!<br> 5.4 Процедура оптимизации<br> Метод: Grid search + local refinement (или байесовская оптимизация)<br> 1. Определить диапазоны:<br> θ ∈ [0.70, 1.00] (в шагах 0.05)<br> λ ∈ [1.0, 3.0] (в шагах 0.2)<br> γ ∈ [0.0, 1.0] (в шагах 0.1)<br> 2. Для каждой комбинации (θ, λ, γ):<br> a) Вычислить S_KPI для всех исторических дней<br> b) Вычислить FN, FP, ExcessRate, JumpPenalty<br> c) Вычислить Loss = 0.35·FN + 0.25·FP + 0.20·ER + 0.20·JP<br> 3. Выбрать комбинацию с minimum(Loss)<br> 4. Локальное уточнение вокруг минимума (шаг 0.01)<br> 5. Вычислить 10-fold cross-validation, чтобы убедиться, что параметры не переобучены<br> 5.5 Документирование калибровки<br> Обязательные артефакты:<br> Файл: calibration_results_v2.1c.xlsx<br> Таблица 1: Grid search<br> | θ | λ | γ | FN | FP | ER | JP | Loss |<br> |------|-----|------|-------|-------|-------|-------|-------|<br> | 0.70 | 1.0 | 0.0 | 0.22 | 0.08 | 0.12 | 0.6 | 0.268 |<br> | 0.75 | 1.5 | 0.2 | 0.18 | 0.07 | 0.09 | 0.5 | 0.208 |<br> | 0.85 | 2.0 | 0.5 | 0.12 | 0.06 | 0.04 | 0.4 | 0.147 | ← MINIMUM<br> | 0.90 | 2.5 | 0.8 | 0.15 | 0.11 | 0.08 | 0.7 | 0.202 |<br> | ... | ... | ... | ... | ... | ... | ... | ... |<br> Выбор: θ = 0.85, λ = 2.0, γ = 0.5 (minimum Loss)<br> Файл: cross_validation_v2.1c.txt<br> 10-fold Cross Validation Results:<br> Fold 1: Loss = 0.148<br> Fold 2: Loss = 0.146<br> Fold 3: Loss = 0.151<br> ...<br> Fold 10: Loss = 0.145<br> Mean Loss: 0.1473 ± 0.0025 (std) ← очень низкая вариативность → параметры робастны!<br> Протокол решения Комитета модели:<br> Date: 2026-01-08<br> Decision: Approve parameters θ=0.85, λ=2.0, γ=0.5<br> Evidence: Grid search on 4 historical episodes + 10-fold CV<br> Confidence: HIGH (consistent across folds, minimum loss achieved)<br> Approved by: [подписи членов Комитета]<br> 6. СТРЕСС-ТЕСТЫ И ВАЛИДАЦИЯ<br> 6.1 Классы тестов<br> Класс A: Однофакторные шоки<br> Процедура: для каждого входа X ∈ {C, T, V, P, D, R}, вычислить S_KPI при X ± ΔX:<br> Пример для T (доверие):<br> Текущее T = 0.68<br> T' = 0.68 - 0.15 = 0.53 (-22%)<br> T' = 0.68 - 0.10 = 0.58 (-15%)<br> T' = 0.68 - 0.05 = 0.63 (-7%)<br> T' = 0.68 + 0.05 = 0.73 (+7%)<br> T' = 0.68 + 0.10 = 0.78 (+15%)<br> T' = 0.68 + 0.15 = 0.83 (+22%)<br> Результаты:<br> T=0.53: S_KPI = 38.2 (уязвимость)<br> T=0.58: S_KPI = 44.6 (граница норма)<br> T=0.63: S_KPI = 48.9 (норма слабо)<br> T=0.73: S_KPI = 56.1 (норма сильно)<br> T=0.78: S_KPI = 61.4 (хорошо)<br> T=0.83: S_KPI = 67.8 (хорошо)<br> Ожидания:<br> ✅ Монотонность: S_KPI ↑ при T ↑ (логично)<br> ✅ Выпуклость: Δ S_KPI за -0.15 немного больше, чем за +0.15 (убывающая предельная полезность)<br> Класс B: Двухфакторные шоки<br> Пример: D-шок + одновременное падение R (реакция отстаёт)<br> Сценарий: Дезинформационная атака + система медленно реагирует<br> Текущее: D = 0.35, R = 0.78 → S_KPI = 52.3<br> Шок: D = 0.90, R = 0.60<br> S_KPI = ?<br> Результат: S_KPI = 32.1 (кризис!)<br> Эффект синергии: D×R падение создаёт мультипликативный ущерб<br> Класс C: Реалистичные кризисные профили<br> Основано на исторических эпизодах:<br> Профиль "COVID" (2020):<br> - T ↓ (падение доверия к поначалу)<br> - V ↑ (люди смотрят новости = видимость растёт)<br> - D ↑ (информационный шум, паника)<br> - R ↓ (медленно реагируем на панику)<br> - C ↑ (контент-производство растёт для информирования)<br> - P растёт (люди ищут информацию везде)<br> Тест: S_KPI должна упасть (несмотря на V ↑), т.к. T ↓ + D ↑ > V ↑<br> Результат: S_KPI = 45.2 (уязвимость) ✅<br> Класс D: Worst-case сценарии<br> Экстремальная атака + системный отказ:<br> C = 0.20 (контент парализован)<br> T = 0.15 (никто не верит)<br> V = 0.40 (контент не видится)<br> P = 0.90 (все смотрят иностранное)<br> D = 0.95 (полная дезинформационная война)<br> R = 0.10 (система не реагирует)<br> Ожидание: S_KPI < 15 (критический кризис)<br> Результат: S_KPI = 8.3 → 🔴 КРИТИЧЕСКИЙ РЕЖИМ ✅<br> Класс E: Позитивные сценарии<br> Укрепление потенциала + снижение атак:<br> C = 0.90 (контент производство в норме)<br> T = 0.85 (люди доверяют)<br> V = 0.90 (контент видится везде)<br> P = 0.20 (иностранное потребление минимально)<br> D = 0.15 (атаки слабые)<br> R = 0.95 (система реагирует молниеносно)<br> Ожидание: S_KPI > 100 (отличная устойчивость)<br> Результат: S_KPI = 128.4 → 🟣 ОТЛИЧНАЯ УСТОЙЧИВОСТЬ ✅<br> 7. ВЕРСИОНИРОВАНИЕ И ANTI-MANIPULATION<br> 7.1 Версионирование (v, mx.y)<br> Два типа версий:<br> Версия модели (v2.1c)<br> Меняется, когда изменяются формулы, веса или параметры ядра:<br> Изменение w_C, w_T, w_V<br> Изменение α, β, γ<br> Изменение формулы S_pot, F_lin, F_soft<br> Изменение θ, λ (параметры калибровки) если в Комитете решили переделать<br> Изменение якорей S_min, S_max<br> Процедура:<br> Новая версия требует решения Комитета модели<br> Параллельный запуск (старая + новая версия)<br> Переходный период (обе версии публикуются)<br> Историческая переинтерпретация (пересчёт всех архивных данных)<br> Мета-версии входов (mC.y, mT.y, и т.д.)<br> Меняются, когда изменяются методики измерения входов:<br> mC.1 → mC.2: новый источник данных Supply/Quality<br> mT.1 → mT.2: новая панель опроса, новая формулировка вопроса<br> mV.1 → mV.2: добавление нового LLM в панель V_gen<br> mD.1 → mD.2: обновление детектора дезинформации<br> Процедура:<br> При смене методики: параллельный запуск (старая + новая)<br> Вычисление "bridge factor" (как старая/новая соотносятся)<br> Историческая переинтерпретация для сопоставимости<br> В отчёте: "Data entered under mV.2 (from [date])"<br> 7.2 Роли и контроль<br> Владелец модели (Policy Owner)<br> Назначение: от МКИ<br> Ответство: зачем нужна модель, как она используется<br> Полномочия: предлагать калибровку, но не одобрять (требуется Комитет)<br> Техвладелец (Implementation Owner)<br> Назначение: из техподразделения<br> Ответство: правильная реализация формул, воспроизводимость<br> Полномочия: контроль качества кода, тестирование<br> Комитет модели<br> Состав: 5–7 человек (Policy owner, Tech owner, Data owner, 2–3 независимых эксперта)<br> Функции: одобрение калибровки, решения о версионировании<br> Голосование: простое большинство, но внешние эксперты имеют veto-право<br> Независимый аудитор<br> Назначение: на 3 года, независимо от Комитета<br> Функции: случайная выборочная проверка 1–2 раз в квартал<br> Полномочия: может потребовать пересчёт перед публикацией<br> 7.3 Запреты (anti-manipulation)<br> 🚫 ЗАПРЕЩЕНО:<br> - Менять θ, λ, γ без решения Комитета<br> - Менять методику входа без документирования мета-версии<br> - Публиковать S_KPI без 95% CI и доверия (confidence)<br> - Скрывать мета-версии или версионирование<br> - Менять S_min, S_max для "улучшения" результатов<br> ✅ РАЗРЕШЕНО:<br> - Исправлять ошибки в данных (если ошибка доказана)<br> - Обновлять данные каждый месяц (нормальный цикл)<br> - Публиковать Low confidence результаты (но с оговорками)<br> - Рекомендовать переколибровку (если Loss растёт)<br> 8. ШАБЛОН УПРАВЛЕНЧЕСКОГО ОТЧЁТА<br> Обязательная структура (8 страниц)<br> Страница 1: СВОДКА<br> S-G Index Monthly Report<br> Month: January 2026 | Version: v2.1c (data: mC.1, mT.1, mV.1, mP.1, mD.1, mR.1)<br> ┌────────────────────────────────┐<br> │ S_KPI = 52.3 │<br> │ 95% CI: [48.1 — 56.8] │<br> │ Confidence: HIGH │<br> │ │<br> │ Status: 🟢 Управляемая │<br> │ устойчивость │<br> └────────────────────────────────┘<br> Zone Probabilities:<br> 🔴 Кризис: 2.1%<br> 🟡 Уязвимость: 12.4%<br> 🟢 Норма: 58.3% ← медиана здесь<br> 🔵 Хорошо: 22.8%<br> 🟣 Отличное: 4.4%<br> Тренд: +1.2 балла от предыдущего месяца (медленный рост)<br> Рекомендация: Продолжить мониторинг, особое внимание на D (атаки растут)<br> Страница 2: ДРАЙВЕРЫ И ЧУВСТВИТЕЛЬНОСТЬ<br> Входные значения:<br> C = 0.72 (производство контента: ХОРОШО)<br> T = 0.68 (доверие: СРЕДНЕЕ)<br> V = 0.65 (видимость: СРЕДНЕЕ)<br> P = 0.42 (иностранное потребление: УМЕРЕННОЕ)<br> D = 0.35 (атаки: СЛАБЫЕ)<br> R = 0.78 (устойчивость: ХОРОШАЯ)<br> Компоненты формулы:<br> S_pot = 0.663 (потенциал 66%)<br> F_lin = 0.814 (демпфер теряет 19%)<br> F_soft = 0.669 (мягкий порог теряет 33%)<br> S_raw = 0.362<br> Tornado (чувствительность):<br> D (атаки): 95% влияния ← ГЛАВНЫЙ РЫЧАГ<br> P (давление): 82% влияния<br> R (реакция): 76% влияния<br> T (доверие): 68% влияния<br> V (видимость): 54% влияния<br> C (контент): 38% влияния<br> Вывод: система НАИБОЛЕЕ чувствительна к D и P. Укрепление R — самый эффективный рычаг.<br> Рекомендация для следующей зоны (60+):<br> - Увеличить V (видимость) на 8–10%<br> - ИЛИ снизить P (давление) на 5–7%<br> - ИЛИ снизить D (атаки) на 8–10%<br> Страница 3: НАГРУЗКА И ПОРОГ<br> Load = (P + 1.5×D) / (1 + R)<br> = (0.42 + 1.5×0.35) / (1 + 0.78)<br> = 0.945 / 1.78<br> = 0.531<br> Сравнение с порогом θ = 0.85:<br> Load (0.531) < θ (0.85) ✅<br> Система НИЖЕ критического порога<br> Excess_soft = 0.201 (небольшой избыток)<br> F_soft = 0.669 (демпфер на 67%)<br> При шоке (+50% к D):<br> Load = (0.42 + 1.5×0.525) / 1.78 = 0.730 (ещё ниже порога)<br> При экстремальном шоке (D=0.90, P=0.60, R=0.65):<br> Load = (0.60 + 1.35) / 1.65 = 1.18 (ВЫШЕ порога! Режим коллапса)<br> F_soft = 0.332 (только 33%)<br> Страница 4: КАЧЕСТВО ДАННЫХ И МЕТОДОЛОГИЯ<br> Data Quality Flags:<br> ✅ HIGH:<br> - C (Supply): МКИ статистика, объём 5000+ ед/месяц, непрерывные логи<br> - R (Resilience): Полные логи реагирования, МКИ + медиа-мониторинг<br> ⚠️ MEDIUM:<br> - T (Trust): Опрос N=1200, МОЕ = ±3.4%, но вопрос менялся (mT.1→mT.1 same)<br> - D (Disinformation): Детектор v2.3, ручная верификация 50/500 примеров (92% согласие)<br> ❌ LOW:<br> - V_gen (Visibility in generative search): Только 100 запросов LLM, новый Claude добавлен<br> Meta-versions:<br> mC.1 (Supply/Quality методика от Q1 2024)<br> mT.1 (Опрос от August 2023)<br> mV.1 (Видимость: TikTok+IG+FB+VK+Telegram)<br> mD.1 (Детектор дезинформации v2.3)<br> mR.1 (Логи реагирования)<br> Методические изменения в январе:<br> - [25 Jan] Добавлен Claude в панель V_gen (mV.1→mV.2 подготавливается, будет в Feb)<br> Рекомендация:<br> При mV.2 в феврале возможен скачок V_gen на ±5%, интерпретировать с осторожностью<br> Страница 5: СЦЕНАРИИ И "СКОЛЬКО НУЖНО ИЗМЕНИТЬ"<br> Сценарий 1: Неожиданный шок как Jan-2022 (D↑ в 2.6x)<br> Если D = 0.35 → 0.92:<br> - S_KPI упадет с 52.3 → 28.4 (кризис)<br> - Нужна срочная реакция (R↑) и контрмеры (D↓)<br> Сценарий 2: Долгосрочный тренд (годовой план)<br> Если достичь S_KPI = 75+ (зона 🔵):<br> - T должна ↑ до 0.78 (требует 15 месяцев работы по доверию)<br> - V должна ↑ до 0.80 (требует новые партнёрства)<br> - P должна ↓ до 0.30 (требует популяризация местного контента)<br> Сценарий 3: Защита при новой атаке<br> Если готовиться к D = 0.75 (вероятная атака):<br> - Текущее R = 0.78 недостаточно<br> - Нужна R ↑ до 0.90 (ускорение реакции)<br> - Нужна T ↑ до 0.75+ (укрепление доверия как буфер)<br> - Результат: S_KPI даже при D=0.75 будет 45+ (уязвимость, но не кризис)<br> Страница 6: АНОМАЛИИ И ФЛАГИ<br> Contradiction Flags:<br> ⚠️ Flag 1: P-растёт, но T-стабильна<br> P = 0.42 (выросла на 3 п.п. за месяц)<br> T = 0.68 (не упала, стабильна)<br> Интерпретация: Люди потребляют больше иностранного контента, но доверие не падает<br> → Может быть, люди активнее смотрят новости (информационный спрос), а не недоверие<br> → Или V выросла (контент стал более видимым, но потребителям хочется большего выбора)<br> Действие: Дополнительная диагностика в феврале<br> ⚠️ Flag 2: D стабильна, но V_gen падает<br> D = 0.35 (стабильна)<br> V_gen = 0.62 (упала на 5 п.п.)<br> Интерпретация: Дезинформация не растёт, но национальный контент менее видим в LLM<br> → Может быть, новый LLM (Claude) менее знаком с национальными источниками<br> → Или мета-версия V_gen меняется (будущее mV.2)<br> Действие: Это будет прояснено при добавлении Claude (mV.2)<br> Страница 7: РЕГЛАМЕНТНЫЕ ОТМЕТКИ<br> Версионирование:<br> Model version: v2.1c (неизменна, параметры стабильны)<br> Data versions:<br> - mC.1 (since Q1 2024): Supply/Quality методика<br> - mT.1 (since Aug 2023): Опрос Trust<br> - mV.1 (since Oct 2023): Видимость в 5 платформах<br> → mV.2 (подготавливается с Feb 2026): добавлен Claude<br> - mD.1 (since Nov 2025): Детектор дезинформации v2.3<br> - mR.1 (since Q4 2023): Логи реагирования<br> Комитет модели решение (от 2025-12-15):<br> ✅ Утверждены параметры v2.1c (θ=0.85, λ=2.0, γ=0.5)<br> ✅ Loss function сходится хорошо на историческом данные<br> ✅ 10-fold CV показывает стабильность<br> Независимый аудит (last: 2026-01-05):<br> ✅ Spot check на 20 случайных дней за Dec: Precision=0.91, Recall=0.88 (норма)<br> ✅ Нет обнаружено манипуляций или ошибок<br> Следующий плановый аудит: Feb 2026 (2 месяца)<br> Страница 8: РЕКОМЕНДАЦИИ И ДЕЙСТВИЯ<br> Рекомендации для ЛПР (по приоритетам):<br> СРОЧНО (этот месяц):<br> 1. Мониторить D (атаки). Если D выше 0.50 → активировать контрмеры.<br> 2. Проверить V_gen методику (будущая mV.2) — готовиться к возможному скачку.<br> В КВАРТАЛЕ:<br> 3. Увеличить V (видимость) через партнёрства с платформами (target: V → 0.75)<br> 4. Укрепить T (доверие) через открытую коммуникацию и фактчеки (target: T → 0.75)<br> 5. Снизить P (иностранное потребление) через популяризацию местного контента (target: P → 0.35)<br> В ГОДУ:<br> 6. Достичь S_KPI = 70+ (зона 🔵) через комплексное укрепление системы<br> Финансирование:<br> - Для V↑: ~50M KZT (контент-производство, платформенные партнёрства)<br> - Для T↑: ~30M KZT (программы медиаграмотности, открытость)<br> - Для P↓: ~40M KZT (поддержка национальных медиа)<br> - Для R↑: ~60M KZT (инфраструктура быстрого отклика)<br> Total: ~180M KZT на год для перехода в зону 🔵<br> Expected ROI: Информационная безопасность + устойчивость к атакам + доверие<br> 9. ПРИЛОЖЕНИЯ<br> A. Таблица параметров (финальная)<br> B. Псевдокод алгоритма<br> FUNCTION calculateIndex(C, T, V, P, D, τ, CR, AR, ML, params):<br> // Шаг 1: Clamping<br> C ← max(C, ε)<br> T ← max(T, ε)<br> V ← max(V, ε)<br> // Шаг 2: Потенциал<br> S_pot ← C^(w_C) × T^(w_T) × V^(w_V)<br> // Шаг 3: Демпфер<br> F_lin ← 1 / (1 + α×P + β×D + γ×P×D)<br> // Шаг 4: Устойчивость<br> R_response ← 1 / (1 + (τ/τ₀)²)<br> R_coverage ← clip[0,1](CR / (AR + ε))<br> R_capability ← sqrt(ML)<br> R ← R_response^a × R_coverage^b × R_capability^c<br> // Шаг 5: Нагрузка<br> Load ← (P + 1.5×D) / (1 + R)<br> // Шаг 6: Мягкий порог<br> excess ← ln(1 + exp(k × (Load - θ))) / k<br> F_soft ← exp(-λ × excess)<br> // Шаг 7: S_raw<br> S_raw ← S_pot × F_lin × F_soft<br> // Шаг 8: KPI-маппинг<br> δ_ad ← 0.01 × median(S_raw last 12 months)<br> log_norm ← (log₁₀(S_raw + δ_ad) - log₁₀(S_min)) / (log₁₀(S_max) - log₁₀(S_min))<br> S_KPI ← 100 × clip[0,1.5](log_norm)<br> // Шаг 9: Зона<br> IF S_KPI < 25: zone ← "🔴 Кризис"<br> ELSE IF S_KPI < 40: zone ← "🟡 Уязвимость"<br> ELSE IF S_KPI < 60: zone ← "🟢 Управляемо"<br> ELSE IF S_KPI < 100: zone ← "🔵 Хорошо"<br> ELSE: zone ← "🟣 Отлично"<br> RETURN {S_KPI, zone, S_pot, F_lin, F_soft, Load, R}<br> END FUNCTION<br> FUNCTION monteCarlo(inputs, uncertainties, N=1000):<br> samples ← []<br> FOR i = 1 TO N:<br> // Семплировать с шумом<br> C_i ← sample(Normal(C, σ_C))<br> T_i ← sample(Normal(T, σ_T))<br> ... (аналогично для V, P, D, τ, etc.)<br> // Вычислить индекс<br> result_i ← calculateIndex(C_i, T_i, V_i, P_i, D_i, τ_i, ...)<br> S_KPI_i ← result_i.S_KPI<br> samples.append(S_KPI_i)<br> END FOR<br> // Статистики<br> sort(samples)<br> median ← samples[N/2]<br> CI_low ← samples[round(N×0.025)]<br> CI_high ← samples[round(N×0.975)]<br> confidence ← 'High' if (CI_high - CI_low ≤ 8) else 'Medium'/'Low'<br> RETURN {median, CI_low, CI_high, confidence, samples}<br> END FUNCTION<br> <br> Аспект | Преимущество<br> Разделение забот | Физика (модель) отделена от политики (интерпретация)<br> Воспроизводимость | S_raw технический, не зависит от определения зон<br> Масштабируемость | Если добавить новый "рычаг" (например, кибератаки), просто добавить множитель в S_raw<br> Управляемость | S_KPI [0, 150] удобнее для руководства, чем S_raw ∈ [0, 1.5]<br> Якоря | S_min, S_max (якоря логарифма) фиксируются на версию, что гарантирует сопоставимость во времени<br> Параметр | Обозначение | Что означает<br> C входит | mC.1 | Первая версия методики C (Supply + Quality)<br> T входит | mT.1 | Первая версия опроса T<br> V входит | mV.1 | Первая версия V (V_soc, V_gen, V_search)<br> P входит | mP.1 | Первая версия панели P<br> D входит | mD.1 | Первая версия детектора D<br> R входит | mR.1 | Первая версия расчёта R<br> Диапазон | Зона | Интерпретация | Действие<br> 0–25 | 🔴 Кризис | Неустойчивость, срочное вмешательство | Экстренные меры<br> 25–40 | 🟡 Уязвимость | Низкая устойчивость, требуется внимание | Усиление реакции<br> 40–60 | 🟢 Управляемо | Норма, система справляется | Плановый мониторинг<br> 60–100 | 🔵 Высоко | Хорошее состояние, запас прочности | Поддержание<br> 100–150 | 🟣 Отлично | Высокая защита, стратегический буфер | Оптимизация<br> Параметр | Значение | Статус | Комментарий<br> w_C | 0.25 | Фиксирован в v2.1c | Вес C в S_pot<br> w_T | 0.40 | Фиксирован в v2.1c | Вес T (важнейший)<br> w_V | 0.35 | Фиксирован в v2.1c | Вес V<br> α | 1.0 | Фиксирован в v2.1c | Интенсивность P в F_lin<br> β | 1.2 | Фиксирован в v2.1c | Интенсивность D (> α)<br> γ | 0.5 | Фиксирован, калибруется в v2.2+ | Синергия P×D<br> k | 2.0 | Фиксирован в v2.1c | Мягкость softplus<br> θ | 0.85 | Калибруется | Критический порог Load<br> λ | 2.0 | Калибруется | Интенсивность коллапса<br> ε | 0.01 | Фиксирован | Clamping нижний порог<br> τ₀ | 1.0 день | Фиксирован | Целевое время реакции<br> a, b, c | 0.40, 0.35, 0.25 | Фиксирован | Веса R субиндексов<br> S_min | 0.05 | Фиксирован на версию | Якорь логарифма (min)<br> S_max | 1.5 | Фиксирован на версию | Якорь логарифма (max)<br> N (Monte Carlo) | 1000–5000 | Оперативно | Кол-во прогонов UQ