[drive-download] SG-Index-Technical draft.docx
Сущности
S-G Index v2.1c<br>
ПОЛНАЯ ТЕХНИЧЕСКАЯ СПЕЦИФИКАЦИЯ<br>
ОГЛАВЛЕНИЕ<br>
Архитектурный обзор<br>
Определение и нормирование входов (C, T, V, P, D, R)<br>
Математическое ядро (2 уровня: физический и управленческий)<br>
Модули неопределённости (UQ) и Monte Carlo<br>
Процедуры калибровки параметров<br>
Стресс-тесты и валидация<br>
Регламент версионирования и anti-manipulation gates<br>
Шаблон управленческого отчёта<br>
Приложения (таблицы, псевдокод)<br>
1. АРХИТЕКТУРНЫЙ ОБЗОР<br>
1.1 Назначение модели<br>
S-G Index (Sovereignty-Guard Index) — композитная модель для оценки способности государственной системы удерживать информационное пространство при наличии:<br>
Внешних информационных атак (дезинформационные кампании)<br>
Давления иностранного контента<br>
Внутренних ограничений (ресурсы, доверие)<br>
Динамических вызовов (новые платформы, методики)<br>
Целевая аудитория:<br>
Лица, принимающие управленческие решения (ЛПР)<br>
Стратегические аналитики и медиа-политологи<br>
Независимые аудиторы и исследователи<br>
Область применения:<br>
Ежемесячный мониторинг информационного суверенитета РК<br>
Обоснование приоритизации инвестиций в контент и инфраструктуру<br>
Оценка эффективности контрмер против дезинформации<br>
Долгосрочное стратегическое планирование<br>
Границы применимости:<br>
❌ НЕ предназначена для анализа отдельных тем (климат, политика, экономика)<br>
❌ НЕ показывает региональные или демографические различия<br>
❌ НЕ является заменой экспертным оценкам по специальным вопросам<br>
⚠️ Требует надлежащего качества данных входов (при Low confidence выводы ограничены)<br>
1.2 Структура: два уровня<br>
Уровень 1: Физический (техническое ядро)<br>
$$S_{\text{raw}} = S_{\text{pot}} \times F_{\text{lin}} \times F_{\text{soft}}$$<br>
Где:<br>
S_pot — потенциал системы (внутренняя способность: производство контента, доверие, видимость)<br>
F_lin — демпфер угроз (как нагрузка иностранного давления и атаки снижают потенциал)<br>
F_soft — режим мягкого порога (плавный переход в перегрузку вместо резкого "щелчка")<br>
Результат: число S_raw ∈ [0, 1.5], где 1.0 = базовый уровень.<br>
Уровень 2: Управленческий (KPI)<br>
$$S_{\text{KPI}} = 100 \times \text{clip}{[0,1.5]}\left(\frac{\log{10}(S_{\text{raw}} + \delta_{\text{ad}}) - \log_{10}(S_{\text{min}})}{\log_{10}(S_{\text{max}}) - \log_{10}(S_{\text{min}})}\right)$$<br>
Результат: число S_KPI ∈ [0, 150], где:<br>
🔴 [0, 25] — Критический режим<br>
🟡 [25, 40] — Уязвимость<br>
🟢 [40, 60] — Управляемая устойчивость (норма)<br>
🔵 [60, 100] — Высокая устойчивость<br>
🟣 [100, 150] — Отличная устойчивость<br>
1.3 Преимущества двухуровневой архитектуры<br>
2. ОПРЕДЕЛЕНИЕ И НОРМИРОВАНИЕ ВХОДОВ<br>
2.1 Шесть входных переменных (C, T, V, P, D, R)<br>
C — Capacity (Мощность производства контента)<br>
Определение: Способность национальной системы производить, поддерживать и распространять информационный контент достаточного объёма и качества.<br>
Измерение:<br>
C = 0.6 × norm(Supply) + 0.4 × norm(Quality)<br>
Где:<br>
Supply = объём производства (единиц контента/месяц)<br>
Источник: статистика<br>
Нормирование: по историческому диапазону (10 лет) или плану на 2030 год<br>
Пример: если историческая норма = 500 ед/мес, текущее = 400 ед → norm(Supply) = 0.80<br>
Quality = факт-корректность и соответствие стандартам<br>
Источник: Платформа фактчека РК или независимый аудит<br>
Измерение: доля материалов без опровержений / критических замечаний<br>
Пример: если 95% контента прошли проверку → Quality = 0.95<br>
Валидационные границы:<br>
Min (критическая низость): C = 0.15 (система парализована)<br>
Max (плато насыщения): C = 0.95 (невозможно превысить)<br>
Защита от хрупкости: применяется clamping к ε = 0.01 перед логарифмированием.<br>
T — Trust (Доверие аудитории)<br>
Определение: Доля респондентов (возрастная группа 14–65 лет), которые "в основном или полностью доверяют" национальным новостным источникам.<br>
Измерение:<br>
T = (численность доверяющих) / (панель опроса, исключая "не знаю")<br>
Источник данных:<br>
Регулярные опросы общественного мнения (ежемесячно или ежеквартально)<br>
Поставщик: МКИ, аккредитованный социологический центр<br>
Объём выборки: ≥ 1000 респондентов (минимум 500)<br>
Доверительный интервал (МОЕ): ± 3–4%<br>
Нормирование: уже в [0, 1], если опрос проводится как доля.<br>
Пример расчёта:<br>
Опрос N = 1200 респондентов<br>
Ответивших: 1150 (50 = "не знаю")<br>
Доверяющих: 782<br>
T = 782 / 1150 ≈ 0.68<br>
Валидационные границы:<br>
Min: T = 0.10 (практически никто не верит)<br>
Max: T = 0.95 (почти все доверяют, реалистичный потолок для любого источника)<br>
Флаги качества:<br>
⚠️ Если МОЕ > 5%, доверие к T снижается (Medium confidence)<br>
⚠️ Если выборка < 500, переход на Low confidence<br>
⚠️ Если формулировка вопроса менялась, отметить как новая мета-версия<br>
V — Visibility (Видимость национального контента)<br>
Определение: Доля национальных источников в потребляемом контенте (взвешенная по платформам).<br>
Измерение (3-компонентная модель):<br>
V = V_soc^0.5 × V_gen^0.3 × V_search^0.2<br>
Где каждая компонента нормирована в [0, 1]:<br>
V_soc — Видимость в соцсетях (вес 50%)<br>
Источник: анализ TikTok, Instagram, Facebook, ВКонтакте, Telegram, WhatsApp<br>
Метрика: (просмотры национального контента) / (всего просмотров в категории "новости")<br>
Объём: выборка 10,000+ видео/постов в день<br>
Пример: если из 100K просмотров в категории "политика", 40K от национальных источников → V_soc = 0.40<br>
V_gen — Видимость в генеративном поиске (вес 30%)<br>
Источник: тестирование LLM (ChatGPT, Claude, Yandex.GPT, локальные модели)<br>
Метрика: Доля ссылок на национальные источники в ответах на стандартные вопросы о РК<br>
Методология:<br>
Выбираются 100 репрезентативных вопросов о РК (история, политика, экономика, культура)<br>
Для каждого LLM проводится по 100 тестов<br>
Подсчитывается доля национальных ссылок в ответах<br>
Результаты усредняются по всем LLM<br>
Пример: V_gen = 0.62 означает, что 62% цитируемых источников — национальные<br>
V_search — Видимость в поисковых системах (вес 20%)<br>
Источник: анализ Google, Yandex, Bing по стандартным поисковым запросам о РК<br>
Метрика: (национальные домены в топ-10) / 10<br>
Запросы: выборка из 50 популярных запросов типа "Казахстан экономика", "политика РК", "история"<br>
Пример: если в топ-10 результатов по "Казахстан 2026" 7 национальных источников → V_search = 0.70<br>
Агрегация V:<br>
V = 0.40^0.5 × 0.62^0.3 × 0.70^0.2<br>
≈ 0.632 × 0.852 × 0.927<br>
≈ 0.50 (средняя видимость)<br>
Защита от методических дрейфов:<br>
Если добавляется новая платформа (TikTok раньше было 5%, теперь 30%), это = новая мета-версия V<br>
Если LLM существенно обновляет индексацию (например, ChatGPT добавляет новые источники), это = новая мета-версия V_gen<br>
Все переходы документируются с "bridge formula" для исторической сопоставимости<br>
P — Pressure (Нагрузка иностранного потребления)<br>
Определение: Доля иностранного контента в структуре потребления аудитории (взвешенная по времени просмотра).<br>
Измерение:<br>
P = (время просмотра иностранного контента) / (общее время потребления контента)<br>
Источники данных:<br>
Панель просмотра (Media panelists) или агрегированные логи платформ<br>
Платформы: YouTube (глобальный трафик), TikTok, Instagram, Facebook, ВКонтакте, Telegram<br>
Выборка: 5,000+ активных пользователей, ежедневный мониторинг<br>
Категоризация контента:<br>
Национальный: создатель/издатель физически зарегистрирован в РК<br>
Иностранный: создатель/издатель в других странах (включая русскоязычный контент из РУ, США и т.п.)<br>
Пример расчёта:<br>
Отслеживается 5000 пользователей в течение месяца<br>
Общее время просмотра (видео, новости, тексты): 500,000 часов<br>
Время просмотра иностранного контента: 210,000 часов<br>
P = 210,000 / 500,000 = 0.42<br>
Уточнения:<br>
Включаются только "информационные" категории (новости, аналитика, социальные комментарии)<br>
Развлечение (фильмы, музыка) исключаются, т.к. это не "информационное давление"<br>
Учитывается время просмотра, а не количество просмотров (1 часовое видео = 60 минут, 100 коротких роликов = может быть 5–10 минут)<br>
Валидационные границы:<br>
Min: P = 0.10 (очень высокая "информационная изоляция" — нереалистична)<br>
Max: P = 0.90 (население почти полностью потребляет иностранное)<br>
D — Disinformation (Интенсивность дезинформационных атак)<br>
Определение: Интегральная метрика мощности дезинформационных кампаний, учитывающая объём, координацию, сложность и воздействие.<br>
Измерение (4-компонентная модель):<br>
D = 0.3 × Volume + 0.25 × Sophistication + 0.25 × Coordination + 0.2 × Impact<br>
Где каждая компонента нормирована в [0, 1]:<br>
Volume (Объём) — вес 30%<br>
Метрика: количество обнаруженных ложных утверждений в день / базовый уровень<br>
Источник: детекторы дезинформации, платформы (YouTube, Facebook, TikTok), Платформа фактчека РК<br>
Пример: если обычно 50 фейков/день, а в день кампании 500 → Volume = min(500/500, 1.0) = 1.0<br>
Sophistication (Сложность) — вес 25%<br>
Метрика: оценка технической и нарративной сложности атак<br>
0.1 = примитивные фейки ("глупый фейк", явная ложь)<br>
0.5 = средние фейки (деконтекстуализация, selective omission)<br>
1.0 = высокие фейки (синтетика, deepfake, сложный нарратив)<br>
Источник: экспертная оценка (группа из 3–5 специалистов по дезинформации)<br>
Процедура: еженедельно эксперты оценивают 50–100 примеров, выводят среднюю оценку<br>
Coordination (Координация) — вес 25%<br>
Метрика: измеряет, насколько атаки организованы<br>
0.1 = случайные, разрозненные фейки<br>
0.5 = заметная синхронизация (одновременные посты в разных платформах)<br>
1.0 = полная координация (centralized command, бот-сеть, инструктажи)<br>
Источник: анализ временных меток, ip-адресов, поведения аккаунтов (pattern matching)<br>
Инструмент: НЛП (Natural Language Processing) на предмет одинаковых фрагментов текста, одинаковых хэштегов, одинаковых временных окон публикации<br>
Impact (Воздействие) — вес 20%<br>
Метрика: как фейки распространяются и влияют на аудиторию<br>
0.1 = низкое (посты получают 100–500 просмотров)<br>
0.5 = среднее (10K–100K просмотров, заметное участие в комментариях)<br>
1.0 = высокое (>500K просмотров, тренды в соцсетях, упоминания в ТВ)<br>
Источник: анализ engagement (лайки, репосты, комментарии)<br>
Агрегация D:<br>
Пример: D = 0.3 × 0.90 + 0.25 × 0.70 + 0.25 × 0.80 + 0.2 × 0.60<br>
= 0.27 + 0.175 + 0.20 + 0.12<br>
= 0.755 (мощная скоординированная кампания)<br>
Защита от методических ошибок:<br>
⚠️ Если детектор дезинформации меняет версию (новый алгоритм), это = новая мета-версия D<br>
✅ Обязательна ежемесячная верификация (50 случайных примеров проверяются человеком)<br>
R — Resilience (Устойчивость системы)<br>
Определение: Способность системы быстро реагировать на атаки, охватывать контрмерами и подготавливать аудиторию к дезинформации.<br>
Структура (3 субиндекса):<br>
R = R_response^0.40 × R_coverage^0.35 × R_capability^0.25<br>
R_response — Скорость реакции (вес 40%, наиболее важен)<br>
$$R_{\text{response}} = \frac{1}{1 + \left(\frac{\tau}{\tau_0}\right)^2}$$<br>
Где:<br>
τ = среднее время реагирования на дезинформацию (дни)<br>
Определение: от момента выявления фейка до публикации официального опровержения/контр-контента<br>
Источник: логи МКИ, официальные заявления, медиа-мониторинг<br>
Пример: если обнаружили фейк в среду 12:00, опровергли в четверг 10:00 → τ = 0.92 дня<br>
τ₀ = целевой уровень скорости (фиксируется = 1 день)<br>
τ₀ = 1.0 означает, что идеальная реакция — в течение суток<br>
Примеры:<br>
τ = 0.5 дня (реагируем в течение 12 часов) → R_response = 1/(1+(0.5/1)^2) ≈ 0.80<br>
τ = 1.0 день (реагируем в течение 24 часов) → R_response = 1/(1+1^2) = 0.50<br>
τ = 2.0 дня (реагируем в течение 48 часов) → R_response = 1/(1+4) = 0.20<br>
τ = 5.0 дней (реагируем через 5 дней) → R_response = 1/(1+25) ≈ 0.04<br>
R_coverage — Охват контрмер (вес 35%)<br>
$$R_{\text{coverage}} = \text{clip}_{[0,1]}\left(\frac{CR}{AR + \epsilon}\right)$$<br>
Где:<br>
CR = количество человек, охватываемых опровержением (reach)<br>
Источник: статистика просмотров официальных постов, упоминания в медиа<br>
Пример: если опровержение МКИ получило 500K просмотров на TikTok, YouTube, Facebook<br>
CR = 500K<br>
AR = количество человек, охватываемых оригинальным фейком (attacked reach)<br>
Источник: анализ фейк-постов в социальных сетях<br>
Пример: если фейк распространялся и собрал 2М просмотров, комментариев, репостов<br>
AR = 2M<br>
Пример расчёта:<br>
R_coverage = min(1, 500K / (2M + 0.01)) = min(1, 0.25) = 0.25<br>
(Означает, что охватываем только 25% от числа людей, видевших фейк)<br>
R_capability — Способность аудитории/системы (вес 25%)<br>
$$R_{\text{capability}} = \sqrt{ML}$$<br>
Где:<br>
ML = Media Literacy (доля населения с хорошей медиаграмотностью)<br>
Определение: люди, которые могут критически анализировать контент, распознавать предвзятость и проверять источники<br>
Источник: опросы (ежегодно) или сертификация программ медиаобразования<br>
Пример: если 36% населения имеют медиаграмотность → R_capability = √0.36 = 0.60<br>
Агрегация R (пример):<br>
R = 0.80^0.40 × 0.25^0.35 × 0.60^0.25<br>
= 0.830 × 0.400 × 0.855<br>
= 0.283 (низкая устойчивость из-за малого охвата)<br>
2.2 Защита от хрупкости: Clamping к ε<br>
Проблема: если какой-то вход = 0 или близко к 0, логарифм или степень могут вызвать числовую нестабильность или дать странные результаты.<br>
Решение: перед любыми операциями (степень, логарифм, произведение) все входы зажимаются:<br>
$$X \leftarrow \max(X, \epsilon), \quad \epsilon = 0.01$$<br>
Применяется к:<br>
C, T, V, R (и всем их субиндексам)<br>
НЕ применяется к:<br>
P, D (так как они уже ограничены [0, 1])<br>
Пример:<br>
Если T = 0.002 (критически низко)<br>
После clamping: T ← max(0.002, 0.01) = 0.01<br>
Теперь T^0.40 = 0.01^0.40 ≈ 0.251 (вместо деления на ноль)<br>
2.3 Мета-версии методик (mx.y обозначение)<br>
Проблема: если методика V_gen меняется (новый LLM, новая панель запросов), это влияет на исторический ряд.<br>
Решение: введена система мета-версий:<br>
Если методика меняется:<br>
Пример: новая панель LLM для V_gen<br>
Старая: mV.1 (ChatGPT + Yandex.GPT)<br>
Новая: mV.2 (ChatGPT + Yandex.GPT + Claude)<br>
Действие:<br>
1. Пересчитываются ОБНОВЛЕННЫЕ V.2 для ВСЕХ предыдущих периодов<br>
2. Вычисляется bridge factor (например, V.2 в среднем на 5% выше V.1)<br>
3. Исторические данные пересчитываются или отмечаются как "несопоставимые"<br>
4. В отчёте указывается: "Методика V_gen изменилась мета-версия mV.1 → mV.2 c [дата]"<br>
3. МАТЕМАТИЧЕСКОЕ ЯДРО (УРОВЕНЬ 1 И 2)<br>
3.1 Потенциал S_pot (физический уровень)<br>
$$S_{\text{pot}} = C^{w_C} \times T^{w_T} \times V^{w_V}$$<br>
Параметры:<br>
w_C = 0.25 (вес производства контента)<br>
w_T = 0.40 (вес доверия — САМЫЙ ВАЖНЫЙ)<br>
w_V = 0.35 (вес видимости)<br>
Сумма весов: 0.25 + 0.40 + 0.35 = 1.00 ✓<br>
Интерпретация:<br>
Мультипликативная структура (не аддитивная): недостаток в одном параметре сильно влияет<br>
Степени (вес 0.25–0.40) означают, что прирост C от 0.5 до 0.6 менее значим, чем от 0.1 до 0.2 (закон убывающей предельной полезности)<br>
Пример вычисления:<br>
Входы: C = 0.72, T = 0.68, V = 0.65<br>
S_pot = 0.72^0.25 × 0.68^0.40 × 0.65^0.35<br>
= 0.9217 × 0.8265 × 0.8704<br>
≈ 0.663<br>
Интерпретация: потенциал системы = 66.3% от максимума.<br>
Чувствительность на веса:<br>
Если w_T = 0.40 (текущее):<br>
dS_pot / dT = 0.40 × T^(0.40-1) × (C^0.25 × V^0.35)<br>
= 0.40 × T^(-0.60) × S_pot/T<br>
≈ 0.588 при T=0.68<br>
Если w_T = 0.35 (гипотетически):<br>
dS_pot / dT ≈ 0.513<br>
Вывод: увеличение w_T на 5% увеличивает чувствительность на ~15%<br>
3.2 Демпфер угроз F_lin<br>
$$F_{\text{lin}} = \frac{1}{1 + \alpha \cdot P + \beta \cdot D + \gamma \cdot (P \cdot D)}$$<br>
Параметры:<br>
α = 1.0 (интенсивность давления P)<br>
β = 1.2 (интенсивность атак D, сильнее чем P)<br>
γ ≥ 0 (синергия P×D; по умолчанию 0.5)<br>
Интерпретация:<br>
F_lin ∈ (0, 1]<br>
При P=0, D=0: F_lin = 1.0 (нет атак, нет помех)<br>
При P↑ или D↑: F_lin ↓ (система ослабевает)<br>
При P и D одновременно↑: F_lin падает БЫСТРЕЕ (синергия)<br>
Пример синергии:<br>
Сценарий 1: только P<br>
P = 0.40, D = 0 → F_lin = 1/(1 + 0.40) = 0.714<br>
Сценарий 2: только D<br>
P = 0, D = 0.40 → F_lin = 1/(1 + 1.2×0.40) = 0.677<br>
Сценарий 3: P и D одновременно<br>
P = 0.40, D = 0.40 → F_lin = 1/(1 + 0.40 + 0.48 + 0.5×0.16)<br>
= 1/(1 + 0.40 + 0.48 + 0.08)<br>
= 1/1.96 ≈ 0.510<br>
Вывод: эффект вместе (0.510) гораздо хуже, чем сумма отдельных (0.714 + 0.677 = 1.391)!<br>
Это "мультипликативный кризис" — большинство стратегических шоков = одновременные.<br>
Почему β = 1.2 > α = 1.0?<br>
Дезинформация опаснее, чем просто иностранное потребление:<br>
P (иностранное потребление) = "конкуренция" (люди сами выбирают смотреть иностранное)<br>
D (дезинформация) = "яд" (активная дезинформация снижает доверие к ВСЕМ источникам)<br>
Коэффициент 1.2 означает, что одна единица D "давит" на 20% сильнее, чем одна единица P.<br>
3.3 Нагрузка (Load) и режим мягкого порога<br>
$$\text{Load} = \frac{P + 1.5 \cdot D}{1 + R}$$<br>
Интерпретация:<br>
Числитель: P + 1.5·D = давление (нагрузка, которую испытывает система)<br>
Множитель 1.5 означает, что D считается в полтора раза более "интенсивной"<br>
Знаменатель: 1 + R = способность системы выдерживать (устойчивость буферизирует нагрузку)<br>
При R = 0: Load = P + 1.5·D (максимальное воздействие)<br>
При R = 1: Load = (P + 1.5·D) / 2 (половинное воздействие благодаря реакции)<br>
Пример:<br>
Нормальное состояние:<br>
P = 0.42, D = 0.35, R = 0.78<br>
Load = (0.42 + 1.5×0.35) / (1 + 0.78)<br>
= (0.42 + 0.525) / 1.78<br>
= 0.945 / 1.78<br>
≈ 0.531 (нагрузка ниже критического порога θ = 0.85)<br>
При атаке:<br>
P = 0.50, D = 0.92, R = 0.65<br>
Load = (0.50 + 1.5×0.92) / (1 + 0.65)<br>
= (0.50 + 1.38) / 1.65<br>
= 1.88 / 1.65<br>
≈ 1.139 (нагрузка ПРЕВЫШАЕТ порог!)<br>
3.4 Мягкий порог (Softplus)<br>
$$\text{Excess}_{\text{soft}} = \frac{\ln(1 + \exp(k \cdot (\text{Load} - \theta)))}{k}$$<br>
Где:<br>
θ = 0.85 (критический порог нагрузки, калибруется)<br>
k = 2.0 (мягкость перехода, v2.1c зафиксирован)<br>
Зачем "мягкий" вместо "острого"?<br>
❌ Острый порог (v2.0a):<br>
Excess_sharp = max(0, Load - θ)<br>
Если Load меняется 0.84 → 0.86:<br>
Excess_sharp: 0 → 0.01 (лишь небольшой скачок)<br>
Но F_soft = exp(-λ × Excess_sharp):<br>
F_soft: 1.0 → 0.98 (малый эффект)<br>
Но если индекс рассчитывается по округлению:<br>
Load = 0.848 (граница сходит ± 0.002)<br>
Excess_sharp = 0.002 или 0 (СКАЧОК!)<br>
Система "мерцает" между зонами<br>
✅ Мягкий порог (v2.1c):<br>
Excess_soft использует softplus = гладкая функция<br>
Если Load меняется 0.84 → 0.86:<br>
Excess_soft: 0.081 → 0.089 (плавное изменение)<br>
F_soft: 0.857 → 0.847 (плавное деградирование)<br>
Интерпретация: система деградирует ПЛАВНО, не "щелкает"<br>
Примеры расчёта:<br>
Случай 1: Load = 0.50 (безопасно)<br>
Excess_soft = ln(1 + exp(2.0 × (0.50 - 0.85))) / 2.0<br>
= ln(1 + exp(-0.70)) / 2.0<br>
= ln(1 + 0.497) / 2.0<br>
= ln(1.497) / 2.0<br>
≈ 0.201 (небольшой избыток)<br>
F_soft = exp(-2.0 × 0.201) = exp(-0.402) ≈ 0.669<br>
Случай 2: Load = 0.85 (ровно на пороге)<br>
Excess_soft = ln(1 + exp(0)) / 2.0<br>
= ln(2) / 2.0<br>
≈ 0.347<br>
F_soft = exp(-2.0 × 0.347) = exp(-0.694) ≈ 0.500<br>
Случай 3: Load = 1.20 (перегруз)<br>
Excess_soft = ln(1 + exp(0.70)) / 2.0<br>
= ln(1 + 2.014) / 2.0<br>
= ln(3.014) / 2.0<br>
≈ 0.551<br>
F_soft = exp(-2.0 × 0.551) = exp(-1.102) ≈ 0.332<br>
График F_soft(Load):<br>
F_soft<br>
1.0 |●●●●●●●●<br>
| ●●●●●<br>
0.5 | ●●●●<br>
| ●●●●<br>
| ●●●<br>
0.0 |________________●●●●___Load<br>
0.0 0.5 1.0 1.5 2.0<br>
Граница перехода: Load ≈ 0.85 (где F_soft ≈ 0.5)<br>
3.5 Итоговый сырой индекс S_raw<br>
$$S_{\text{raw}} = S_{\text{pot}} \times F_{\text{lin}} \times F_{\text{soft}}$$<br>
Интерпретация: произведение трёх мультипликаторов:<br>
S_pot — что мы можем произвести (потенциал)<br>
F_lin — на сколько это ослабляют линейные атаки (демпфер)<br>
F_soft — на сколько это ослабляет нелинейная перегрузка (режим коллапса)<br>
Пример (нормальное состояние):<br>
S_pot = 0.663<br>
F_lin = 0.814<br>
F_soft = 0.669<br>
S_raw = 0.663 × 0.814 × 0.669 ≈ 0.362<br>
Пример (при атаке):<br>
S_pot = 0.580 (упал из-за T↓)<br>
F_lin = 0.510 (синергия P+D)<br>
F_soft = 0.332 (режим коллапса, Load > θ)<br>
S_raw = 0.580 × 0.510 × 0.332 ≈ 0.098<br>
3.6 KPI-маппинг (уровень 2): преобразование S_raw → S_KPI<br>
$$S_{\text{KPI}} = 100 \times \text{clip}{[0, 1.5]}\left(\frac{\log{10}(S_{\text{raw}} + \delta_{\text{ad}}) - \log_{10}(S_{\text{min}})}{\log_{10}(S_{\text{max}}) - \log_{10}(S_{\text{min}})}\right)$$<br>
Параметры (фиксированы на версию):<br>
δ_ad = 0.01 × median(S_raw за 12 месяцев) (предотвращает log(0))<br>
Если нет истории: δ_ad = 10^-6<br>
S_min = 0.05 (якорь: когда S_raw = 0.05 → S_KPI = 0)<br>
S_max = 1.5 (якорь: когда S_raw = 1.5 → S_KPI = 150)<br>
Интерпретация логарифмического маппинга:<br>
Логарифм сжимает динамический диапазон (S_raw [0.01, 1.5] → более управляемая шкала)<br>
Якоря S_min, S_max фиксируются, чтобы обеспечить СОПОСТАВИМОСТЬ во времени<br>
Если якоря менялись (rebasing), это = новая версия модели, требует явного одобрения Комитета<br>
Примеры расчёта:<br>
Пример 1: S_raw = 0.362 (нормальное состояние)<br>
δ_ad = 0.01 × 0.35 = 0.0035 (упростим до 0.003)<br>
S_KPI = 100 × clip[(log(0.362+0.003) - log(0.05)) / (log(1.5) - log(0.05))]<br>
= 100 × clip[(log(0.365) - log(0.05)) / (log(1.5) - log(0.05))]<br>
= 100 × clip[(-0.438 - (-1.301)) / (0.176 - (-1.301))]<br>
= 100 × clip[0.863 / 1.477]<br>
= 100 × clip[0.584]<br>
= 58.4 → ✅ 🟢 Управляемая устойчивость<br>
Пример 2: S_raw = 0.098 (при атаке)<br>
S_KPI = 100 × clip[(log(0.098) - log(0.05)) / (log(1.5) - log(0.05))]<br>
= 100 × clip[(-1.008 - (-1.301)) / 1.477]<br>
= 100 × clip[0.293 / 1.477]<br>
= 100 × clip[0.198]<br>
= 19.8 → ⚠️ 🔴 Критический режим<br>
Зональная классификация (на основе S_KPI):<br>
4. НЕОПРЕДЕЛЁННОСТЬ И MONTE CARLO<br>
4.1 Принцип: всегда публиковать интервалы<br>
Проблема: Точечная оценка "S_KPI = 52" без интервала скрывает неопределённость и уязвима для критики.<br>
Решение: Модель ВСЕГДА вычисляет распределение S_KPI через Monte Carlo, публикует:<br>
Медиану S_KPI<br>
95% доверительный интервал (CI) [q₀.₀₂₅, q₀.₉₇₅]<br>
Вероятности зон P(🔴), P(🟡), P(🟢), P(🔵), P(🟣)<br>
Статус доверия (High/Medium/Low на основе ширины CI)<br>
4.2 Алгоритм Monte Carlo<br>
Вход:<br>
Текущие значения входов: C, T, V, P, D, R (точечные оценки)<br>
Неопределённость каждого входа (распределения ошибок)<br>
Процедура (для i = 1 до N, где N = 1000–5000 прогонов):<br>
1. Для каждого входа X ∈ {C, T, V, P, D, τ, CR, AR, ML, ...}:<br>
X_i ~ распределение ошибок (зависит от X)<br>
2. Вычислить R_i из компонент R_response_i, R_coverage_i, R_capability_i<br>
3. Вычислить S_pot_i, F_lin_i, Load_i, F_soft_i, S_raw_i<br>
4. Вычислить S_KPI_i по формуле KPI-маппинга<br>
5. Сохранить S_KPI_i в массив samples[]<br>
Выход:<br>
samples[] = [S_KPI_1, S_KPI_2, ..., S_KPI_N]<br>
Статистики:<br>
median = samples[N/2] после сортировки<br>
CI_low = samples[floor(N × 0.025)] (2.5-й процентиль)<br>
CI_high = samples[ceil(N × 0.975)] (97.5-й процентиль)<br>
P(zone) = доля samples в каждой зоне / N<br>
confidence = 'High' если CI_high - CI_low ≤ 8<br>
= 'Medium' если 8 < ... ≤ 15<br>
= 'Low' если > 15<br>
4.3 Распределения ошибок входов<br>
T (Доверие) — Normal<br>
$$T_i \sim \mathcal{N}(T_{\text{point}}, \sigma_T^2)$$<br>
Где σ_T = МОЕ (Margin of Error) опроса<br>
Пример: T = 0.68, МОЕ = ±0.034 (95% CI = [0.646, 0.714]) → σ_T = 0.034 / 1.96 ≈ 0.0173<br>
V_gen (Видимость в генеративном поиске) — Beta<br>
$$V_{\text{gen},i} \sim \text{Beta}(\alpha, \beta)$$<br>
Где α, β подбираются на основе выборки LLM тестов<br>
Пример: из 500 тестов, 310 ссылок на национальные источники → V_gen = 0.62 → Используем Beta(310, 190) для моделирования вариаций<br>
P (Давление) — Normal<br>
$$P_i \sim \mathcal{N}(P_{\text{point}}, \sigma_P^2)$$<br>
Где σ_P ≈ 0.03–0.05 (зависит от размера панели просмотра)<br>
D (Дезинформация) — Mixed (Normal + Expert adjustment)<br>
$$D_i \sim \mathcal{N}(D_{\text{point}}, \sigma_D^2) + \text{expert_noise}$$<br>
Где expert_noise ∈ [-0.1, 0.1] с равномерным распределением (так как экспертные оценки субъективны)<br>
τ (Время реакции) — Lognormal<br>
$$\tau_i \sim \text{LogNormal}(\mu, \sigma^2)$$<br>
Почему логнормальное? Потому что реакция асимметрична:<br>
Быстрая реакция (0.5 дня) легче, чем очень быстрая (0.2 дня)<br>
Медленная реакция возможна, но более редка<br>
4.4 Пример вычисления доверия<br>
Сценарий 1: хорошие данные<br>
Входы:<br>
- T = 0.68, МОЕ = ±0.034 (выборка 1500)<br>
- V_gen = 0.62 из 500 тестов LLM<br>
- P = 0.42 из панели 10K пользователей<br>
- D = 0.75 (экспертная оценка ±0.10)<br>
Monte Carlo (N=2000):<br>
samples[] вычислены для всех вариаций входов<br>
Результаты:<br>
median(S_KPI) = 52.3<br>
CI_95 = [48.1, 56.8]<br>
ширина = 56.8 - 48.1 = 8.7 (≈ 8, граница!)<br>
confidence = 'HIGH' (еле-еле, CI ≤ 8)<br>
Сценарий 2: плохие данные<br>
Входы:<br>
- T = 0.68, МОЕ = ±0.10 (выборка 300, мала!)<br>
- V_gen = 0.62 из только 100 тестов (мало панели)<br>
- P = 0.42 из панели 2K пользователей (маловато)<br>
- D = 0.75, но с ±0.20 (высокая неопределённость)<br>
Monte Carlo (N=2000):<br>
samples[] более разреженные из-за широких входных интервалов<br>
Результаты:<br>
median(S_KPI) = 52.3 (точка та же!)<br>
CI_95 = [40.2, 68.5]<br>
ширина = 28.3<br>
confidence = 'LOW' (> 15, данные ненадежны!)<br>
5. КАЛИБРОВКА ПАРАМЕТРОВ θ, λ, γ<br>
5.1 Что калибруется?<br>
В версии v2.1c, следующие параметры фиксированы:<br>
w_C = 0.25, w_T = 0.40, w_V = 0.35 (веса потенциала)<br>
α = 1.0, β = 1.2 (интенсивности демпфера)<br>
k = 2.0 (мягкость softplus)<br>
S_min = 0.05, S_max = 1.5 (якоря)<br>
Подлежат калибровке:<br>
θ — критический порог нагрузки Load (текущая гипотеза: 0.85)<br>
λ — интенсивность режима коллапса (текущая гипотеза: 2.0)<br>
γ — синергия P×D в F_lin (текущая гипотеза: 0.5)<br>
5.2 Данные для калибровки<br>
Требования:<br>
Минимум 5–7 "эпизодов" (4–6 месячных точек данных каждый)<br>
Типы эпизодов:<br>
2 "нормальных" (разные годы/сезоны, без особых шоков)<br>
2–3 "кризисных" (шоки по D/T/V, известные события)<br>
1–2 "восстановления" (система восстанавливалась после кризиса)<br>
Исторические эпизоды РК (предложение):<br>
COVID-19 (Q1–Q2 2020) — шок T (падение доверия) и V (изоляция), R (медленнаяреакция)<br>
Январские события (Q1 2022) — шок D (массивная дезинформация), P (люди ищут информацию), R падает<br>
Энергокризис (Q3–Q4 2022) — шок T (отвлечение внимания), P растёт (иностранный контент о кризисе)<br>
Нормальные периоды (Q3 2021, Q3 2023) — базовые наблюдения<br>
5.3 Целевая функция (Loss)<br>
$$L = 0.35 \cdot FN + 0.25 \cdot FP + 0.20 \cdot \text{ExcessRate} + 0.20 \cdot \text{JumpPenalty}$$<br>
FN (False Negative Rate) — сколько дней кризиса пропустили?<br>
FN = (дни в crisis_period где Load < θ) / (всего дней в crisis_periods)<br>
Цель: FN < 15% (85% чувствительность)<br>
Пример: если 100 дней кризиса, пропустили 10 дней → FN = 0.10 = 10%<br>
FP (False Positive Rate) — ложные сигналы кризиса?<br>
FP = (дни вне crisis где Load > θ) / (всего дней без crisis)<br>
Цель: FP < 10% (90% специфичность)<br>
Пример: если 800 дней норма, ложно пометили 40 дней → FP = 0.05 = 5%<br>
ExcessRate — средний фоновый "шум" в режиме коллапса<br>
ExcessRate = mean(Excess_soft для дней вне кризиса)<br>
Цель: ExcessRate < 0.05 (минимум шума)<br>
Если слишком высокий ExcessRate → параметры не оптимальны<br>
JumpPenalty — слишком ли "скачет" индекс?<br>
JumpPenalty = mean(|dS_KPI/dt|) за 7-дневные окна<br>
Цель: JumpPenalty < 0.5 (≤0.5 баллов/день в среднем)<br>
Пример: если S_KPI = 50 → 48 → 52 → 55 в четыре дня подряд<br>
Скачки: |50-48|=2, |48-52|=4, |52-55|=3 → средний = 3 баллов/день<br>
Это слишком волатильно!<br>
5.4 Процедура оптимизации<br>
Метод: Grid search + local refinement (или байесовская оптимизация)<br>
1. Определить диапазоны:<br>
θ ∈ [0.70, 1.00] (в шагах 0.05)<br>
λ ∈ [1.0, 3.0] (в шагах 0.2)<br>
γ ∈ [0.0, 1.0] (в шагах 0.1)<br>
2. Для каждой комбинации (θ, λ, γ):<br>
a) Вычислить S_KPI для всех исторических дней<br>
b) Вычислить FN, FP, ExcessRate, JumpPenalty<br>
c) Вычислить Loss = 0.35·FN + 0.25·FP + 0.20·ER + 0.20·JP<br>
3. Выбрать комбинацию с minimum(Loss)<br>
4. Локальное уточнение вокруг минимума (шаг 0.01)<br>
5. Вычислить 10-fold cross-validation, чтобы убедиться, что параметры не переобучены<br>
5.5 Документирование калибровки<br>
Обязательные артефакты:<br>
Файл: calibration_results_v2.1c.xlsx<br>
Таблица 1: Grid search<br>
| θ | λ | γ | FN | FP | ER | JP | Loss |<br>
|------|-----|------|-------|-------|-------|-------|-------|<br>
| 0.70 | 1.0 | 0.0 | 0.22 | 0.08 | 0.12 | 0.6 | 0.268 |<br>
| 0.75 | 1.5 | 0.2 | 0.18 | 0.07 | 0.09 | 0.5 | 0.208 |<br>
| 0.85 | 2.0 | 0.5 | 0.12 | 0.06 | 0.04 | 0.4 | 0.147 | ← MINIMUM<br>
| 0.90 | 2.5 | 0.8 | 0.15 | 0.11 | 0.08 | 0.7 | 0.202 |<br>
| ... | ... | ... | ... | ... | ... | ... | ... |<br>
Выбор: θ = 0.85, λ = 2.0, γ = 0.5 (minimum Loss)<br>
Файл: cross_validation_v2.1c.txt<br>
10-fold Cross Validation Results:<br>
Fold 1: Loss = 0.148<br>
Fold 2: Loss = 0.146<br>
Fold 3: Loss = 0.151<br>
...<br>
Fold 10: Loss = 0.145<br>
Mean Loss: 0.1473 ± 0.0025 (std) ← очень низкая вариативность → параметры робастны!<br>
Протокол решения Комитета модели:<br>
Date: 2026-01-08<br>
Decision: Approve parameters θ=0.85, λ=2.0, γ=0.5<br>
Evidence: Grid search on 4 historical episodes + 10-fold CV<br>
Confidence: HIGH (consistent across folds, minimum loss achieved)<br>
Approved by: [подписи членов Комитета]<br>
6. СТРЕСС-ТЕСТЫ И ВАЛИДАЦИЯ<br>
6.1 Классы тестов<br>
Класс A: Однофакторные шоки<br>
Процедура: для каждого входа X ∈ {C, T, V, P, D, R}, вычислить S_KPI при X ± ΔX:<br>
Пример для T (доверие):<br>
Текущее T = 0.68<br>
T' = 0.68 - 0.15 = 0.53 (-22%)<br>
T' = 0.68 - 0.10 = 0.58 (-15%)<br>
T' = 0.68 - 0.05 = 0.63 (-7%)<br>
T' = 0.68 + 0.05 = 0.73 (+7%)<br>
T' = 0.68 + 0.10 = 0.78 (+15%)<br>
T' = 0.68 + 0.15 = 0.83 (+22%)<br>
Результаты:<br>
T=0.53: S_KPI = 38.2 (уязвимость)<br>
T=0.58: S_KPI = 44.6 (граница норма)<br>
T=0.63: S_KPI = 48.9 (норма слабо)<br>
T=0.73: S_KPI = 56.1 (норма сильно)<br>
T=0.78: S_KPI = 61.4 (хорошо)<br>
T=0.83: S_KPI = 67.8 (хорошо)<br>
Ожидания:<br>
✅ Монотонность: S_KPI ↑ при T ↑ (логично)<br>
✅ Выпуклость: Δ S_KPI за -0.15 немного больше, чем за +0.15 (убывающая предельная полезность)<br>
Класс B: Двухфакторные шоки<br>
Пример: D-шок + одновременное падение R (реакция отстаёт)<br>
Сценарий: Дезинформационная атака + система медленно реагирует<br>
Текущее: D = 0.35, R = 0.78 → S_KPI = 52.3<br>
Шок: D = 0.90, R = 0.60<br>
S_KPI = ?<br>
Результат: S_KPI = 32.1 (кризис!)<br>
Эффект синергии: D×R падение создаёт мультипликативный ущерб<br>
Класс C: Реалистичные кризисные профили<br>
Основано на исторических эпизодах:<br>
Профиль "COVID" (2020):<br>
- T ↓ (падение доверия к поначалу)<br>
- V ↑ (люди смотрят новости = видимость растёт)<br>
- D ↑ (информационный шум, паника)<br>
- R ↓ (медленно реагируем на панику)<br>
- C ↑ (контент-производство растёт для информирования)<br>
- P растёт (люди ищут информацию везде)<br>
Тест: S_KPI должна упасть (несмотря на V ↑), т.к. T ↓ + D ↑ > V ↑<br>
Результат: S_KPI = 45.2 (уязвимость) ✅<br>
Класс D: Worst-case сценарии<br>
Экстремальная атака + системный отказ:<br>
C = 0.20 (контент парализован)<br>
T = 0.15 (никто не верит)<br>
V = 0.40 (контент не видится)<br>
P = 0.90 (все смотрят иностранное)<br>
D = 0.95 (полная дезинформационная война)<br>
R = 0.10 (система не реагирует)<br>
Ожидание: S_KPI < 15 (критический кризис)<br>
Результат: S_KPI = 8.3 → 🔴 КРИТИЧЕСКИЙ РЕЖИМ ✅<br>
Класс E: Позитивные сценарии<br>
Укрепление потенциала + снижение атак:<br>
C = 0.90 (контент производство в норме)<br>
T = 0.85 (люди доверяют)<br>
V = 0.90 (контент видится везде)<br>
P = 0.20 (иностранное потребление минимально)<br>
D = 0.15 (атаки слабые)<br>
R = 0.95 (система реагирует молниеносно)<br>
Ожидание: S_KPI > 100 (отличная устойчивость)<br>
Результат: S_KPI = 128.4 → 🟣 ОТЛИЧНАЯ УСТОЙЧИВОСТЬ ✅<br>
7. ВЕРСИОНИРОВАНИЕ И ANTI-MANIPULATION<br>
7.1 Версионирование (v, mx.y)<br>
Два типа версий:<br>
Версия модели (v2.1c)<br>
Меняется, когда изменяются формулы, веса или параметры ядра:<br>
Изменение w_C, w_T, w_V<br>
Изменение α, β, γ<br>
Изменение формулы S_pot, F_lin, F_soft<br>
Изменение θ, λ (параметры калибровки) если в Комитете решили переделать<br>
Изменение якорей S_min, S_max<br>
Процедура:<br>
Новая версия требует решения Комитета модели<br>
Параллельный запуск (старая + новая версия)<br>
Переходный период (обе версии публикуются)<br>
Историческая переинтерпретация (пересчёт всех архивных данных)<br>
Мета-версии входов (mC.y, mT.y, и т.д.)<br>
Меняются, когда изменяются методики измерения входов:<br>
mC.1 → mC.2: новый источник данных Supply/Quality<br>
mT.1 → mT.2: новая панель опроса, новая формулировка вопроса<br>
mV.1 → mV.2: добавление нового LLM в панель V_gen<br>
mD.1 → mD.2: обновление детектора дезинформации<br>
Процедура:<br>
При смене методики: параллельный запуск (старая + новая)<br>
Вычисление "bridge factor" (как старая/новая соотносятся)<br>
Историческая переинтерпретация для сопоставимости<br>
В отчёте: "Data entered under mV.2 (from [date])"<br>
7.2 Роли и контроль<br>
Владелец модели (Policy Owner)<br>
Назначение: от МКИ<br>
Ответство: зачем нужна модель, как она используется<br>
Полномочия: предлагать калибровку, но не одобрять (требуется Комитет)<br>
Техвладелец (Implementation Owner)<br>
Назначение: из техподразделения<br>
Ответство: правильная реализация формул, воспроизводимость<br>
Полномочия: контроль качества кода, тестирование<br>
Комитет модели<br>
Состав: 5–7 человек (Policy owner, Tech owner, Data owner, 2–3 независимых эксперта)<br>
Функции: одобрение калибровки, решения о версионировании<br>
Голосование: простое большинство, но внешние эксперты имеют veto-право<br>
Независимый аудитор<br>
Назначение: на 3 года, независимо от Комитета<br>
Функции: случайная выборочная проверка 1–2 раз в квартал<br>
Полномочия: может потребовать пересчёт перед публикацией<br>
7.3 Запреты (anti-manipulation)<br>
🚫 ЗАПРЕЩЕНО:<br>
- Менять θ, λ, γ без решения Комитета<br>
- Менять методику входа без документирования мета-версии<br>
- Публиковать S_KPI без 95% CI и доверия (confidence)<br>
- Скрывать мета-версии или версионирование<br>
- Менять S_min, S_max для "улучшения" результатов<br>
✅ РАЗРЕШЕНО:<br>
- Исправлять ошибки в данных (если ошибка доказана)<br>
- Обновлять данные каждый месяц (нормальный цикл)<br>
- Публиковать Low confidence результаты (но с оговорками)<br>
- Рекомендовать переколибровку (если Loss растёт)<br>
8. ШАБЛОН УПРАВЛЕНЧЕСКОГО ОТЧЁТА<br>
Обязательная структура (8 страниц)<br>
Страница 1: СВОДКА<br>
S-G Index Monthly Report<br>
Month: January 2026 | Version: v2.1c (data: mC.1, mT.1, mV.1, mP.1, mD.1, mR.1)<br>
┌────────────────────────────────┐<br>
│ S_KPI = 52.3 │<br>
│ 95% CI: [48.1 — 56.8] │<br>
│ Confidence: HIGH │<br>
│ │<br>
│ Status: 🟢 Управляемая │<br>
│ устойчивость │<br>
└────────────────────────────────┘<br>
Zone Probabilities:<br>
🔴 Кризис: 2.1%<br>
🟡 Уязвимость: 12.4%<br>
🟢 Норма: 58.3% ← медиана здесь<br>
🔵 Хорошо: 22.8%<br>
🟣 Отличное: 4.4%<br>
Тренд: +1.2 балла от предыдущего месяца (медленный рост)<br>
Рекомендация: Продолжить мониторинг, особое внимание на D (атаки растут)<br>
Страница 2: ДРАЙВЕРЫ И ЧУВСТВИТЕЛЬНОСТЬ<br>
Входные значения:<br>
C = 0.72 (производство контента: ХОРОШО)<br>
T = 0.68 (доверие: СРЕДНЕЕ)<br>
V = 0.65 (видимость: СРЕДНЕЕ)<br>
P = 0.42 (иностранное потребление: УМЕРЕННОЕ)<br>
D = 0.35 (атаки: СЛАБЫЕ)<br>
R = 0.78 (устойчивость: ХОРОШАЯ)<br>
Компоненты формулы:<br>
S_pot = 0.663 (потенциал 66%)<br>
F_lin = 0.814 (демпфер теряет 19%)<br>
F_soft = 0.669 (мягкий порог теряет 33%)<br>
S_raw = 0.362<br>
Tornado (чувствительность):<br>
D (атаки): 95% влияния ← ГЛАВНЫЙ РЫЧАГ<br>
P (давление): 82% влияния<br>
R (реакция): 76% влияния<br>
T (доверие): 68% влияния<br>
V (видимость): 54% влияния<br>
C (контент): 38% влияния<br>
Вывод: система НАИБОЛЕЕ чувствительна к D и P. Укрепление R — самый эффективный рычаг.<br>
Рекомендация для следующей зоны (60+):<br>
- Увеличить V (видимость) на 8–10%<br>
- ИЛИ снизить P (давление) на 5–7%<br>
- ИЛИ снизить D (атаки) на 8–10%<br>
Страница 3: НАГРУЗКА И ПОРОГ<br>
Load = (P + 1.5×D) / (1 + R)<br>
= (0.42 + 1.5×0.35) / (1 + 0.78)<br>
= 0.945 / 1.78<br>
= 0.531<br>
Сравнение с порогом θ = 0.85:<br>
Load (0.531) < θ (0.85) ✅<br>
Система НИЖЕ критического порога<br>
Excess_soft = 0.201 (небольшой избыток)<br>
F_soft = 0.669 (демпфер на 67%)<br>
При шоке (+50% к D):<br>
Load = (0.42 + 1.5×0.525) / 1.78 = 0.730 (ещё ниже порога)<br>
При экстремальном шоке (D=0.90, P=0.60, R=0.65):<br>
Load = (0.60 + 1.35) / 1.65 = 1.18 (ВЫШЕ порога! Режим коллапса)<br>
F_soft = 0.332 (только 33%)<br>
Страница 4: КАЧЕСТВО ДАННЫХ И МЕТОДОЛОГИЯ<br>
Data Quality Flags:<br>
✅ HIGH:<br>
- C (Supply): МКИ статистика, объём 5000+ ед/месяц, непрерывные логи<br>
- R (Resilience): Полные логи реагирования, МКИ + медиа-мониторинг<br>
⚠️ MEDIUM:<br>
- T (Trust): Опрос N=1200, МОЕ = ±3.4%, но вопрос менялся (mT.1→mT.1 same)<br>
- D (Disinformation): Детектор v2.3, ручная верификация 50/500 примеров (92% согласие)<br>
❌ LOW:<br>
- V_gen (Visibility in generative search): Только 100 запросов LLM, новый Claude добавлен<br>
Meta-versions:<br>
mC.1 (Supply/Quality методика от Q1 2024)<br>
mT.1 (Опрос от August 2023)<br>
mV.1 (Видимость: TikTok+IG+FB+VK+Telegram)<br>
mD.1 (Детектор дезинформации v2.3)<br>
mR.1 (Логи реагирования)<br>
Методические изменения в январе:<br>
- [25 Jan] Добавлен Claude в панель V_gen (mV.1→mV.2 подготавливается, будет в Feb)<br>
Рекомендация:<br>
При mV.2 в феврале возможен скачок V_gen на ±5%, интерпретировать с осторожностью<br>
Страница 5: СЦЕНАРИИ И "СКОЛЬКО НУЖНО ИЗМЕНИТЬ"<br>
Сценарий 1: Неожиданный шок как Jan-2022 (D↑ в 2.6x)<br>
Если D = 0.35 → 0.92:<br>
- S_KPI упадет с 52.3 → 28.4 (кризис)<br>
- Нужна срочная реакция (R↑) и контрмеры (D↓)<br>
Сценарий 2: Долгосрочный тренд (годовой план)<br>
Если достичь S_KPI = 75+ (зона 🔵):<br>
- T должна ↑ до 0.78 (требует 15 месяцев работы по доверию)<br>
- V должна ↑ до 0.80 (требует новые партнёрства)<br>
- P должна ↓ до 0.30 (требует популяризация местного контента)<br>
Сценарий 3: Защита при новой атаке<br>
Если готовиться к D = 0.75 (вероятная атака):<br>
- Текущее R = 0.78 недостаточно<br>
- Нужна R ↑ до 0.90 (ускорение реакции)<br>
- Нужна T ↑ до 0.75+ (укрепление доверия как буфер)<br>
- Результат: S_KPI даже при D=0.75 будет 45+ (уязвимость, но не кризис)<br>
Страница 6: АНОМАЛИИ И ФЛАГИ<br>
Contradiction Flags:<br>
⚠️ Flag 1: P-растёт, но T-стабильна<br>
P = 0.42 (выросла на 3 п.п. за месяц)<br>
T = 0.68 (не упала, стабильна)<br>
Интерпретация: Люди потребляют больше иностранного контента, но доверие не падает<br>
→ Может быть, люди активнее смотрят новости (информационный спрос), а не недоверие<br>
→ Или V выросла (контент стал более видимым, но потребителям хочется большего выбора)<br>
Действие: Дополнительная диагностика в феврале<br>
⚠️ Flag 2: D стабильна, но V_gen падает<br>
D = 0.35 (стабильна)<br>
V_gen = 0.62 (упала на 5 п.п.)<br>
Интерпретация: Дезинформация не растёт, но национальный контент менее видим в LLM<br>
→ Может быть, новый LLM (Claude) менее знаком с национальными источниками<br>
→ Или мета-версия V_gen меняется (будущее mV.2)<br>
Действие: Это будет прояснено при добавлении Claude (mV.2)<br>
Страница 7: РЕГЛАМЕНТНЫЕ ОТМЕТКИ<br>
Версионирование:<br>
Model version: v2.1c (неизменна, параметры стабильны)<br>
Data versions:<br>
- mC.1 (since Q1 2024): Supply/Quality методика<br>
- mT.1 (since Aug 2023): Опрос Trust<br>
- mV.1 (since Oct 2023): Видимость в 5 платформах<br>
→ mV.2 (подготавливается с Feb 2026): добавлен Claude<br>
- mD.1 (since Nov 2025): Детектор дезинформации v2.3<br>
- mR.1 (since Q4 2023): Логи реагирования<br>
Комитет модели решение (от 2025-12-15):<br>
✅ Утверждены параметры v2.1c (θ=0.85, λ=2.0, γ=0.5)<br>
✅ Loss function сходится хорошо на историческом данные<br>
✅ 10-fold CV показывает стабильность<br>
Независимый аудит (last: 2026-01-05):<br>
✅ Spot check на 20 случайных дней за Dec: Precision=0.91, Recall=0.88 (норма)<br>
✅ Нет обнаружено манипуляций или ошибок<br>
Следующий плановый аудит: Feb 2026 (2 месяца)<br>
Страница 8: РЕКОМЕНДАЦИИ И ДЕЙСТВИЯ<br>
Рекомендации для ЛПР (по приоритетам):<br>
СРОЧНО (этот месяц):<br>
1. Мониторить D (атаки). Если D выше 0.50 → активировать контрмеры.<br>
2. Проверить V_gen методику (будущая mV.2) — готовиться к возможному скачку.<br>
В КВАРТАЛЕ:<br>
3. Увеличить V (видимость) через партнёрства с платформами (target: V → 0.75)<br>
4. Укрепить T (доверие) через открытую коммуникацию и фактчеки (target: T → 0.75)<br>
5. Снизить P (иностранное потребление) через популяризацию местного контента (target: P → 0.35)<br>
В ГОДУ:<br>
6. Достичь S_KPI = 70+ (зона 🔵) через комплексное укрепление системы<br>
Финансирование:<br>
- Для V↑: ~50M KZT (контент-производство, платформенные партнёрства)<br>
- Для T↑: ~30M KZT (программы медиаграмотности, открытость)<br>
- Для P↓: ~40M KZT (поддержка национальных медиа)<br>
- Для R↑: ~60M KZT (инфраструктура быстрого отклика)<br>
Total: ~180M KZT на год для перехода в зону 🔵<br>
Expected ROI: Информационная безопасность + устойчивость к атакам + доверие<br>
9. ПРИЛОЖЕНИЯ<br>
A. Таблица параметров (финальная)<br>
B. Псевдокод алгоритма<br>
FUNCTION calculateIndex(C, T, V, P, D, τ, CR, AR, ML, params):<br>
// Шаг 1: Clamping<br>
C ← max(C, ε)<br>
T ← max(T, ε)<br>
V ← max(V, ε)<br>
// Шаг 2: Потенциал<br>
S_pot ← C^(w_C) × T^(w_T) × V^(w_V)<br>
// Шаг 3: Демпфер<br>
F_lin ← 1 / (1 + α×P + β×D + γ×P×D)<br>
// Шаг 4: Устойчивость<br>
R_response ← 1 / (1 + (τ/τ₀)²)<br>
R_coverage ← clip[0,1](CR / (AR + ε))<br>
R_capability ← sqrt(ML)<br>
R ← R_response^a × R_coverage^b × R_capability^c<br>
// Шаг 5: Нагрузка<br>
Load ← (P + 1.5×D) / (1 + R)<br>
// Шаг 6: Мягкий порог<br>
excess ← ln(1 + exp(k × (Load - θ))) / k<br>
F_soft ← exp(-λ × excess)<br>
// Шаг 7: S_raw<br>
S_raw ← S_pot × F_lin × F_soft<br>
// Шаг 8: KPI-маппинг<br>
δ_ad ← 0.01 × median(S_raw last 12 months)<br>
log_norm ← (log₁₀(S_raw + δ_ad) - log₁₀(S_min)) / (log₁₀(S_max) - log₁₀(S_min))<br>
S_KPI ← 100 × clip[0,1.5](log_norm)<br>
// Шаг 9: Зона<br>
IF S_KPI < 25: zone ← "🔴 Кризис"<br>
ELSE IF S_KPI < 40: zone ← "🟡 Уязвимость"<br>
ELSE IF S_KPI < 60: zone ← "🟢 Управляемо"<br>
ELSE IF S_KPI < 100: zone ← "🔵 Хорошо"<br>
ELSE: zone ← "🟣 Отлично"<br>
RETURN {S_KPI, zone, S_pot, F_lin, F_soft, Load, R}<br>
END FUNCTION<br>
FUNCTION monteCarlo(inputs, uncertainties, N=1000):<br>
samples ← []<br>
FOR i = 1 TO N:<br>
// Семплировать с шумом<br>
C_i ← sample(Normal(C, σ_C))<br>
T_i ← sample(Normal(T, σ_T))<br>
... (аналогично для V, P, D, τ, etc.)<br>
// Вычислить индекс<br>
result_i ← calculateIndex(C_i, T_i, V_i, P_i, D_i, τ_i, ...)<br>
S_KPI_i ← result_i.S_KPI<br>
samples.append(S_KPI_i)<br>
END FOR<br>
// Статистики<br>
sort(samples)<br>
median ← samples[N/2]<br>
CI_low ← samples[round(N×0.025)]<br>
CI_high ← samples[round(N×0.975)]<br>
confidence ← 'High' if (CI_high - CI_low ≤ 8) else 'Medium'/'Low'<br>
RETURN {median, CI_low, CI_high, confidence, samples}<br>
END FUNCTION<br>
<br>
Аспект | Преимущество<br>
Разделение забот | Физика (модель) отделена от политики (интерпретация)<br>
Воспроизводимость | S_raw технический, не зависит от определения зон<br>
Масштабируемость | Если добавить новый "рычаг" (например, кибератаки), просто добавить множитель в S_raw<br>
Управляемость | S_KPI [0, 150] удобнее для руководства, чем S_raw ∈ [0, 1.5]<br>
Якоря | S_min, S_max (якоря логарифма) фиксируются на версию, что гарантирует сопоставимость во времени<br>
Параметр | Обозначение | Что означает<br>
C входит | mC.1 | Первая версия методики C (Supply + Quality)<br>
T входит | mT.1 | Первая версия опроса T<br>
V входит | mV.1 | Первая версия V (V_soc, V_gen, V_search)<br>
P входит | mP.1 | Первая версия панели P<br>
D входит | mD.1 | Первая версия детектора D<br>
R входит | mR.1 | Первая версия расчёта R<br>
Диапазон | Зона | Интерпретация | Действие<br>
0–25 | 🔴 Кризис | Неустойчивость, срочное вмешательство | Экстренные меры<br>
25–40 | 🟡 Уязвимость | Низкая устойчивость, требуется внимание | Усиление реакции<br>
40–60 | 🟢 Управляемо | Норма, система справляется | Плановый мониторинг<br>
60–100 | 🔵 Высоко | Хорошее состояние, запас прочности | Поддержание<br>
100–150 | 🟣 Отлично | Высокая защита, стратегический буфер | Оптимизация<br>
Параметр | Значение | Статус | Комментарий<br>
w_C | 0.25 | Фиксирован в v2.1c | Вес C в S_pot<br>
w_T | 0.40 | Фиксирован в v2.1c | Вес T (важнейший)<br>
w_V | 0.35 | Фиксирован в v2.1c | Вес V<br>
α | 1.0 | Фиксирован в v2.1c | Интенсивность P в F_lin<br>
β | 1.2 | Фиксирован в v2.1c | Интенсивность D (> α)<br>
γ | 0.5 | Фиксирован, калибруется в v2.2+ | Синергия P×D<br>
k | 2.0 | Фиксирован в v2.1c | Мягкость softplus<br>
θ | 0.85 | Калибруется | Критический порог Load<br>
λ | 2.0 | Калибруется | Интенсивность коллапса<br>
ε | 0.01 | Фиксирован | Clamping нижний порог<br>
τ₀ | 1.0 день | Фиксирован | Целевое время реакции<br>
a, b, c | 0.40, 0.35, 0.25 | Фиксирован | Веса R субиндексов<br>
S_min | 0.05 | Фиксирован на версию | Якорь логарифма (min)<br>
S_max | 1.5 | Фиксирован на версию | Якорь логарифма (max)<br>
N (Monte Carlo) | 1000–5000 | Оперативно | Кол-во прогонов UQ