paste.txt
Сущности
# Приложение A. Методологические уточнения v36<br>
<br>
> Дополнение к Разделу 0. Не меняет базовые определения, а уточняет процедуру отбора кейсов, формирование тематических кластеров и использование агрегаторов.<br>
<br>
---<br>
<br>
## A.1. Отбор кейсов и тематическая классификация<br>
<br>
### A.1.1. Отбор из GDELT/MediaCloud<br>
<br>
Эмпирический массив формируется в два шага:[file:229]<br>
<br>
1. **Машинный сбор**<br>
- GDELT GKG и MediaCloud используются для поиска всех материалов, где в заголовке или тексте встречаются ключевые слова: <br>
- «Kazakhstan», «Kazakh», «Toqaev/ Tokayev», «Astana», «Caspian Pipeline», «CPC», «Tengiz», «Kashagan», «uranium»;<br>
- «Казахстан», «Токаев», «КТК», «Тенгиз», «Кашаган», «референдум» (в русскоязычном массиве);<br>
- эквиваленты на других языках (нем., фр., тур., араб., кит. и др.).<br>
- На этом этапе получается массив ~2 200 материалов, включающий перепечатки, агрегаторы, короткие заметки.<br>
<br>
2. **Ручное курирование**<br>
- два аналитика независимыми маршрутами отбирают материалы, удовлетворяющие критериям Раздела 0 (Tier, оригинальность, наличие URL, релевантность Казахстану, а не региону в целом);<br>
- расхождения обсуждаются и снимаются до получения согласованного списка (~190 материалов).[file:229]<br>
<br>
### A.1.2. Тематическая классификация<br>
<br>
Каждый материал может относиться **к нескольким кластерам одновременно** (multi‑label):[file:229]<br>
<br>
- Конституция / succession / язык<br>
- Энергетика / КТК / Иран<br>
- Права человека / медиасвобода<br>
- Экономика / инвестиции / критические минералы<br>
- Геополитика / АЭС / безопасность<br>
- Платформы / соцсети<br>
<br>
Процедура:<br>
<br>
1. Аналитик присваивает каждому материалу одну **primary theme** (главная тема) и до двух **secondary themes**.<br>
2. Если материал покрывает несколько тем равнозначно (например, Energy + Human Rights), он кодируется как «shared case» и отдельно отмечается в таблицах кластеров.<br>
3. При расчёте TI/WTI по кластеру используются **все материалы**, где эта тема присутствует хотя бы как вторичная — с тем же Tier‑весом.[file:229]<br>
<br>
---<br>
<br>
## A.2. Матрица «вектор × тема × Tier»<br>
<br>
Для наглядности вводится упрощённая матрица наличия Tier‑1 источников по комбинациям «вектор × тематический кластер» ("+" означает наличие заметного объёма Tier‑1, "±" — единичные кейсы, «–» — отсутствуют или незначимы):[file:233][file:127]<br>
<br>
| Вектор / Кластер | Конституция | Права человека | Энергетика | Экономика/инвестиции | Геополитика/минералы/АЭС | Платформы/соцсети |<br>
|------------------|-------------|----------------|-----------|----------------------|--------------------------|-------------------|<br>
| I. Западный | + | + | + | + | + | ± |<br>
| II. Китайский | ± | – | ± | + | + | ± |<br>
| III. Российский | ± | ± | ± | ± | + | + |<br>
| IV. Тюркский | ± | – | ± | ± | ± | – |<br>
| V. Арабский/исламский | – | – | ± | + | ± | – |<br>
| VI. Центральноазиатский | ± | ± | ± | ± | ± | – |<br>
| VII. Азиатский (JP/KR/IN) | – | – | ± | + | + | – |<br>
<br>
Интерпретация:<br>
<br>
- **Западный вектор** имеет плотное Tier‑1 покрытие по всем ключевым кластерам, кроме платформ (там скорее отраслевые и региональные источники).[file:127]<br>
- **Российский вектор** силён в геополитике и платформах (русскоязычный слой), но слабее по формальным правозащитным и экономическим Tier‑1.[file:1]<br>
- **Китайский, тюркский, арабский и азиатский векторы** обычно присутствуют через Tier‑2/3 и официальные заявления; их влияние опосредовано.<br>
<br>
Полная матрица (с числовыми значениями по каждому сочетанию) приводится во внутреннем excel‑файле и может использоваться Компьютером для более детального анализа.[file:233]<br>
<br>
---<br>
<br>
## A.3. Использование GDELT/MediaCloud и фильтрация шума<br>
<br>
GDELT и MediaCloud используются **не как готовый ответ**, а как «черновой слой» для дальнейшего отбора:[file:229]<br>
<br>
- из массива отсекаются:<br>
- короткие заметки без добавленной стоимости (фото‑ленты, финансовые тикеры);<br>
- перепечатки пресс‑релизов без собственной формулировки;<br>
- агрегаторы и зеркала.<br>
- особое внимание уделяется материалам, которые:<br>
- формируют **оригинальные фреймы** (новые метафоры, сравнения, концепции);<br>
- содержат **эксклюзивные данные** (утечки, арбитражные суммы, проценты, цитаты высокопоставленных лиц);<br>
- являются **реперными** (HRW, Amnesty, ODIHR, Chatham, Jamestown, FAZ, National Interest и др.).[file:127]<br>
<br>
Для прозрачности: в каталоге (Раздел 9) GDELT/MediaCloud помечены как источники **первичного поиска**, а не как источники контента.[file:1]<br>
<br>
---<br>
<br>
## A.4. Telegram‑каналы и платформы: атрибуция и ограничения<br>
<br>
### A.4.1. Типология Telegram‑каналов<br>
<br>
В отчёте используется следующая рабочая типология Telegram‑каналов:[file:1]<br>
<br>
1. **Официальные и полуофициальные** — аккаунты госорганов, госСМИ, аффилированных структур.<br>
2. **Профессиональные медиа** — каналы редакций независимых и коммерческих СМИ.<br>
3. **Анонимные политические** — каналы без явной привязки, публикующие инсайды и политкомментарии.<br>
4. **Сетевые/роевые** — каналы, синхронно продвигающие схожие нарративы (прокремлёвские, прозападные, внутренняя номенклатурная борьба).<br>
5. **Перепаковщики западного и местного контента** — каналы, которые агрегируют и переводят материалы Reuters, HRW, RFE/RL и др.<br>
<br>
Атрибуция вектора для пунктов 3–4 **неоднозначна** без отдельного цифрового расследования. В рамках v36 Telegram‑каналы учитываются **как часть платформенного слоя**, а не как полностью атрибутированные источники.[file:229]<br>
<br>
### A.4.2. Платформенные метрики<br>
<br>
Методологически важно различать:<br>
<br>
- **пользовательский охват платформы** (число пользователей 18+ по DataReportal/Statista);<br>
- **реальный охват политического контента** (который значительно ниже и вариативен по темам).<br>
<br>
В отчёте используются только агрегированные оценки по пользователям и доле новостного потребления (например, 66,8% получают новости прежде всего из соцсетей), без попытки количественно оценить охват конкретных нарративов TikTok‑роликов или Telegram‑постов.[web:170][web:196]<br>
<br>
---<br>
<br>
## A.5. Интерпретация TI/WTI и сценариев<br>
<br>
### A.5.1. TI/WTI — не рейтинг «хорошо/плохо»<br>
<br>
Тональные индексы **не являются оценкой «хорошести» или «плохости» политики Казахстана**, а отражают **структуру международного медиаполя**.[file:229]<br>
<br>
- TI/WTI показывают, как **внешние источники** описывают Казахстан, а не насколько эти описания справедливы.<br>
- Негативный TI/WTI может быть обусловлен как реальными проблемами, так и смещениями внимания, конфликтами интересов, пропагандой.<br>
<br>
### A.5.2. Сценарии — карта, а не предсказание<br>
<br>
Сценарии Раздела 8 — это **карта возможных траекторий**, а не прогноз с вероятностной точностью.[file:127]<br>
<br>
- каждый сценарий описывает, какие сочетания событий могут привести к тому или иному изменению TI/WTI;<br>
- реальная траектория может представлять собой комбинацию элементов разных сценариев.<br>
<br>
В этом смысле методология v36 предназначена не для «предсказаний будущего», а для **раннего обнаружения тенденций** и оценки того, какие решения и события наиболее сильно влияют на международный образ Казахстана.<br>