paste.txt
Сущности
# Раздел 10. Методологические ограничения и план расширения охвата (v37+)<br>
<br>
---<br>
<br>
## 10.1. Текущее состояние языкового покрытия<br>
<br>
### Заявленный профиль (v35/v36)<br>
2 200 публикаций · 680 доменов · **27 языков**<br>
<br>
### Реальный профиль с данными<br>
<br>
| Язык | Код | Публикаций | % массива | Регион |<br>
|------|-----|-----------|-----------|--------|<br>
| Русский | RU | 725 | 40% | Россия, СНГ, Казахстан |<br>
| Английский | EN | 283 | 16% | США, Великобритания, Индия |<br>
| Немецкий | DE | 192 | 11% | Германия, Австрия, Швейцария |<br>
| Испанский | ES | 181 | 10% | Испания, Латинская Америка |<br>
| Турецкий | TR | 100 | 6% | Турция |<br>
| Китайский | ZH | 100 | 6% | Китай |<br>
| Итальянский | IT | 84 | 5% | Италия |<br>
| Французский | FR | 52 | 3% | Франция, Африка |<br>
| Португальский | PT | 51 | 3% | Португалия, Бразилия |<br>
| Нидерландский | NL | 14 | 1% | Нидерланды, Бельгия |<br>
| Корейский | KO | 12 | 1% | Южная Корея |<br>
| Арабский | AR | **5** | **0,3%** | Арабский мир |<br>
| **Остальные 15** | — | ~0–3 | ~0% | Не детализированы |<br>
<br>
**Итог:** реально измеренных языков с достаточной выборкой — **12 из 27**. <br>
Остальные 15 присутствуют как «артефакты GDELT» (1–3 документа), без аналитической ценности.<br>
<br>
---<br>
<br>
## 10.2. Критические лакуны<br>
<br>
### 🔴 Приоритет 1 — КРИТИЧНО (немедленное устранение)<br>
<br>
#### Арабский (AR)<br>
- **Факт:** 5 публикаций из 1 811 = 0,27%<br>
- **Противоречие:** Казахстан получает $7 млрд арабских инвестиций (ОАЭ, Саудовская Аравия, Катар, Кувейт); IV вектор («арабский») оценивается TI = +0,45 фактически без арабоязычных источников<br>
- **Что не мониторится:** Al Arabiya (alarabiya.net), Asharq Al-Awsat (aawsat.com), Gulf News (gulfnews.com), Khaleej Times (khaleejtimes.com), Sky News Arabia (skynewsarabia.com), Al Jazeera Arabic (aljazeera.net), Arab News (arabnews.com), Zawya (zawya.com)<br>
- **Оценка потенциала:** 80–120 дополнительных публикаций в квартал<br>
<br>
#### Казахский (KZ)<br>
- **Факт:** 0 публикаций<br>
- **Противоречие:** Отчёт о Казахстане не содержит ни одного материала на государственном языке страны. Казахскоязычный нарратив — самостоятельный контур, не совпадающий с русскоязычным (другие фреймы референдума, другие акценты языковой политики)<br>
- **Что не мониторится:** egemen.kz, zhasalash.kz, аbaі.kz, nur.kz/kazakh, qazaquni.kz, aikyn.kz<br>
- **Методологическое значение:** единственный способ отделить «казахский взгляд изнутри» от российского русскоязычного контура<br>
<br>
#### Персидский/Фарси (FA)<br>
- **Факт:** 0 публикаций<br>
- **Противоречие:** Иран — ключевой актор маршрута INSTC (Север–Юг), конкурент КТК; иранские СМИ формируют нарратив для аудитории 70+ млн; тема транзита и санкций обходных схем не покрыта<br>
- **Что не мониторится:** IRNA (irna.ir), Mehr News (mehr.news), Tasnim (tasnimnews.com), ISNA (isna.ir), Tabnak (tabnak.ir)<br>
- **Оценка потенциала:** 30–50 публикаций в квартал<br>
<br>
#### Хинди (HI)<br>
- **Факт:** 0 публикаций<br>
- **Противоречие:** Индия — крупнейший покупатель казахстанского урана (Казатомпром → NPCIL), растущий импортёр нефти; индийский нарратив по минеральным ресурсам и БРИКС полностью в слепой зоне<br>
- **Что не мониторится:** The Hindu (thehindu.com/hindi), NDTV (ndtv.com), Hindustan Times, Dainik Bhaskar, Aaj Tak<br>
- **Оценка потенциала:** 40–60 публикаций в квартал<br>
<br>
---<br>
<br>
### 🟠 Приоритет 2 — ВЫСОКАЯ (к v37, Q2 2026)<br>
<br>
| Язык | Код | Стратегическое обоснование | Ключевые домены | Оценка публ./квартал |<br>
|------|-----|---------------------------|-----------------|----------------------|<br>
| Узбекский | UZ | Прямой конкурент КЗ в ЦА, БРИКС, рейтинги | kun.uz, gazeta.uz, podrobno.uz, daryo.uz | 25–40 |<br>
| Японский | JA | Инвестиции Mitsubishi/JBIC, уран для АЭС | nikkei.com, mainichi.jp, nhk.or.jp | 20–35 |<br>
| Польский | PL | Форпост западной критики, ОБСЕ/ODIHR источники | polityka.pl, wyborcza.pl, rp.pl | 15–25 |<br>
| Азербайджанский | AZ | Транскаспийский маршрут, конкуренция | azertag.az, 1news.az, haqqin.az | 15–20 |<br>
| Украинский | UK | Контекст российского вектора, диаспора | pravda.com.ua, ukrinform.ua, lb.ua | 10–20 |<br>
<br>
---<br>
<br>
### 🟡 Приоритет 3 — СРЕДНЯЯ (к v38, Q3 2026)<br>
<br>
| Язык | Код | Обоснование | Ключевые домены |<br>
|------|-----|-------------|-----------------|<br>
| Малайский/Индонезийский | MS/ID | АСЕАН, ОИС, халяльные инвестиции | bernama.com, thestar.com.my, kompas.com |<br>
| Иврит | HE | BESA Center (EN охвачен), израильские инвестиции | haaretz.co.il, jpost.com |<br>
| Румынский | RO | Восточная Европа ЕС, НАТО-контекст | digi24.ro, g4media.ro |<br>
| Кыргызский | KY | Ближайший сосед, зеркало ЦА-нарратива | akipress.com, kabar.kg |<br>
| Таджикский | TG | ОДКБ, афганский контекст | khovar.tj, avesta.tj |<br>
<br>
---<br>
<br>
## 10.3. Доменные лакуны (вне языкового вопроса)<br>
<br>
Помимо языков, в текущих 680 доменах отсутствуют или слабо представлены:<br>
<br>
### Финансовые/инвестиционные медиа<br>
- **Bloomberg Arabic** (bloomberg.com/arabic) — отдельная редакция для арабских инвесторов<br>
- **Nikkei Asia** (asia.nikkei.com) — ключевой источник по японским и азиатским инвестициям<br>
- **S&P Global Commodity Insights** (spglobal.com) — отраслевые данные<br>
- **Argus Media** (argusmedia.com) — нефтяные котировки/КТК<br>
<br>
### Региональные агентства<br>
- **AKIpress** (akipress.com) — ведущее ЦА-агентство (KG-база, но широкий охват)<br>
- **CA-News** (ca-news.org) — мультиязычная ЦА<br>
- **New Lines Magazine** (newlinesmag.com) — аналитика по ЦА (добавлен частично)<br>
- **Caravanserai** (caravanserai.media) — немецкоязычный ЦА-фокус<br>
<br>
### Telegram-каналы как источники (не платформа, а первоисточник)<br>
- Ряд материалов первично публикуется в Telegram и только затем попадает в медиа — GDELT их не индексирует<br>
- Каналы: Baza, Shot, DOXA, Insider Kazakhstan — формируют нарратив до традиционных СМИ<br>
<br>
---<br>
<br>
## 10.4. Plan языкового расширения v37<br>
<br>
### Этап 1: немедленно (апрель 2026, до публикации v37)<br>
<br>
| Действие | Инструмент | Трудозатраты |<br>
|----------|-----------|-------------|<br>
| Добавить 8 арабских доменов в GDELT-запрос | GDELT API фильтр по домену | 2 часа |<br>
| Добавить 6 казахских доменов | GDELT + ручной мониторинг | 3 часа |<br>
| Добавить 5 персидских доменов | GDELT (FA поддерживается) | 2 часа |<br>
| Обновить формулу CMV с учётом новых языков | Пересчёт | 1 час |<br>
<br>
### Этап 2: к v37 (июнь 2026)<br>
<br>
| Действие | Результат |<br>
|----------|-----------|<br>
| Добавить хинди (HI) через Google News API | +40–60 публ./кв. |<br>
| Добавить узбекский (UZ) | +25–40 публ./кв. |<br>
| Добавить японский (JA) через Nikkei RSS | +20–35 публ./кв. |<br>
| Нанять/привлечь аналитика AR+FA | Качественная оценка, не только GDELT |<br>
<br>
### Этап 3: к v38 (сентябрь 2026)<br>
<br>
- Полная ревизия 27-языкового профиля с реальными данными по каждому<br>
- Введение порогового критерия: язык считается «охваченным» при ≥20 публикаций в квартал<br>
- Пересмотр итоговых цифр: реальное число языков с достаточной выборкой (ожидаемо: 18–22)<br>
<br>
---<br>
<br>
## 10.5. Влияние лакун на текущие выводы<br>
<br>
| Вывод в v36 | Риск искажения из-за лакун |<br>
|-------------|---------------------------|<br>
| Арабский вектор TI = +0,45 | **ВЫСОКИЙ** — оценка основана почти исключительно на EN-версиях арабских СМИ |<br>
| «Казахстан = медиалидер ЦА» | **СРЕДНИЙ** — казахский и узбекский контуры не измерены |<br>
| Иранский транзитный нарратив | **ВЫСОКИЙ** — персидскоязычные СМИ полностью в слепой зоне |<br>
| Индийский «минеральный» нарратив | **СРЕДНИЙ** — хинди отсутствует, EN-версии индийских СМИ покрыты частично |<br>
| Общий TI = −0,38 | **НИЗКИЙ** — доминирующие языки (RU, EN, DE) охвачены достаточно |<br>
<br>
---<br>
<br>
*Раздел подготовлен: 17 марта 2026 | v36 → v37 roadmap*<br>