paste.txt

ChatGPT neutral 4 чанков ~6 мин чтения
# Раздел 10. Методологические ограничения и план расширения охвата (v37+)<br> <br> ---<br> <br> ## 10.1. Текущее состояние языкового покрытия<br> <br> ### Заявленный профиль (v35/v36)<br> 2 200 публикаций · 680 доменов · **27 языков**<br> <br> ### Реальный профиль с данными<br> <br> | Язык | Код | Публикаций | % массива | Регион |<br> |------|-----|-----------|-----------|--------|<br> | Русский | RU | 725 | 40% | Россия, СНГ, Казахстан |<br> | Английский | EN | 283 | 16% | США, Великобритания, Индия |<br> | Немецкий | DE | 192 | 11% | Германия, Австрия, Швейцария |<br> | Испанский | ES | 181 | 10% | Испания, Латинская Америка |<br> | Турецкий | TR | 100 | 6% | Турция |<br> | Китайский | ZH | 100 | 6% | Китай |<br> | Итальянский | IT | 84 | 5% | Италия |<br> | Французский | FR | 52 | 3% | Франция, Африка |<br> | Португальский | PT | 51 | 3% | Португалия, Бразилия |<br> | Нидерландский | NL | 14 | 1% | Нидерланды, Бельгия |<br> | Корейский | KO | 12 | 1% | Южная Корея |<br> | Арабский | AR | **5** | **0,3%** | Арабский мир |<br> | **Остальные 15** | — | ~0–3 | ~0% | Не детализированы |<br> <br> **Итог:** реально измеренных языков с достаточной выборкой — **12 из 27**. <br> Остальные 15 присутствуют как «артефакты GDELT» (1–3 документа), без аналитической ценности.<br> <br> ---<br> <br> ## 10.2. Критические лакуны<br> <br> ### 🔴 Приоритет 1 — КРИТИЧНО (немедленное устранение)<br> <br> #### Арабский (AR)<br> - **Факт:** 5 публикаций из 1 811 = 0,27%<br> - **Противоречие:** Казахстан получает $7 млрд арабских инвестиций (ОАЭ, Саудовская Аравия, Катар, Кувейт); IV вектор («арабский») оценивается TI = +0,45 фактически без арабоязычных источников<br> - **Что не мониторится:** Al Arabiya (alarabiya.net), Asharq Al-Awsat (aawsat.com), Gulf News (gulfnews.com), Khaleej Times (khaleejtimes.com), Sky News Arabia (skynewsarabia.com), Al Jazeera Arabic (aljazeera.net), Arab News (arabnews.com), Zawya (zawya.com)<br> - **Оценка потенциала:** 80–120 дополнительных публикаций в квартал<br> <br> #### Казахский (KZ)<br> - **Факт:** 0 публикаций<br> - **Противоречие:** Отчёт о Казахстане не содержит ни одного материала на государственном языке страны. Казахскоязычный нарратив — самостоятельный контур, не совпадающий с русскоязычным (другие фреймы референдума, другие акценты языковой политики)<br> - **Что не мониторится:** egemen.kz, zhasalash.kz, аbaі.kz, nur.kz/kazakh, qazaquni.kz, aikyn.kz<br> - **Методологическое значение:** единственный способ отделить «казахский взгляд изнутри» от российского русскоязычного контура<br> <br> #### Персидский/Фарси (FA)<br> - **Факт:** 0 публикаций<br> - **Противоречие:** Иран — ключевой актор маршрута INSTC (Север–Юг), конкурент КТК; иранские СМИ формируют нарратив для аудитории 70+ млн; тема транзита и санкций обходных схем не покрыта<br> - **Что не мониторится:** IRNA (irna.ir), Mehr News (mehr.news), Tasnim (tasnimnews.com), ISNA (isna.ir), Tabnak (tabnak.ir)<br> - **Оценка потенциала:** 30–50 публикаций в квартал<br> <br> #### Хинди (HI)<br> - **Факт:** 0 публикаций<br> - **Противоречие:** Индия — крупнейший покупатель казахстанского урана (Казатомпром → NPCIL), растущий импортёр нефти; индийский нарратив по минеральным ресурсам и БРИКС полностью в слепой зоне<br> - **Что не мониторится:** The Hindu (thehindu.com/hindi), NDTV (ndtv.com), Hindustan Times, Dainik Bhaskar, Aaj Tak<br> - **Оценка потенциала:** 40–60 публикаций в квартал<br> <br> ---<br> <br> ### 🟠 Приоритет 2 — ВЫСОКАЯ (к v37, Q2 2026)<br> <br> | Язык | Код | Стратегическое обоснование | Ключевые домены | Оценка публ./квартал |<br> |------|-----|---------------------------|-----------------|----------------------|<br> | Узбекский | UZ | Прямой конкурент КЗ в ЦА, БРИКС, рейтинги | kun.uz, gazeta.uz, podrobno.uz, daryo.uz | 25–40 |<br> | Японский | JA | Инвестиции Mitsubishi/JBIC, уран для АЭС | nikkei.com, mainichi.jp, nhk.or.jp | 20–35 |<br> | Польский | PL | Форпост западной критики, ОБСЕ/ODIHR источники | polityka.pl, wyborcza.pl, rp.pl | 15–25 |<br> | Азербайджанский | AZ | Транскаспийский маршрут, конкуренция | azertag.az, 1news.az, haqqin.az | 15–20 |<br> | Украинский | UK | Контекст российского вектора, диаспора | pravda.com.ua, ukrinform.ua, lb.ua | 10–20 |<br> <br> ---<br> <br> ### 🟡 Приоритет 3 — СРЕДНЯЯ (к v38, Q3 2026)<br> <br> | Язык | Код | Обоснование | Ключевые домены |<br> |------|-----|-------------|-----------------|<br> | Малайский/Индонезийский | MS/ID | АСЕАН, ОИС, халяльные инвестиции | bernama.com, thestar.com.my, kompas.com |<br> | Иврит | HE | BESA Center (EN охвачен), израильские инвестиции | haaretz.co.il, jpost.com |<br> | Румынский | RO | Восточная Европа ЕС, НАТО-контекст | digi24.ro, g4media.ro |<br> | Кыргызский | KY | Ближайший сосед, зеркало ЦА-нарратива | akipress.com, kabar.kg |<br> | Таджикский | TG | ОДКБ, афганский контекст | khovar.tj, avesta.tj |<br> <br> ---<br> <br> ## 10.3. Доменные лакуны (вне языкового вопроса)<br> <br> Помимо языков, в текущих 680 доменах отсутствуют или слабо представлены:<br> <br> ### Финансовые/инвестиционные медиа<br> - **Bloomberg Arabic** (bloomberg.com/arabic) — отдельная редакция для арабских инвесторов<br> - **Nikkei Asia** (asia.nikkei.com) — ключевой источник по японским и азиатским инвестициям<br> - **S&P Global Commodity Insights** (spglobal.com) — отраслевые данные<br> - **Argus Media** (argusmedia.com) — нефтяные котировки/КТК<br> <br> ### Региональные агентства<br> - **AKIpress** (akipress.com) — ведущее ЦА-агентство (KG-база, но широкий охват)<br> - **CA-News** (ca-news.org) — мультиязычная ЦА<br> - **New Lines Magazine** (newlinesmag.com) — аналитика по ЦА (добавлен частично)<br> - **Caravanserai** (caravanserai.media) — немецкоязычный ЦА-фокус<br> <br> ### Telegram-каналы как источники (не платформа, а первоисточник)<br> - Ряд материалов первично публикуется в Telegram и только затем попадает в медиа — GDELT их не индексирует<br> - Каналы: Baza, Shot, DOXA, Insider Kazakhstan — формируют нарратив до традиционных СМИ<br> <br> ---<br> <br> ## 10.4. Plan языкового расширения v37<br> <br> ### Этап 1: немедленно (апрель 2026, до публикации v37)<br> <br> | Действие | Инструмент | Трудозатраты |<br> |----------|-----------|-------------|<br> | Добавить 8 арабских доменов в GDELT-запрос | GDELT API фильтр по домену | 2 часа |<br> | Добавить 6 казахских доменов | GDELT + ручной мониторинг | 3 часа |<br> | Добавить 5 персидских доменов | GDELT (FA поддерживается) | 2 часа |<br> | Обновить формулу CMV с учётом новых языков | Пересчёт | 1 час |<br> <br> ### Этап 2: к v37 (июнь 2026)<br> <br> | Действие | Результат |<br> |----------|-----------|<br> | Добавить хинди (HI) через Google News API | +40–60 публ./кв. |<br> | Добавить узбекский (UZ) | +25–40 публ./кв. |<br> | Добавить японский (JA) через Nikkei RSS | +20–35 публ./кв. |<br> | Нанять/привлечь аналитика AR+FA | Качественная оценка, не только GDELT |<br> <br> ### Этап 3: к v38 (сентябрь 2026)<br> <br> - Полная ревизия 27-языкового профиля с реальными данными по каждому<br> - Введение порогового критерия: язык считается «охваченным» при ≥20 публикаций в квартал<br> - Пересмотр итоговых цифр: реальное число языков с достаточной выборкой (ожидаемо: 18–22)<br> <br> ---<br> <br> ## 10.5. Влияние лакун на текущие выводы<br> <br> | Вывод в v36 | Риск искажения из-за лакун |<br> |-------------|---------------------------|<br> | Арабский вектор TI = +0,45 | **ВЫСОКИЙ** — оценка основана почти исключительно на EN-версиях арабских СМИ |<br> | «Казахстан = медиалидер ЦА» | **СРЕДНИЙ** — казахский и узбекский контуры не измерены |<br> | Иранский транзитный нарратив | **ВЫСОКИЙ** — персидскоязычные СМИ полностью в слепой зоне |<br> | Индийский «минеральный» нарратив | **СРЕДНИЙ** — хинди отсутствует, EN-версии индийских СМИ покрыты частично |<br> | Общий TI = −0,38 | **НИЗКИЙ** — доминирующие языки (RU, EN, DE) охвачены достаточно |<br> <br> ---<br> <br> *Раздел подготовлен: 17 марта 2026 | v36 → v37 roadmap*<br>