Касательно мониторинга ПРОЕКТ 290925.docx
Сущности
ПРОЕКТ<br>
Касательно мониторинга информационного поля РК<br>
(Актуализированная версия – январь 2026)<br>
Государственный мониторинг информационного поля должен рассматриваться не как вспомогательная аналитическая функция, а как элемент системы раннего предупреждения и поддержки управленческих решений, сопоставимый по значимости с экономическим и социальным мониторингом. Однако действующая система государственного мониторинга информационного поля Казахстана на конец 2025 года не обеспечивает ни полного охвата, ни глубокой аналитической обработки поступающей информации.<br>
Формально ряд инструментов внедрён, однако фактически мониторинг ведётся преимущественно вручную и через сервисы мониторинга упоминаний «маркетингового» уровня, что не соответствует современным требованиям по скорости и полноте анализа, включая требования к времени реакции и воспроизводимости выводов.<br>
Эти проблемы носят системный характер и свидетельствуют о заметном технологическом отставании инфраструктуры мониторинга от динамично развивающейся медиасреды, а также об организационно-процессном дефиците координации.<br>
По состоянию на конец 2025 года аудитория крупнейших социальных платформ Казахстана значительно выросла и претерпела структурные изменения. TikTok – 16,9 млн пользователей старше 18 лет – остаётся безусловным лидером по охвату (было 15,7 млн). Instagram насчитывает 13,1 млн пользователей с приростом 9,6% за год (было 12,4 млн). Telegram оценивается в ~12–13 млн пользователей. Facebook демонстрирует вариативность в 2,5–14,6 млн, YouTube охватывает ~10–11 млн, VK – ~8–9 млн с тенденцией к спаду. Threads и X (Twitter) занимают маргинальные позиции с 1,85 млн и 0,28 млн соответственно.<br>
Общая аудитория социальных сетей достигла 16,9 млн человек, что составляет 80,8% населения Казахстана – прирост на 12,4% с конца 2024 года. Число интернет-пользователей – 19,5 млн (93,4% населения).<br>
Фундаментальной трансформацией стала смена приоритетов в источниках получения информации. 66,8% населения используют социальные сети как первичный источник новостей (было 62,4%), в то время как телевидение составляет 54,7% – социальные сети окончательно обогнали традиционное телевещание. Среди молодежи 18–24 лет этот показатель достигает 76,3% (было 73,8%). Фактически социальные сети трансформировались из дополнительного канала в ядро информационного пространства Республики, что многократно усиливает значимость и срочность организации их системного мониторинга.<br>
Ежедневно в казахстанском сегменте соцсетей формируется примерно 1,8–2,2 млн единиц контента. Telegram генерирует ~0,5–0,7 млн сообщений/ сутки, Instagram – ~0,30–0,33 млн постов и комментариев/сутки, TikTok – ~0,20–0,30 млн роликов и комментариев/сутки. Менее крупные платформы (YouTube, Facebook, VK, Odnoklassniki, Threads, X) производят десятки и сотни тысяч единиц в сутки. Существенный дополнительный объём создаётся в эфемерных форматах и приватных мессенджерах, но он остаётся недоступен для внешнего наблюдения.<br>
Между тем существующие средства мониторинга способны охватить лишь часть этого объёма, в лучшем случае фиксируя примерно 20–25% от общего потока. Даже при одновременном задействовании всех доступных систем фактический охват оценивается примерно в четверть инфополя, при этом значимая доля зафиксированного потока – спам и дубликаты, не добавляющие аналитической ценности.<br>
Мониторинг в нынешнем виде фактически сводится к фиксации отдельных публикаций в режиме ручного управления, без возможности прослеживать развитие тем во времени или оценивать их общественное восприятие. Отсутствует сквозная трассировка распространения контента и расчёт показателей воздействия по темам.<br>
Отсутствие единой аналитической платформы приводит к тому, что каждое ведомство применяет собственные инструменты и методики; данные изолированы и несопоставимы, не складываясь в общереспубликанскую картину. Не используются общие словари и идентификаторы источников и персон, отсутствуют единые регламенты метрик и качества данных. В результате такая фрагментация ограничивает работу каждого органа лишь рамками своего сегмента инфополя. Без понимания общей динамики процессов, теряются межплатформенные связи и кросс-канальные влияния.<br>
За последнее десятилетие сами медийные платформы претерпели существенную эволюцию, что ещё более осложнило задачу мониторинга. Крупнейшие соцсети стали более закрытыми экосистемами, резко ограничившими сторонний доступ к данным. Политики компаний ужесточили правила API и фактически запретили массовый парсинг контента. Площадки экосистемы Meta не позволяют полноценно собирать информацию извне – любые несанкционированные попытки блокируются как на уровне правил, так и техническими средствами самой платформы.<br>
Только за 2023 год ряд крупных сервисов существенно сократил объём открытых данных или ввёл высокую плату за доступ к своему API; доступ к потокам данных стал платным и жёстко контролируемым. Параллельно внедрены продвинутые анти-бот и анти-фрод механизмы: платформы активно выявляют и пресекают автоматизированный сбор информации, что делает массовый парсинг экономически и технически нецелесообразным. По сравнению с ситуацией десятилетней давности возможности получения данных из соцсетей заметно сузились, а трудоёмкость их извлечения – возросла многократно.<br>
Современное инфополе формируется не столько самими пользователями, сколько рекомендательными алгоритмами платформ, которые определяют видимость контента, скорость его распространения и масштаб охвата. Отсутствие доступа к логике алгоритмической дистрибуции существенно ограничивает возможность интерпретации наблюдаемых данных: система видит результат (количество просмотров, репостов, распространение), но не понимает, почему платформа усилила или ослабила распространение конкретного сообщения. Это создаёт зону непрозрачности, критичную для понимания реальной динамики общественных настроений.<br>
Отдельные категории контента принципиально остаются вне досягаемости мониторинга. Текущие инструменты способны фиксировать только открытые публикации и комментарии, тогда как существенная доля активности пользователей приходится на форматы, которые невозможно автоматически собрать и проанализировать. Прежде всего это эфемерный контент (исчезающие «истории», стримы, краткие видеоформаты), а также коммуникация в закрытых чатах, приватных группах и каналах. Такие материалы не индексируются поисковыми системами и не поддаются машинному поиску, оставаясь вне поля зрения. Совокупно эти «тёмные зоны» превышают 50–60% пользовательской активности.<br>
Массовое распространение синтетического контента, создаваемого с помощью генеративных нейросетей, представляет отдельную и нарастающую угрозу. По оценкам международных исследовательских центров, объём deepfake-материалов вырос с примерно 500 тысяч в 2023 году до более 8 миллионов в 2025-м, и тенденция продолжает ускоряться. Появление сервисов Deepfake-as-a-Service сделало создание синтетических видео, голосовых и текстовых материалов доступным для широкого круга злоумышленников.<br>
AI-генерированные видео и голосовые клоны способны обходить традиционные детекторы с точностью свыше 90%. Это создаёт угрозу executive impersonation (имитация руководителей для санкционирования финансовых операций), распространения ложных заявлений от лица государственных деятелей, а также массового производства дезинформационного контента без устойчивого авторства. Существующие мониторинговые системы не располагают инструментами для выявления и верификации подобных материалов, что многократно усиливает риски информационных манипуляций.<br>
В результате текущий мониторинг выполняет скорее регистрационную, нежели аналитическую функцию. Он фиксирует инфоповоды постфактум, не поддерживает ранние предупреждения и количественную оценку рисков, а также раннее обнаружение кризисных трендов. По мере роста объёмов контента и усложнения медиасреды эффективность устаревших решений неуклонно падает; рост доли видео- и сторис-форматов усиливает разрыв. Мониторинговые сводки зачастую лишь создают видимость глубокой аналитики, отражая на деле поверхностный слой инфополя. Глубинные тенденции, скрытые обсуждения и назревающие риски остаются нераспознанными, что ведёт к запоздалым реакциям.<br>
На фоне описанных системных проблем государство предприняло ряд шагов к консолидации мониторинга информационного поля. В июле 2025 года в структуре СЦК создан Центр противодействия дезинформации, задачами которого являются выявление и опровержение фейковых сообщений, а также обеспечение граждан проверенными данными. ЦБД функционирует в сотрудничестве с государственными органами, экспертным сообществом и журналистами, публикуя регулярные обзоры дезинформационных кампаний и экспертные разъяснения по резонансным темам. Создание Центра явилось реакцией на выявленные координированные информационные атаки, включая операции, направленные на подрыв доверия к государственным институтам и дестабилизацию международных отношений.<br>
С начала 2026 года запущен переход на национальную платформу QazTech – единую информационно-коммуникационную платформу электронного правительства. Указом президента от 9 декабря 2025 года введён мораторий на создание новых информационных систем вне этой платформы. Переход на единую архитектуру призван консолидировать государственные цифровые сервисы и данные, сократить количество избыточных информационных систем и обеспечить технологическую совместимость решений. Срок миграции всех ведомственных систем – до 30 сентября 2026 года.<br>
Президент Казахстана объявил 2026 год Годом цифровизации и искусственного интеллекта. Это отражает общую стратегию развития: рост позиции Казахстана в Government AI Readiness Index до 60-го места (было 64-е место), экспорт IT-услуг превысил $1 млрд в 2025 году. Этот контекст создаёт окно возможностей для модернизации мониторинговых систем на базе отечественных и суверенных AI-решений.<br>
Однако эти меры носят инфраструктурный и организационный характер. Ключевая проблема – отсутствие единой аналитической платформы с глубокой обработкой данных и интеллектуальным анализом содержания – пока не решена системно.<br>
Корневая причина проблем лежит в ограниченной архитектуре системы: разрозненная и устаревшая, она не адаптирована к современным форматам коммуникации (видео, эфемерный контент, AI-генерированные материалы) и не интегрирует данные в единую проактивную аналитическую картину. Отсутствует единое архитектурное ядро данных и аналитики.<br>
Необходимо управленческое решение о переходе к единому ядру данных и инструментов мониторинга с централизованным управлением качеством, доступом и регламентами. Стратегия предполагает создание современной интегрированной платформы, объединяющей данные из разных каналов и обеспечивающей интеллектуальную обработку информации, с единым центром управления данными, открытыми API для ведомств и прозрачной витриной метрик.<br>
Необходимо радикально повысить аналитическую глубину: перейти от простого учёта упоминаний к семантическому анализу содержания сообщений, выявляя скрытые смысловые связи и контексты, включая оценку тональности и семантической близости к госнарративам. Система должна обладать развитым инструментарием обработки естественного языка применительно к русскоязычным и казахоязычным текстам, включая предварительную лингвистическую обработку (очистка и нормализация текста, извлечение ключевых сущностей – персоналий, организаций, топонимов и т.д.). Особый акцент делается на качественной работе с казахским языком, с учётом его структурных особенностей.<br>
Важным шагом в направлении технологического суверенитета стала разработка национальной большой языковой модели KazLLM (ISSAI), представленной главе государства в декабре 2024 года. Модель обучена на более чем 150 миллиардах токенов на казахском, русском, английском и турецком языках и способна выполнять задачи перевода, суммаризации и анализа текстов. В перспективе планируется расширение модели на мультимодальную обработку (голос, изображения). Наличие отечественной LLM создаёт возможность для интеграции семантического анализа в будущую мониторинговую платформу без критической зависимости от зарубежных закрытых решений.<br>
Посредством тематического моделирования больших массивов публикаций система сможет группировать сообщения по смысловым темам, выделяя возникающие тренды. Это позволит в режиме реального времени отслеживать, какие темы начинают доминировать в медиаполе, какие нарративы набирают резонанс, а какие, напротив, сходят на нет.<br>
Планируется внедрить анализ нарративов: сопоставление того, как ключевые государственные месседжи транслируются в медиапространстве, с изначальными «эталонными» нарративами, с измерением доли охвата целевых аудиторий. Такой модуль позволит понять, насколько точно доносится официальная позиция, где она искажается либо критикуется, а где возникают пробелы (темы, выпадающие из повестки).<br>
Модернизированная платформа должна обладать средствами автоматического выявления угроз и аномалий в инфополе. С помощью обучаемых моделей целесообразно реализовать модуль для фильтрации и распознавания дезинформации, фейков и иных манипулятивных материалов, с поддержкой фактчекинга и приоритезации инцидентов. Он будет отслеживать появление подозрительного контента (в том числе заказного) и помечать такие сообщения для приоритетного анализа специалистами. Требуется также система для выявления deepfakes и синтетического контента, которые требуют специальных детекторов на базе мультимодального AI-анализа видео, аудио и метаданных.<br>
Параллельно требуется инструментарий для выявления скрытых структур влияния. Построение графа связей между субъектами медиаполя (СМИ, аккаунты, авторы, темы) позволило бы визуализировать кластеры ресурсов с единой повесткой и отследить распространение информации по связанным узлам. Анализ таких графовых моделей выявит группы источников, действующие согласованно, и признаки скоординированных кампаний – например, синхронное тиражирование сходных вбросов на разных площадках, с идентификацией дирижёров и прокси-аккаунтов. Это даст возможность своевременно распознавать организованные информатаки и устанавливать ключевые узлы влияния (будь то лидеры мнений, сети ботов или заказчики информационных волн), с выработкой рекомендованных ответных действий.<br>
С ростом доли видео в медиаполе (TikTok, Instagram Reels, YouTube Shorts) система должна включать инструменты для анализа видеоконтента: автоматическая транскрипция речи (казахский и русский языки), распознавание объектов и лиц, анализ визуального контента. Это критично для охвата контента на новых платформах, где 50%+ активности пользователей.<br>
Наконец, интеграция методов предиктивной аналитики позволит на основе больших данных и выявленных трендов прогнозировать развитие ситуаций, с ранжированием рисков по вероятности и масштабу влияния. Раннее обнаружение аномалий послужит сигналом о зарождении кризисных тем ещё до того, как они разовьются в полном масштабе.<br>
Модернизация мониторинга осуществляется в условиях обновлённой нормативно-правовой базы. В июне 2024 года вступил в силу закон «О масс-медиа», расширяющий полномочия государства по мониторингу СМИ на предмет соблюдения «национальных, культурных и семейных ценностей». Закон предусматривает обязательную регистрацию онлайн-публикаций и требует наличия аккредитации для иностранных СМИ. Данный закон вызвал критику международных организаций за неопределённость формулировок и потенциальные риски ограничения свободы слова и информации.<br>
В декабре 2025 года на общественном обсуждении находится проект новых регуляций, обязывающий владельцев анонимных Telegram-каналов с аудиторией свыше 5 тысяч подписчиков раскрывать свою личность. Проект также предусматривает требование регистрации представительства иностранных платформ в Казахстане, запрет регистрации детей младше 16 лет в соцсетях и установление штрафов за нарушения.<br>
Эти инициативы отражают стремление государства к упорядочиванию информационного пространства и противодействию дезинформационным кампаниям, однако создают необходимость тщательного соблюдения баланса между обеспечением информационной безопасности и гарантиями свободы СМИ и информации.<br>
Система мониторинга должна функционировать на принципах прозрачности алгоритмов (объяснимость решений AI), процессуальности верификации (независимая проверка выводов) и защиты личных данных (не должна затрагивать приватную коммуникацию). Необходимо исключить превращение инструмента мониторинга в механизм избыточного контроля над общественным мнением.<br>
В условиях ускорения информационных процессов, роста роли алгоритмических платформ и генеративных технологий отсутствие современной системы мониторинга превращается из технологического недостатка в фактор стратегического риска.<br>
Переход к единому интеллектуальному ядру мониторинга является не вопросом модернизации, а условием сохранения управляемости информационной среды и способности государства к проактивному реагированию на возникающие угрозы. Необходимо управленческое решение о развертывании централизованной платформы мониторинга информационного поля Казахстана с единым центром данных, интегрированной аналитикой на базе отечественных AI-решений (KazLLM) и открытыми API для координации между ведомствами.<br>
Этап внедрения QazTech и функционирование Центра противодействия дезинформации создают инфраструктурный фундамент для реализации этого решения в течение 2026 года.