Викимедиа под давлением: рост трафика на 50% из-за ИИ-ботов

В сердце цифровой вселенной свободных знаний Викимедия сегодня сталкивается с одной из самых сложных проблем своей недавней истории: нарастающей волной быков ИИ-ботов, которые систематически грабят ее содержимое.

В частности, в последние месяцы наблюдается увеличение на 50% трафика, генерируемого так называемым AI-ползунком, что создает нагрузку как на технические возможности, так и на экономическую устойчивость платформы.

Воздействие искусственного интеллекта (AI) на цифровую инфраструктуру растет: случай с Викимедиа

Начиная с января 2024 года, наблюдается стремительный рост объема данных, загружаемых с платформ, таких как Wikipedia и другие проекты Wikimedia.

Этот рост связан не с более активным участием пользователей, а с систематическим и часто плохо регулируемым использованием автоматических ботов, используемых компаниями, разрабатывающими модели искусственного интеллекта.

Эти инструменты, предназначенные для сбора и анализа больших объемов текста, изображений и другого контента, используют Wikimedia в качестве основного источника данных для обучения своих алгоритмов

Операция, которая, с одной стороны, демонстрирует центральную роль платформы в экосистеме цифровых знаний, с другой стороны, создает неустойчивое давление на ее ИТ-инфраструктуры.

Проблема заключается не только в количестве переданных данных. Реальная критическая проблема заключается в том, как эти боты получают доступ к содержимому.

В большинстве случаев, на самом деле, запросы направляются на редкие или мало посещаемые страницы, то есть на те, которые не попадают в системы кэширования. Другими словами, механизмы, которые позволяют временно хранить копии самых запрашиваемых страниц для ускорения их загрузки.

Когда это происходит, запросы должны обрабатываться непосредственно центральными серверами, что приводит к значительному увеличению рабочей нагрузки и, прежде всего, затрат.

Этот сценарий становится особенно критичным в сочетании с событиями высокой медийной значимости, во время которых "человеческий" трафик уже достигает высоких уровней.

Боты вышли из-под контроля: игнорируют правила, обходят блокировки

Еще одно тревожное измерение этого явления представлено поведением, которое становится все более сложным и, иногда, неправильным у краулеров. Многие из этих ботов, на самом деле, игнорируют установленные правила, избегают автоматических систем блокировки и маскируются, чтобы выглядеть как законные пользователи.

Такое поведение не только нарушает нормы хорошего использования сети, но и заставляет технические команды Викимедиа постоянно следить и постоянно использовать ресурсы для защиты инфраструктуры.

Ресурсы, которые могли бы быть выделены для улучшения платформы или обогащения ее контента.

В ответ на эту ситуацию Фонд Викимедиа пытается не ограничиваться только технической или оборонительной реакцией. Предложенное решение выходит за рамки простого сдерживания проблемы и нацелено на совместное и устойчивое управление свободными знаниями.

Таким образом, родился WE5, новая стратегическая инициатива, направленная на продвижение более справедливых и ответственных подходов к приобретению и использованию данных, размещенных на платформе.

Проект представлен как приглашение для технологических компаний и разработчиков искусственного интеллекта

В частности, приглашение уважать правила, вносить вклад в затраты на управление сетью и обеспечивать выживание инфраструктуры, на которой основан один из основных источников бесплатной информации в мире.

Вся эта ситуация поднимает важный вопрос для будущего свободного доступа к знаниям: в эпоху, когда данные стали жизненной силой искусственного интеллекта, кто оплачивает сохранение и распространение этих данных?

Викимедиа, всегда движимая принципом бесплатности и дележа, теперь оказывается на перекрестке между открытостью и устойчивостью.

Без изменения курса со стороны крупных технологических компаний и участников, которые массово используют контент фонда, проект может быть вынужден сократить доступность или ввести более строгие ограничения для защиты своей инфраструктуры.

Призыв к уважению цифрового общественного блага

Сообщение, которое Викимедиа отправляет миру, ясно. То есть, свободные знания являются общим благом, и, как таковые, они должны рассматриваться с уважением и ответственностью.

Использование для коммерческих целей огромных информационных активов, предоставленных фондом, должно происходить прозрачно, в соответствии с правилами. Более того, при необходимости, оно должно сопровождаться формами справедливого вклада.

В условиях все более цифрового ландшафта, определяемого алгоритмами и автоматизацией, крайне важно обеспечить, чтобы доступ к знаниям не был ущемлён экономическими интересами немногих.

Только через открытый диалог между сообществами, учреждениями и компаниями можно сохранить мечту о свободной, доступной и устойчивой глобальной энциклопедии.

Посмотреть Оригинал
Содержание носит исключительно справочный характер и не является предложением или офертой. Консультации по инвестициям, налогообложению или юридическим вопросам не предоставляются. Более подробную информацию о рисках см. в разделе «Дисклеймер».
  • Награда
  • комментарий
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить