Исследование Стэнфорда: 35% новых сайтов к середине 2025 года созданы с участием ИИ

AI3 мин

30 апреля 2026 г.

Исследование Стэнфорда: 35% новых сайтов к середине 2025 года созданы с участием ИИ

Учёные Стэнфордского университета установили, что к середине 2025 года более трети новых веб-сайтов были созданы полностью или частично с помощью искусственного интеллекта. Параллельно зафиксировано снижение семантического разнообразия контента.

📝

Редакция

Редакция · 0 статей

Треть новых сайтов в интернете генерируется нейросетями

Исследователи из Стэнфордского университета пришли к выводу, что к середине 2025 года примерно 35% новых веб-сайтов были созданы полностью или при значительном участии искусственного интеллекта. До запуска ChatGPT от OpenAI в ноябре 2022 года этот показатель был практически нулевым — за неполные три года доля ИИ-генерированного контента выросла до более чем трети всех свежих публикаций в сети.

Доля сайтов, созданных ИИ, по данным Стэнфорда — Динамика роста доли сайтов, полностью сгенерированных ИИ (красный) и созданных при помощи нейросетей (фиолетовый). Источник: GitHub

В рамках работы были проанализированы 33 месяца архивных копий веб-страниц из Wayback Machine. Для определения ИИ-контента исследователи использовали детектор Pangram v3. Задачей было оценить, каким образом массовое появление нейросетевых текстов трансформирует структуру глобальной сети.

Почему это важно

Масштаб проникновения ИИ-контента в интернет оказывает прямое влияние на информационную экосистему в целом. Если более трети новых публикаций порождается алгоритмами, это неизбежно меняет характер знаний и мнений, с которыми сталкиваются пользователи. Для крипторынка и технологической индустрии это особенно актуально — значительная часть аналитических материалов, обзоров проектов и новостей уже может генерироваться нейросетями, что ставит вопрос о качестве информации, на основе которой принимаются инвестиционные решения.

Контент стал однообразнее и позитивнее

Одним из ключевых выводов стало снижение семантического разнообразия. Страницы, сгенерированные нейросетями, оказались на 33% более похожи друг на друга по сравнению с текстами, написанными людьми. Разные ресурсы всё чаще воспроизводят одни и те же мысли практически одинаковыми формулировками.

По мнению авторов исследования, корень проблемы — в самой архитектуре больших языковых моделей (LLM). Они по своей природе склонны выбирать статистически наиболее вероятные, то есть «усреднённые», варианты ответов. Результатом становится шаблонный дискурс, в котором постепенно сужается пространство для уникальных формулировок и нестандартных идей.

Ещё один зафиксированный сдвиг — изменение эмоциональной окраски публикаций. ИИ-контент оказался на 107% позитивнее человеческого. Исследователи из Стэнфорда связали это с уже задокументированной склонностью LLM к угодничеству: в процессе обучения модели оптимизируются на генерацию приятных, безопасных и социально одобряемых ответов. Как следствие, значительная часть новых сайтов формирует «стерильно дружелюбную» среду с минимумом резких оценок и полемики.

Какие опасения не подтвердились

Ряд распространённых гипотез не нашёл статистического подтверждения. Исследователи не обнаружили значимой связи между ростом ИИ-контента и:

снижением фактической точности текстов;
увеличением числа явных ошибок;
стилистическим выравниванием всех публикаций до единого шаблона.

Корреляция ИИ-контента с различными гипотезами — Слева: корреляция между объёмом ИИ-контента и проверяемыми гипотезами. Справа: доля взрослых американцев, согласных с каждой из гипотез. Источник: GitHub

Угроза коллапса модели

Отдельное внимание учёные уделили эффекту коллапса модели (model collapse) — явлению, которое до недавнего времени обсуждалось преимущественно в теоретической плоскости. Суть проблемы: если новые поколения нейросетей обучаются на данных, насыщенных ИИ-контентом, они начинают воспроизводить собственные усреднённые ответы. Это ведёт к деградации вариативности и качества, а в перспективе — к тому, что LLM будут учиться не у людей, а у «синтетического эха» предшествующих моделей.

Исследователи совместно с Internet Archive намерены трансформировать свою работу в систему непрерывного мониторинга доли ИИ-генерированного контента во всемирной сети.

Ранее, в середине апреля, та же группа в Стэнфорде отмечала опережающие темпы развития ИИ — по их данным, нейросети практически достигли уровня человека в выполнении компьютерных задач.

ai-contentartificial-intelligenceinternetllmmodel-collapseresearchstanford

Часто задаваемые вопросы

Какая доля новых сайтов создана ИИ в 2025 году?

По данным исследования Стэнфордского университета, к середине 2025 года около 35% новых веб-сайтов были созданы полностью или частично с помощью искусственного интеллекта. До запуска ChatGPT в ноябре 2022 года этот показатель был близок к нулю.

Чем ИИ-контент отличается от текстов, написанных людьми?

Исследование показало, что сгенерированные нейросетями страницы на 33% более похожи друг на друга по сравнению с человеческими текстами. Кроме того, ИИ-контент оказался на 107% позитивнее — это связано со склонностью языковых моделей к генерации «безопасных» и приятных ответов.

Что такое коллапс модели (model collapse)?

Коллапс модели — эффект, при котором новые нейросети, обученные на данных с большим количеством ИИ-контента, начинают воспроизводить собственные усреднённые ответы. Это снижает вариативность и качество генерируемых текстов, создавая замкнутый цикл деградации.

Приводит ли рост ИИ-контента к увеличению числа ошибок?

Нет, исследователи из Стэнфорда не обнаружили значимой корреляции между ростом ИИ-контента и снижением фактической точности или увеличением числа явных ошибок. Эти распространённые опасения не нашли статистического подтверждения.

Как проводилось исследование Стэнфорда об ИИ-контенте?

Учёные проанализировали 33 месяца архивных копий сайтов из Wayback Machine с помощью детектора Pangram v3. Целью было оценить, как массовое появление текстов, созданных нейросетями, меняет структуру интернета.

Исследование Стэнфорда: 35% новых сайтов к середине 2025 года созданы с участием ИИ

Треть новых сайтов в интернете генерируется нейросетями

Почему это важно

Контент стал однообразнее и позитивнее

Какие опасения не подтвердились

Угроза коллапса модели

Часто задаваемые вопросы

Какая доля новых сайтов создана ИИ в 2025 году?

Чем ИИ-контент отличается от текстов, написанных людьми?

Что такое коллапс модели (model collapse)?

Приводит ли рост ИИ-контента к увеличению числа ошибок?

Как проводилось исследование Стэнфорда об ИИ-контенте?

Читайте также

ИИ-система Octane Security нашла критическую уязвимость в Ethereum-клиенте Nethermind

OpenAI получила $110 млрд в рекордном раунде при оценке $730 млрд

Трамп приказал федеральным ведомствам США полностью отказаться от технологий Anthropic

Alphabet отчиталась о рекордной квартальной выручке $94,7 млрд благодаря буму ИИ

DeepSeek представил V4-Pro — открытую модель, превзошедшую Claude Opus 4.6 и GPT-5.4

Oracle увольняет тысячи работников на фоне масштабных инвестиций в ИИ

Будьте в курсе