Исследование Стэнфорда: 35% новых сайтов к середине 2025 года созданы с участием ИИ
Учёные Стэнфордского университета установили, что к середине 2025 года более трети новых веб-сайтов были созданы полностью или частично с помощью искусственного интеллекта. Параллельно зафиксировано снижение семантического разнообразия контента.
Треть новых сайтов в интернете генерируется нейросетями
Исследователи из Стэнфордского университета пришли к выводу, что к середине 2025 года примерно 35% новых веб-сайтов были созданы полностью или при значительном участии искусственного интеллекта. До запуска ChatGPT от OpenAI в ноябре 2022 года этот показатель был практически нулевым — за неполные три года доля ИИ-генерированного контента выросла до более чем трети всех свежих публикаций в сети.

В рамках работы были проанализированы 33 месяца архивных копий веб-страниц из Wayback Machine. Для определения ИИ-контента исследователи использовали детектор Pangram v3. Задачей было оценить, каким образом массовое появление нейросетевых текстов трансформирует структуру глобальной сети.
Почему это важно
Масштаб проникновения ИИ-контента в интернет оказывает прямое влияние на информационную экосистему в целом. Если более трети новых публикаций порождается алгоритмами, это неизбежно меняет характер знаний и мнений, с которыми сталкиваются пользователи. Для крипторынка и технологической индустрии это особенно актуально — значительная часть аналитических материалов, обзоров проектов и новостей уже может генерироваться нейросетями, что ставит вопрос о качестве информации, на основе которой принимаются инвестиционные решения.
Контент стал однообразнее и позитивнее
Одним из ключевых выводов стало снижение семантического разнообразия. Страницы, сгенерированные нейросетями, оказались на 33% более похожи друг на друга по сравнению с текстами, написанными людьми. Разные ресурсы всё чаще воспроизводят одни и те же мысли практически одинаковыми формулировками.
По мнению авторов исследования, корень проблемы — в самой архитектуре больших языковых моделей (LLM). Они по своей природе склонны выбирать статистически наиболее вероятные, то есть «усреднённые», варианты ответов. Результатом становится шаблонный дискурс, в котором постепенно сужается пространство для уникальных формулировок и нестандартных идей.
Ещё один зафиксированный сдвиг — изменение эмоциональной окраски публикаций. ИИ-контент оказался на 107% позитивнее человеческого. Исследователи из Стэнфорда связали это с уже задокументированной склонностью LLM к угодничеству: в процессе обучения модели оптимизируются на генерацию приятных, безопасных и социально одобряемых ответов. Как следствие, значительная часть новых сайтов формирует «стерильно дружелюбную» среду с минимумом резких оценок и полемики.
Какие опасения не подтвердились
Ряд распространённых гипотез не нашёл статистического подтверждения. Исследователи не обнаружили значимой связи между ростом ИИ-контента и:
- снижением фактической точности текстов;
- увеличением числа явных ошибок;
- стилистическим выравниванием всех публикаций до единого шаблона.

Угроза коллапса модели
Отдельное внимание учёные уделили эффекту коллапса модели (model collapse) — явлению, которое до недавнего времени обсуждалось преимущественно в теоретической плоскости. Суть проблемы: если новые поколения нейросетей обучаются на данных, насыщенных ИИ-контентом, они начинают воспроизводить собственные усреднённые ответы. Это ведёт к деградации вариативности и качества, а в перспективе — к тому, что LLM будут учиться не у людей, а у «синтетического эха» предшествующих моделей.
Исследователи совместно с Internet Archive намерены трансформировать свою работу в систему непрерывного мониторинга доли ИИ-генерированного контента во всемирной сети.
Ранее, в середине апреля, та же группа в Стэнфорде отмечала опережающие темпы развития ИИ — по их данным, нейросети практически достигли уровня человека в выполнении компьютерных задач.
Часто задаваемые вопросы
Какая доля новых сайтов создана ИИ в 2025 году?
По данным исследования Стэнфордского университета, к середине 2025 года около 35% новых веб-сайтов были созданы полностью или частично с помощью искусственного интеллекта. До запуска ChatGPT в ноябре 2022 года этот показатель был близок к нулю.
Чем ИИ-контент отличается от текстов, написанных людьми?
Исследование показало, что сгенерированные нейросетями страницы на 33% более похожи друг на друга по сравнению с человеческими текстами. Кроме того, ИИ-контент оказался на 107% позитивнее — это связано со склонностью языковых моделей к генерации «безопасных» и приятных ответов.
Что такое коллапс модели (model collapse)?
Коллапс модели — эффект, при котором новые нейросети, обученные на данных с большим количеством ИИ-контента, начинают воспроизводить собственные усреднённые ответы. Это снижает вариативность и качество генерируемых текстов, создавая замкнутый цикл деградации.
Приводит ли рост ИИ-контента к увеличению числа ошибок?
Нет, исследователи из Стэнфорда не обнаружили значимой корреляции между ростом ИИ-контента и снижением фактической точности или увеличением числа явных ошибок. Эти распространённые опасения не нашли статистического подтверждения.
Как проводилось исследование Стэнфорда об ИИ-контенте?
Учёные проанализировали 33 месяца архивных копий сайтов из Wayback Machine с помощью детектора Pangram v3. Целью было оценить, как массовое появление текстов, созданных нейросетями, меняет структуру интернета.
Читайте также
ИИ-система Octane Security нашла критическую уязвимость в Ethereum-клиенте Nethermind
ИИ-система Octane Security обнаружила критическую уязвимость в Ethereum-клиенте Nethermind, способную остановить блокпроизводство у 38% валидаторов. Ethereum Foundation выплатил максимальную награду — $50 000.
OpenAI получила $110 млрд в рекордном раунде при оценке $730 млрд
OpenAI закрыла крупнейший в истории стартапов раунд финансирования на $110 млрд. Основными участниками стали SoftBank, Nvidia и Amazon.
Трамп приказал федеральным ведомствам США полностью отказаться от технологий Anthropic
Трамп дал федеральным ведомствам 6 месяцев на отказ от ИИ Anthropic. Что стоит за конфликтом с Claude и какую роль играет xAI Маска?
Alphabet отчиталась о рекордной квартальной выручке $94,7 млрд благодаря буму ИИ
Материнская компания Google превзошла прогнозы аналитиков по выручке и прибыли за первый квартал 2026 года, продемонстрировав мощный рост облачного сегмента и успешную интеграцию ИИ в поисковые сервисы.
DeepSeek представил V4-Pro — открытую модель, превзошедшую Claude Opus 4.6 и GPT-5.4
Китайский стартап DeepSeek выпустил превью линейки V4 с флагманской моделью на 1,6 трлн параметров, которая обошла ведущие закрытые системы в ряде бенчмарков.
Oracle увольняет тысячи работников на фоне масштабных инвестиций в ИИ
Oracle приступила к массовым сокращениям персонала по всему миру, перенаправляя ресурсы на развитие инфраструктуры искусственного интеллекта. Тем временем Джек Дорси из Block предлагает заменить менеджеров среднего звена ИИ-системами.
