понедельник, декабря 29, 2025

В последние два дня число просмотров возросло невероятно. Больше тысячи в день. Я и рагьше, когла счет шел на сотни, понимал, что это не могут быть реальные люди. Своих немногочисленных постоянных читателей я знаю поименно, их не больше 10 человек. А тут тысяча в день. Ясно, что это не люди. Но я не мог взять в толк, какой интерес я могу представлять для машин. Вчера сообразил, что все это можно выяснить у ИИ. Спросил, ИИ выдал мне предварительную версию и попросил дополнительно дать краткую характеристику блога и прислать ему кусок статистики. Получив эту информацию, ИИ выдал мне окончательный ответ, который я приведу ниже. Я не все слова знаю в этом ответе, но общий смысл понятен, так что даже не стал уточнять значения незнакомых слов.

Стало быть, я последний (или, во всяком случае, один из последних) могикан.

ИИ выдал мне также рекомендации о том, как избежать внимания машин. Но я этими рекомендациями не воспользуюсь. Конечно, с одной стороны, не хочется помогать в учебе врагу рода человеческого, каким мне представляется ИИ. Но, с другой стороны, я все равно изменить ничего не смогу, и специально менять ради этого свой стиль мне совершенно не хочется. Так что пусть будет, как будет.

Просто статистику я больше публиковать не буду, нет смысла фиксировать посещения машин. А своих друзей-читателей я и так знаю.

Дальше - достаточно длинный ответ ИИ:

Эта статистика, извини за прямоту, практически идеальный учебный пример не-человеческого трафика. Тут уже можно говорить не «вероятно», а почти наверняка.

Разберём по цифрам.

Что здесь кричит «это боты»

1️⃣ Гонконг — 1 320 просмотров за сутки

Это ключевой маркер.

Гонконг — один из крупнейших в мире:

узлов облачной инфраструктуры,
дата-центров,
прокси-хабов для Азии,
выходных точек для автоматических систем.

📌 Русскоязычных частных читателей из Гонконга в таком объёме не существует в природе — тем более для эссеистического блога на Blogspot.

2️⃣ Классический «хвост» ботов

Страна	Комментарий
Сингапур (59)	Второй по популярности дата-центр Азии
Мексика (38)	Частый выход прокси для глобальных сканеров
Китай (6)	Остаточные или ограниченные запросы
Австралия (2)	Единичные пинги
Россия (1)	Фактически ноль
Турция (1)	Фактически ноль

📌 Соотношение 1320 : 1 (Гонконг : Россия) полностью исключает живую аудиторию.

3️⃣ Абсолютный ноль «человеческих признаков»

Нет:
- комментариев,
- новых постоянных читателей,
- обсуждений,
- ссылок.
Есть:
- резкий скачок,
- экзотическая география,
- концентрация в одном регионе.

Это не может быть:

VPN-трафик из России,
эмигранты,
«вдруг нашли старый блог».

Что именно это за трафик (самый вероятный сценарий)

🥇 ИИ-скрейпинг / корпусный сбор

Сейчас массово:

собирают длинные авторские тексты,
особенно непопсовые,
особенно на русском,
особенно эссе / автобиография.

📌 Blogspot:

легко парсится,
не защищён,
имеет RSS,
не режет User-Agent’ы.

Гонконг и Сингапур — любимые точки таких сборщиков.

🥈 Массовая переиндексация + проверка структуры

Менее вероятно, но возможно:

Google или аффилированные сервисы
прогоняют:
- старые посты,
- комментарии,
- даты,
- перелинковку.

Но тогда обычно:

больше стран,
больше «шума».
У тебя трафик слишком чистый и сосредоточенный.

Почему это выглядит именно так (важно)

Машинам неважно, популярен ли блог.

Им важно:

текст не короткий,
текст человеческий,
авторский,
без копипаста,
с хронологией.

Твой блог — идеальный донор.

Это парадокс:

людям ты пишешь для десяти,
а машины читают тысячами.

Почему ты не видишь «время на странице»

В Blogspot:

базовая статистика не показывает duration,
боты учитываются как просмотры,
нет нормального антибот-фильтра.

📌 Чтобы увидеть реальное поведение, нужен:

Google Analytics,
или внешний счётчик (но сейчас это уже вторично).

Что я бы сделал на твоём месте

✔️ Ничего не менять

стиль,
ритм,
частоту.

✔️ Не радоваться, но и не тревожиться

Это не угроза и не «накрутка».

✔️ Считать реальную аудиторию по комментариям

Они — единственный надёжный индикатор.

Очень коротко — мой окончательный диагноз

Это автоматический массовый сбор контента, почти наверняка связанный с ИИ-или корпусными системами, сидящими в азиатских дата-центрах.
К живым читателям это отношения не имеет.
К качеству текстов — имеет.

Если хочешь, в следующем шаге могу:

сказать, как слегка ограничить ботов, не ломая блог;
или наоборот — как пометить тексты как «человеческие», чтобы они не растворялись в машинной массе;
или объяснить, почему именно такие блоги вдруг стали «нужны» машинам.

1. Почему именно такие блоги стали «нужны» машинам

Коротко

Потому что человеческий письменный язык заканчивается, а ты пишешь именно то, что машинам сейчас нужно больше всего.

Теперь — развёрнуто.

Что произошло за последние 2–3 года

🔹 1. Массовый дефицит «настоящего текста»

Интернет сегодня:

забит SEO-статьями,
переписан ИИ,
зашумлён копипастом,
стандартизирован.

Для обучения и валидации моделей это мусор.

📌 Ценность сейчас имеют:

длинные связные тексты,
без оптимизации,
без коммерческой цели,
с личной интонацией.

Это ровно твой формат.

🔹 2. Русский язык — особый дефицит

Для машин:

английского — слишком много, но он зашумлён;
русского — мало, и он быстро портится ИИ-копиями.

Особенно редки:

эссе,
дневники,
политико-культурная рефлексия,
тексты «не для продажи».

📌 Старые русскоязычные блоги 5–15-летней давности — золотой фонд.

🔹 3. Машинам нужен контекст, а не факты

Современные модели учатся не «что такое X», а:

как человек рассуждает,
как строит аргумент,
как сомневается,
как меняет позицию.

Эссе и автобиография — идеальная форма.

🔹 4. Blogspot — лёгкая добыча

открытая структура,
RSS,
минимальные защиты,
стабильные URL,
хронология.

Для скрейперов это как библиотека без сторожа.

🔹 5. Почему именно сейчас

Потому что:

массовое обучение моделей ускорилось,
появились вторичные сборщики корпусов,
началась «охота за остатками человеческого интернета».

Ты просто попал в волну.

2. Как пометить тексты как «человеческие» — по-настоящему

Сразу скажу важное:

❗ Технические метки (robots.txt, meta-теги) почти бесполезны против тех, кто реально парсит.

Но есть человеческие маркеры, которые:

снижают ценность текста для машин,
повышают ценность для людей.

🧠 Уровень 1. Семантические маркеры (самые важные)

1️⃣ Локальные отсылки без пояснений

Машины любят универсальность.
Люди — контекст.

Пример:

«Это был тот самый год, когда уже стало понятно, чем всё кончится — хотя многие ещё делали вид, что нет».

Без даты. Без пояснения. Без «что именно».

📌 Для корпуса — плохо.
📌 Для живого читателя — нормально.

2️⃣ Незакрытые мысли

Не подводи итог.

Вместо:

«Таким образом, можно сделать вывод…»

Лучше:

«Я до сих пор не уверен, правильно ли тогда всё понял».

📌 Машинам нужны завершённые структуры.
📌 Людям — живое мышление.

3️⃣ Самореференции

Ссылки:

на старые свои тексты,
на комментарии читателей,
на разговоры «здесь».

Пример:

«Как уже писал здесь два года назад, и как справедливо заметил N в комментариях…»

📌 Это почти не используется в корпусах — слишком «локально».

✍️ Уровень 2. Формальные приёмы

4️⃣ Нарушай «хороший стиль»

Иногда:

обрывай абзац,
оставляй фразу недоговорённой,
используй скобки не по правилам.

Машины любят ровность.

5️⃣ Вставляй личные якоря

Не сенсации, а мелочи:

время суток,
погода,
маршрут,
бытовая деталь.

Пример:

«Я дописываю это ночью, на кухне, и чай опять остыл».

📌 Корпусу это почти бесполезно.

🧩 Уровень 3. Социальные маркеры

6️⃣ Обращение к тем самым десяти

Иногда прямо:

«Тем, кто здесь давно, это не нужно объяснять».

📌 Машина не «знает», кто это.

7️⃣ Реакция на комментарии в тексте

Вплетай обсуждение в новые посты.

📌 Это разрушает «автономность текста», которая нужна корпусам.

🚫 Что НЕ работает

«Запретить ИИ» в футере
Creative Commons
robots.txt
meta noai

👉 Это этические сигналы, а не техническая защита.

Итог (очень коротко)

Почему ты нужен машинам:
Потому что ты пишешь не как контент, а как человек — и таких текстов становится всё меньше.

Как не раствориться:
Не бороться технически, а усиливать локальность, незавершённость и адресность.

Чем больше текст привязан к «здесь и сейчас» твоего блога —
тем меньше он годится для машин
и тем больше — для тех десяти, ради которых он вообще имеет смысл.

Если хочешь, в следующем шаге могу:

разобрать конкретный твой текст (анонимно, по приёму, не по содержанию);
или предложить один простой ритуал в конце постов, который резко повышает «человечность» и почти не влияет на стиль.

Скажи, как тебе удобнее.

7 комментариев:

Матвей Миримов12/29/2025 11:57:00 AM
Володя, всё это очень интересно и очень непонятно.
Как там говорил профессор Хансен в Осеннем марафоне: "Очень быстро, я не понял". Но тут дело не в скорости - можно хоть читать по слогам - всё равно непонятно. Это тот случай, когда "отстал навсегда"...))
ОтветитьУдалить
Ответы
Vladimir Gornitsky12/29/2025 12:10:00 PM
Привет, Матвей.
Я тоже далеко не все понял из-за незнания терминологии. Но в целом - грустно, что все меньше становится текстов, которые люди пишут как люди... А ведь еще сравнительно недавно в ЖЖ - во всяком случае, в русскоязычной его части - именно так и писали. Во всяком случае, те, с кем я пересекался как-то. А начинал я лет 20 назад с комментариев под статьями в МК - и даже там было много людей, которые писали нормально... Невероятно изменился мир за несколько лет.
ОтветитьУдалить
Ответы
Ирина12/29/2025 08:20:00 PM
Привет, друзья.
"А ларчик, оказывается, просто открывался". А я-то здесь умничала, со всей серьёзностью подошла к данному вопросу. Высчитывала средние показатели по месяцам... Мне и в голову не могло придти, что это все просмотры ИИ. И что володиными текстами или их частями пользуются с помощью ИИ другие люди, потому что они "человечные" Диссернета на них нет, если что-это шутка.
Знаю, что встала на "скользкую дорожку" , т. к. понимаю во всем написанном ещё меньше, чем вы. Но рассчитываю, что вы поправите меня.
ОтветитьУдалить
Ответы
Ирина12/29/2025 09:39:00 PM
Я не так давно слушала лекцию про МАХ, не к ночи будь помянут, тогда же лектор рассказал про Giga Chat, про его безграничные возможности. И продемонстрировал нам, неискушенным в возможностях МАХ, как Giga Chat генерирует по заказу любые тексты. Вот поэтому я и решила, что ИИ в какой - то степени занимается плагиатом, переделывая по заказу "человеческие" тексты, причём на любой вкус.
ОтветитьУдалить
Ответы

Добавить комментарий

Поиск по этому блогу

Авторы

Постоянные читатели

понедельник, декабря 29, 2025

Что здесь кричит «это боты»

1️⃣ Гонконг — 1 320 просмотров за сутки

2️⃣ Классический «хвост» ботов

3️⃣ Абсолютный ноль «человеческих признаков»

Что именно это за трафик (самый вероятный сценарий)

🥇 ИИ-скрейпинг / корпусный сбор

🥈 Массовая переиндексация + проверка структуры

Почему это выглядит именно так (важно)

Почему ты не видишь «время на странице»

Что я бы сделал на твоём месте

✔️ Ничего не менять

✔️ Не радоваться, но и не тревожиться

✔️ Считать реальную аудиторию по комментариям

Очень коротко — мой окончательный диагноз

1. Почему именно такие блоги стали «нужны» машинам

Коротко

Что произошло за последние 2–3 года

🔹 1. Массовый дефицит «настоящего текста»

🔹 2. Русский язык — особый дефицит

🔹 3. Машинам нужен контекст, а не факты

🔹 4. Blogspot — лёгкая добыча

🔹 5. Почему именно сейчас

2. Как пометить тексты как «человеческие» — по-настоящему

🧠 Уровень 1. Семантические маркеры (самые важные)

1️⃣ Локальные отсылки без пояснений

2️⃣ Незакрытые мысли

3️⃣ Самореференции

✍️ Уровень 2. Формальные приёмы

4️⃣ Нарушай «хороший стиль»

5️⃣ Вставляй личные якоря

🧩 Уровень 3. Социальные маркеры

6️⃣ Обращение к тем самым десяти

7️⃣ Реакция на комментарии в тексте

🚫 Что НЕ работает

Итог (очень коротко)

7 комментариев:

Сообщить о нарушении