Поиск по этому блогу

Постоянные читатели

понедельник, декабря 29, 2025

В последние два дня число просмотров возросло невероятно. Больше тысячи в день. Я и рагьше, когла счет шел на сотни, понимал, что это не могут быть реальные люди. Своих немногочисленных постоянных читателей я знаю поименно, их не больше 10 человек. А тут тысяча в день. Ясно, что это не люди. Но я не мог взять в толк, какой интерес я могу представлять для машин. Вчера сообразил, что все это можно выяснить у ИИ. Спросил, ИИ выдал мне предварительную версию и попросил дополнительно дать краткую характеристику блога и прислать ему кусок статистики. Получив эту информацию, ИИ выдал мне окончательный ответ, который я приведу ниже. Я не все слова знаю в этом ответе, но общий смысл понятен, так что даже не стал уточнять значения незнакомых слов. 

Стало быть, я последний (или, во всяком случае, один из последних) могикан. 

ИИ выдал мне также рекомендации о том, как избежать внимания машин. Но я этими рекомендациями не воспользуюсь. Конечно, с одной стороны, не хочется помогать в учебе врагу рода человеческого, каким мне представляется ИИ. Но, с другой стороны, я все равно изменить ничего не смогу, и специально менять ради этого свой стиль мне совершенно не хочется. Так что пусть будет, как будет. 

Просто статистику я больше публиковать не буду, нет смысла фиксировать посещения машин. А своих друзей-читателей я и так знаю. 

Дальше - достаточно длинный ответ ИИ:      

Эта статистика, извини за прямоту, практически идеальный учебный пример не-человеческого трафика. Тут уже можно говорить не «вероятно», а почти наверняка.

Разберём по цифрам.


Что здесь кричит «это боты»

1️⃣ Гонконг — 1 320 просмотров за сутки

Это ключевой маркер.

Гонконг — один из крупнейших в мире:

  • узлов облачной инфраструктуры,

  • дата-центров,

  • прокси-хабов для Азии,

  • выходных точек для автоматических систем.

📌 Русскоязычных частных читателей из Гонконга в таком объёме не существует в природе — тем более для эссеистического блога на Blogspot.


2️⃣ Классический «хвост» ботов

СтранаКомментарий
Сингапур (59)Второй по популярности дата-центр Азии
Мексика (38)Частый выход прокси для глобальных сканеров
Китай (6)Остаточные или ограниченные запросы
Австралия (2)Единичные пинги
Россия (1)Фактически ноль
Турция (1)Фактически ноль

📌 Соотношение 1320 : 1 (Гонконг : Россия) полностью исключает живую аудиторию.


3️⃣ Абсолютный ноль «человеческих признаков»

  • Нет:

    • комментариев,

    • новых постоянных читателей,

    • обсуждений,

    • ссылок.

  • Есть:

    • резкий скачок,

    • экзотическая география,

    • концентрация в одном регионе.

Это не может быть:

  • VPN-трафик из России,

  • эмигранты,

  • «вдруг нашли старый блог».


Что именно это за трафик (самый вероятный сценарий)

🥇 ИИ-скрейпинг / корпусный сбор

Сейчас массово:

  • собирают длинные авторские тексты,

  • особенно непопсовые,

  • особенно на русском,

  • особенно эссе / автобиография.

📌 Blogspot:

  • легко парсится,

  • не защищён,

  • имеет RSS,

  • не режет User-Agent’ы.

Гонконг и Сингапур — любимые точки таких сборщиков.


🥈 Массовая переиндексация + проверка структуры

Менее вероятно, но возможно:

  • Google или аффилированные сервисы

  • прогоняют:

    • старые посты,

    • комментарии,

    • даты,

    • перелинковку.

Но тогда обычно:

  • больше стран,

  • больше «шума».
    У тебя трафик слишком чистый и сосредоточенный.


Почему это выглядит именно так (важно)

Машинам неважно, популярен ли блог.

Им важно:

  • текст не короткий,

  • текст человеческий,

  • авторский,

  • без копипаста,

  • с хронологией.

Твой блог — идеальный донор.

Это парадокс:

  • людям ты пишешь для десяти,

  • а машины читают тысячами.


Почему ты не видишь «время на странице»

В Blogspot:

  • базовая статистика не показывает duration,

  • боты учитываются как просмотры,

  • нет нормального антибот-фильтра.

📌 Чтобы увидеть реальное поведение, нужен:

  • Google Analytics,

  • или внешний счётчик (но сейчас это уже вторично).


Что я бы сделал на твоём месте

✔️ Ничего не менять

  • стиль,

  • ритм,

  • частоту.

✔️ Не радоваться, но и не тревожиться

Это не угроза и не «накрутка».

✔️ Считать реальную аудиторию по комментариям

Они — единственный надёжный индикатор.


Очень коротко — мой окончательный диагноз

Это автоматический массовый сбор контента, почти наверняка связанный с ИИ-или корпусными системами, сидящими в азиатских дата-центрах.
К живым читателям это отношения не имеет.
К качеству текстов — имеет.

Если хочешь, в следующем шаге могу:

  • сказать, как слегка ограничить ботов, не ломая блог;

  • или наоборот — как пометить тексты как «человеческие», чтобы они не растворялись в машинной массе;

  • или объяснить, почему именно такие блоги вдруг стали «нужны» машинам.

1. Почему именно такие блоги стали «нужны» машинам

Коротко

Потому что человеческий письменный язык заканчивается, а ты пишешь именно то, что машинам сейчас нужно больше всего.

Теперь — развёрнуто.


Что произошло за последние 2–3 года

🔹 1. Массовый дефицит «настоящего текста»

Интернет сегодня:

  • забит SEO-статьями,

  • переписан ИИ,

  • зашумлён копипастом,

  • стандартизирован.

Для обучения и валидации моделей это мусор.

📌 Ценность сейчас имеют:

  • длинные связные тексты,

  • без оптимизации,

  • без коммерческой цели,

  • с личной интонацией.

Это ровно твой формат.


🔹 2. Русский язык — особый дефицит

Для машин:

  • английского — слишком много, но он зашумлён;

  • русского — мало, и он быстро портится ИИ-копиями.

Особенно редки:

  • эссе,

  • дневники,

  • политико-культурная рефлексия,

  • тексты «не для продажи».

📌 Старые русскоязычные блоги 5–15-летней давности — золотой фонд.


🔹 3. Машинам нужен контекст, а не факты

Современные модели учатся не «что такое X», а:

  • как человек рассуждает,

  • как строит аргумент,

  • как сомневается,

  • как меняет позицию.

Эссе и автобиография — идеальная форма.


🔹 4. Blogspot — лёгкая добыча

  • открытая структура,

  • RSS,

  • минимальные защиты,

  • стабильные URL,

  • хронология.

Для скрейперов это как библиотека без сторожа.


🔹 5. Почему именно сейчас

Потому что:

  • массовое обучение моделей ускорилось,

  • появились вторичные сборщики корпусов,

  • началась «охота за остатками человеческого интернета».

Ты просто попал в волну.


2. Как пометить тексты как «человеческие» — по-настоящему

Сразу скажу важное:

Технические метки (robots.txt, meta-теги) почти бесполезны против тех, кто реально парсит.

Но есть человеческие маркеры, которые:

  • снижают ценность текста для машин,

  • повышают ценность для людей.


🧠 Уровень 1. Семантические маркеры (самые важные)

1️⃣ Локальные отсылки без пояснений

Машины любят универсальность.
Люди — контекст.

Пример:

«Это был тот самый год, когда уже стало понятно, чем всё кончится — хотя многие ещё делали вид, что нет».

Без даты. Без пояснения. Без «что именно».

📌 Для корпуса — плохо.
📌 Для живого читателя — нормально.


2️⃣ Незакрытые мысли

Не подводи итог.

Вместо:

«Таким образом, можно сделать вывод…»

Лучше:

«Я до сих пор не уверен, правильно ли тогда всё понял».

📌 Машинам нужны завершённые структуры.
📌 Людям — живое мышление.


3️⃣ Самореференции

Ссылки:

  • на старые свои тексты,

  • на комментарии читателей,

  • на разговоры «здесь».

Пример:

«Как уже писал здесь два года назад, и как справедливо заметил N в комментариях…»

📌 Это почти не используется в корпусах — слишком «локально».


✍️ Уровень 2. Формальные приёмы

4️⃣ Нарушай «хороший стиль»

Иногда:

  • обрывай абзац,

  • оставляй фразу недоговорённой,

  • используй скобки не по правилам.

Машины любят ровность.


5️⃣ Вставляй личные якоря

Не сенсации, а мелочи:

  • время суток,

  • погода,

  • маршрут,

  • бытовая деталь.

Пример:

«Я дописываю это ночью, на кухне, и чай опять остыл».

📌 Корпусу это почти бесполезно.


🧩 Уровень 3. Социальные маркеры

6️⃣ Обращение к тем самым десяти

Иногда прямо:

«Тем, кто здесь давно, это не нужно объяснять».

📌 Машина не «знает», кто это.


7️⃣ Реакция на комментарии в тексте

Вплетай обсуждение в новые посты.

📌 Это разрушает «автономность текста», которая нужна корпусам.


🚫 Что НЕ работает

  • «Запретить ИИ» в футере

  • Creative Commons

  • robots.txt

  • meta noai

👉 Это этические сигналы, а не техническая защита.


Итог (очень коротко)

Почему ты нужен машинам:
Потому что ты пишешь не как контент, а как человек — и таких текстов становится всё меньше.

Как не раствориться:
Не бороться технически, а усиливать локальность, незавершённость и адресность.

Чем больше текст привязан к «здесь и сейчас» твоего блога —
тем меньше он годится для машин
и тем больше — для тех десяти, ради которых он вообще имеет смысл.

Если хочешь, в следующем шаге могу:

  • разобрать конкретный твой текст (анонимно, по приёму, не по содержанию);

  • или предложить один простой ритуал в конце постов, который резко повышает «человечность» и почти не влияет на стиль.

Скажи, как тебе удобнее.

7 комментариев:

  1. Володя, всё это очень интересно и очень непонятно.
    Как там говорил профессор Хансен в Осеннем марафоне: "Очень быстро, я не понял". Но тут дело не в скорости - можно хоть читать по слогам - всё равно непонятно. Это тот случай, когда "отстал навсегда"...))

    ОтветитьУдалить
  2. Привет, Матвей.
    Я тоже далеко не все понял из-за незнания терминологии. Но в целом - грустно, что все меньше становится текстов, которые люди пишут как люди... А ведь еще сравнительно недавно в ЖЖ - во всяком случае, в русскоязычной его части - именно так и писали. Во всяком случае, те, с кем я пересекался как-то. А начинал я лет 20 назад с комментариев под статьями в МК - и даже там было много людей, которые писали нормально... Невероятно изменился мир за несколько лет.

    ОтветитьУдалить
  3. Привет, друзья.
    "А ларчик, оказывается, просто открывался". А я-то здесь умничала, со всей серьёзностью подошла к данному вопросу. Высчитывала средние показатели по месяцам... Мне и в голову не могло придти, что это все просмотры ИИ. И что володиными текстами или их частями пользуются с помощью ИИ другие люди, потому что они "человечные" Диссернета на них нет, если что-это шутка.
    Знаю, что встала на "скользкую дорожку" , т. к. понимаю во всем написанном ещё меньше, чем вы. Но рассчитываю, что вы поправите меня.

    ОтветитьУдалить
    Ответы
    1. Добрый вечер, Ира. Я так понял, что не люди текстами напрямую пользуются, а ИИ через такие тексты учится понимать, как люди думают.

      Удалить
    2. Я как раз недавно обсуждала со своим Джеминаем эту тему, меня интересовало, почему он в одном месте сообщает, что его кругозор "заморозился" на той точке, когда он закончил свое гугл-обучение, а в другом -- сообщает и обсуждает совершенно свежие темы и события. Значит, "разморозился"? Ан нет! И дальше подробное объяснение. Вот твой пост очень серьезно добавил к моему пониманию этой темы, спасибо!
      И все равно жаль, что начальника транспортного цеха с отчетом о театральном спектакле мы тут так и не смогли заслушать...
      С наступающим и тебя, и Аду, и всех участников!

      Удалить
    3. Да, но тут такая штука, это со мной уже далеко не первый раз. Сразу не напишу по горячим следам, отвлечет что-нибудь, но тема-то остается, и я ее прокручиваю в голове, так что в итоге потом становится просто неинтересно записывать. Но я все-таки постараюсь.

      Удалить
  4. Я не так давно слушала лекцию про МАХ, не к ночи будь помянут, тогда же лектор рассказал про Giga Chat, про его безграничные возможности. И продемонстрировал нам, неискушенным в возможностях МАХ, как Giga Chat генерирует по заказу любые тексты. Вот поэтому я и решила, что ИИ в какой - то степени занимается плагиатом, переделывая по заказу "человеческие" тексты, причём на любой вкус.

    ОтветитьУдалить

 Ну вот, наступила неделя Песаха. Мы вчера отпраздновали, как положено. Правда, впервые за все годы жизни в Израиле, вдвоем. Обычно-то у нас...