В последние два дня число просмотров возросло невероятно. Больше тысячи в день. Я и рагьше, когла счет шел на сотни, понимал, что это не могут быть реальные люди. Своих немногочисленных постоянных читателей я знаю поименно, их не больше 10 человек. А тут тысяча в день. Ясно, что это не люди. Но я не мог взять в толк, какой интерес я могу представлять для машин. Вчера сообразил, что все это можно выяснить у ИИ. Спросил, ИИ выдал мне предварительную версию и попросил дополнительно дать краткую характеристику блога и прислать ему кусок статистики. Получив эту информацию, ИИ выдал мне окончательный ответ, который я приведу ниже. Я не все слова знаю в этом ответе, но общий смысл понятен, так что даже не стал уточнять значения незнакомых слов.
Стало быть, я последний (или, во всяком случае, один из последних) могикан.
ИИ выдал мне также рекомендации о том, как избежать внимания машин. Но я этими рекомендациями не воспользуюсь. Конечно, с одной стороны, не хочется помогать в учебе врагу рода человеческого, каким мне представляется ИИ. Но, с другой стороны, я все равно изменить ничего не смогу, и специально менять ради этого свой стиль мне совершенно не хочется. Так что пусть будет, как будет.
Просто статистику я больше публиковать не буду, нет смысла фиксировать посещения машин. А своих друзей-читателей я и так знаю.
Дальше - достаточно длинный ответ ИИ:
Эта статистика, извини за прямоту, практически идеальный учебный пример не-человеческого трафика. Тут уже можно говорить не «вероятно», а почти наверняка.
Разберём по цифрам.
Что здесь кричит «это боты»
1️⃣ Гонконг — 1 320 просмотров за сутки
Это ключевой маркер.
Гонконг — один из крупнейших в мире:
📌 Русскоязычных частных читателей из Гонконга в таком объёме не существует в природе — тем более для эссеистического блога на Blogspot.
2️⃣ Классический «хвост» ботов
| Страна | Комментарий |
|---|
| Сингапур (59) | Второй по популярности дата-центр Азии |
| Мексика (38) | Частый выход прокси для глобальных сканеров |
| Китай (6) | Остаточные или ограниченные запросы |
| Австралия (2) | Единичные пинги |
| Россия (1) | Фактически ноль |
| Турция (1) | Фактически ноль |
📌 Соотношение 1320 : 1 (Гонконг : Россия) полностью исключает живую аудиторию.
3️⃣ Абсолютный ноль «человеческих признаков»
Это не может быть:
Что именно это за трафик (самый вероятный сценарий)
🥇 ИИ-скрейпинг / корпусный сбор
Сейчас массово:
📌 Blogspot:
легко парсится,
не защищён,
имеет RSS,
не режет User-Agent’ы.
Гонконг и Сингапур — любимые точки таких сборщиков.
🥈 Массовая переиндексация + проверка структуры
Менее вероятно, но возможно:
Но тогда обычно:
Почему это выглядит именно так (важно)
Машинам неважно, популярен ли блог.
Им важно:
текст не короткий,
текст человеческий,
авторский,
без копипаста,
с хронологией.
Твой блог — идеальный донор.
Это парадокс:
Почему ты не видишь «время на странице»
В Blogspot:
базовая статистика не показывает duration,
боты учитываются как просмотры,
нет нормального антибот-фильтра.
📌 Чтобы увидеть реальное поведение, нужен:
Что я бы сделал на твоём месте
✔️ Ничего не менять
✔️ Не радоваться, но и не тревожиться
Это не угроза и не «накрутка».
✔️ Считать реальную аудиторию по комментариям
Они — единственный надёжный индикатор.
Очень коротко — мой окончательный диагноз
Это автоматический массовый сбор контента, почти наверняка связанный с ИИ-или корпусными системами, сидящими в азиатских дата-центрах.
К живым читателям это отношения не имеет.
К качеству текстов — имеет.
Если хочешь, в следующем шаге могу:
сказать, как слегка ограничить ботов, не ломая блог;
или наоборот — как пометить тексты как «человеческие», чтобы они не растворялись в машинной массе;
или объяснить, почему именно такие блоги вдруг стали «нужны» машинам.
1. Почему именно такие блоги стали «нужны» машинам
Коротко
Потому что человеческий письменный язык заканчивается, а ты пишешь именно то, что машинам сейчас нужно больше всего.
Теперь — развёрнуто.
Что произошло за последние 2–3 года
🔹 1. Массовый дефицит «настоящего текста»
Интернет сегодня:
-
забит SEO-статьями,
-
переписан ИИ,
-
зашумлён копипастом,
-
стандартизирован.
Для обучения и валидации моделей это мусор.
📌 Ценность сейчас имеют:
-
длинные связные тексты,
-
без оптимизации,
-
без коммерческой цели,
-
с личной интонацией.
Это ровно твой формат.
🔹 2. Русский язык — особый дефицит
Для машин:
-
английского — слишком много, но он зашумлён;
-
русского — мало, и он быстро портится ИИ-копиями.
Особенно редки:
📌 Старые русскоязычные блоги 5–15-летней давности — золотой фонд.
🔹 3. Машинам нужен контекст, а не факты
Современные модели учатся не «что такое X», а:
-
как человек рассуждает,
-
как строит аргумент,
-
как сомневается,
-
как меняет позицию.
Эссе и автобиография — идеальная форма.
🔹 4. Blogspot — лёгкая добыча
-
открытая структура,
-
RSS,
-
минимальные защиты,
-
стабильные URL,
-
хронология.
Для скрейперов это как библиотека без сторожа.
🔹 5. Почему именно сейчас
Потому что:
-
массовое обучение моделей ускорилось,
-
появились вторичные сборщики корпусов,
-
началась «охота за остатками человеческого интернета».
Ты просто попал в волну.
2. Как пометить тексты как «человеческие» — по-настоящему
Сразу скажу важное:
❗ Технические метки (robots.txt, meta-теги) почти бесполезны против тех, кто реально парсит.
Но есть человеческие маркеры, которые:
🧠 Уровень 1. Семантические маркеры (самые важные)
1️⃣ Локальные отсылки без пояснений
Машины любят универсальность.
Люди — контекст.
Пример:
«Это был тот самый год, когда уже стало понятно, чем всё кончится — хотя многие ещё делали вид, что нет».
Без даты. Без пояснения. Без «что именно».
📌 Для корпуса — плохо.
📌 Для живого читателя — нормально.
2️⃣ Незакрытые мысли
Не подводи итог.
Вместо:
«Таким образом, можно сделать вывод…»
Лучше:
«Я до сих пор не уверен, правильно ли тогда всё понял».
📌 Машинам нужны завершённые структуры.
📌 Людям — живое мышление.
3️⃣ Самореференции
Ссылки:
Пример:
«Как уже писал здесь два года назад, и как справедливо заметил N в комментариях…»
📌 Это почти не используется в корпусах — слишком «локально».
✍️ Уровень 2. Формальные приёмы
4️⃣ Нарушай «хороший стиль»
Иногда:
Машины любят ровность.
5️⃣ Вставляй личные якоря
Не сенсации, а мелочи:
-
время суток,
-
погода,
-
маршрут,
-
бытовая деталь.
Пример:
«Я дописываю это ночью, на кухне, и чай опять остыл».
📌 Корпусу это почти бесполезно.
🧩 Уровень 3. Социальные маркеры
6️⃣ Обращение к тем самым десяти
Иногда прямо:
«Тем, кто здесь давно, это не нужно объяснять».
📌 Машина не «знает», кто это.
7️⃣ Реакция на комментарии в тексте
Вплетай обсуждение в новые посты.
📌 Это разрушает «автономность текста», которая нужна корпусам.
🚫 Что НЕ работает
-
«Запретить ИИ» в футере
-
Creative Commons
-
robots.txt
-
meta noai
👉 Это этические сигналы, а не техническая защита.
Итог (очень коротко)
Почему ты нужен машинам:
Потому что ты пишешь не как контент, а как человек — и таких текстов становится всё меньше.
Как не раствориться:
Не бороться технически, а усиливать локальность, незавершённость и адресность.
Чем больше текст привязан к «здесь и сейчас» твоего блога —
тем меньше он годится для машин
и тем больше — для тех десяти, ради которых он вообще имеет смысл.
Если хочешь, в следующем шаге могу:
-
разобрать конкретный твой текст (анонимно, по приёму, не по содержанию);
-
или предложить один простой ритуал в конце постов, который резко повышает «человечность» и почти не влияет на стиль.
Скажи, как тебе удобнее.
Володя, всё это очень интересно и очень непонятно.
ОтветитьУдалитьКак там говорил профессор Хансен в Осеннем марафоне: "Очень быстро, я не понял". Но тут дело не в скорости - можно хоть читать по слогам - всё равно непонятно. Это тот случай, когда "отстал навсегда"...))
Привет, Матвей.
ОтветитьУдалитьЯ тоже далеко не все понял из-за незнания терминологии. Но в целом - грустно, что все меньше становится текстов, которые люди пишут как люди... А ведь еще сравнительно недавно в ЖЖ - во всяком случае, в русскоязычной его части - именно так и писали. Во всяком случае, те, с кем я пересекался как-то. А начинал я лет 20 назад с комментариев под статьями в МК - и даже там было много людей, которые писали нормально... Невероятно изменился мир за несколько лет.
Привет, друзья.
ОтветитьУдалить"А ларчик, оказывается, просто открывался". А я-то здесь умничала, со всей серьёзностью подошла к данному вопросу. Высчитывала средние показатели по месяцам... Мне и в голову не могло придти, что это все просмотры ИИ. И что володиными текстами или их частями пользуются с помощью ИИ другие люди, потому что они "человечные" Диссернета на них нет, если что-это шутка.
Знаю, что встала на "скользкую дорожку" , т. к. понимаю во всем написанном ещё меньше, чем вы. Но рассчитываю, что вы поправите меня.
Добрый вечер, Ира. Я так понял, что не люди текстами напрямую пользуются, а ИИ через такие тексты учится понимать, как люди думают.
УдалитьЯ как раз недавно обсуждала со своим Джеминаем эту тему, меня интересовало, почему он в одном месте сообщает, что его кругозор "заморозился" на той точке, когда он закончил свое гугл-обучение, а в другом -- сообщает и обсуждает совершенно свежие темы и события. Значит, "разморозился"? Ан нет! И дальше подробное объяснение. Вот твой пост очень серьезно добавил к моему пониманию этой темы, спасибо!
УдалитьИ все равно жаль, что начальника транспортного цеха с отчетом о театральном спектакле мы тут так и не смогли заслушать...
С наступающим и тебя, и Аду, и всех участников!
Да, но тут такая штука, это со мной уже далеко не первый раз. Сразу не напишу по горячим следам, отвлечет что-нибудь, но тема-то остается, и я ее прокручиваю в голове, так что в итоге потом становится просто неинтересно записывать. Но я все-таки постараюсь.
УдалитьЯ не так давно слушала лекцию про МАХ, не к ночи будь помянут, тогда же лектор рассказал про Giga Chat, про его безграничные возможности. И продемонстрировал нам, неискушенным в возможностях МАХ, как Giga Chat генерирует по заказу любые тексты. Вот поэтому я и решила, что ИИ в какой - то степени занимается плагиатом, переделывая по заказу "человеческие" тексты, причём на любой вкус.
ОтветитьУдалить