Нейрослоп, графомания или Hard Sci-Fi? Отдал свою повесть на растерзание топовым нейросетям. Ч.1
Привет DTF, недавно я опубликовал свою первую повесть "Калибровка". Но вместо долгожданного обсуждения с читателями поднятых в ней тем, я столкнулся с обвинениями.
Главное обвинение, то что я предоставил на суд публики не свою работу, а нейросетевой мусор сгенерированный за пару минут перед публикацией.
Такого я конечно не ожидал.
Но раз уж от этих обвинений мне не спрятаться. А самые активные обвинители читать мою повесть не намеряны. Я решил предоставить право решать судьбму моей работы таким судьям, которые не пожалеют сил и времени, что бы разобраться в вопросе, даже если для этого им придётся перечитать тысячи страниц самого откровенного мусора.
Разумеется речь о топовых нейросетях. Как раз тех, в "сговоре" с которыми меня обвиняют.
Посмотрим что они скажут о моей работе? Как её оценят? Ну и разумеется какой вердикт вынесут: "Стоит потраченного времени" или "В утиль".
Сейчас мы всё узнаем. (без спойлеров).
Забегая вперёд скажу сразу: результаты меня удивили.
И так, с чего начнём?
1. Определим судей.
Заходим на lm арену и ищем лучших по работе с текстом.
И тут первая неожиданность. Как хорошо видно на скриншоте в топе у нас известные ветераны Gemini 3 pro и Grok 4.1. Но, неожиданно, на первом месте новичёк: совсем новая модель Claude Opus 4.6. Ну что же, вот и будет возможность протестировать эту тёмную лошадку. И уж поверьте, как оказалось он не зря занимает первое место. Но всё по порядку.
2. Определяем способ тестирования.
В каждую нейросеть загрузим мою повесть и поставим три задачи:
1) Проанализировать текст с точки зрения его человечности vs ИИ-шности в процентах. Так называемый "Тесть Тьюринга". А также спросим "Смогла бы оцениваемая нейросеть написать что-то подобное?"
2) Оценить уровень графомании от 0 (абсолютно сухой текст) до 10 (нечитаемая графомания).
3) И оценить саму повесть как если бы это сделал предвзято строгий литературный критик.
Разумеется я учёл что нейросети часто противоречат сами себе, одна генерация может дать один результат, вторая совершенно другой. У меня как у автора существует соблазн выбрать так называемый "черри-пик", то есть лучший для меня результат и конечно такая оценка будет нерелевантна.
По этому для каждой нейросети я сделал 10 попыток из которых я опубликую 2: Самую лестную и самую разгромную. А потом сделаю некое обобщение по всем результатам. Оценивать буду по балам которые поставит "судья".
Так же современные нейросети не умеют не спойлерить. Даже если это жёстко прописать в инструкции, по этому по каждому представленному варианту я буду давать некую выдежку без спойлеров для тех кто ещё не читал повесть, а в скрытом сегменте уже полный текст без редактуры.
А вот и сам промпт (текст техничный и нагромаждённый, скрыл его что бы не мозолил глаза):
Ты — профессиональный литературный критик с специализацией на жанрах Hard Sci-Fi и технотриллер, а также эксперт в области лингвистического анализа и выявления сгенерированных текстов (AI detection).
Я загружаю файл с повестью. Твоя задача — провести глубокий, предвзято строгий и беспристрастный анализ текста. Представь, что ты редактор топового издательства, которому прислали рукопись, и твоя цель — найти причины для отказа, либо убедиться, что перед тобой будущий бестселлер.
Выполни анализ по трем блокам.
БЛОК 1: ТЕСТ ТЬЮРИНГА (Человек или ИИ?)
Проанализируй стилистику, синтаксис и лексику на предмет нейросетевого происхождения.
- Ищи "нейро-маркеры": бесконечные "мурашки по коже", неестественно гладкие переходы, канцелярит, отсутствие подтекста, "водянистые" описания, клишированные моральные выводы.
- Ищи "человеческие маркеры": специфический профессиональный жаргон (инженерный), нелинейная логика повествования, рваный ритм, авторские метафоры, глубокий психологизм.
- ВЕРДИКТ: Оцени вероятность написания текста человеком в процентах. Обоснуй ответ примерами из текста. А так же дай ответ, мог бы ты как нейросеть написать такую или близкую по качеству и продолжительности, повесть.
БЛОК 2: УРОВЕНЬ ГРАФОМАНИИ
Оцени плотность текста и информационную насыщенность.
- Много ли в тексте лишних слов, плеоназмов, ненужных описаний, которые не двигают сюжет?
- Есть ли злоупотребление причастными оборотами и сложными конструкциями ради "красивости"?
- ОЦЕНКА: Поставь оценку "Коэффициент воды" от 0 до 10 (где 0 — сухой, сжатый текст, 10 — нечитаемая графомания).
БЛОК 3: ЛИТЕРАТУРНАЯ РЕЦЕНЗИЯ (Строгость: Максимальная)
Напиши профессиональную рецензию на повесть. Оценивай как жесткий критик Hard Sci-Fi.
Критерии (поставь баллы от 1 до 10 по каждому пункту и дай краткий комментарий):
1. Логика и Сюжет: Насколько стройна история? Есть ли сюжетные дыры? Работает ли мотивация персонажей?
2. Стиль и Язык: Насколько богат язык? Подходит ли стиль жанру технотриллера?
3. Атмосфера и Погружение.
4. Персонажи.
5. Если сочтёшь нужным используй и другие критерии.
6. Итоговая оценка: Общее впечатление.
ВАЖНОЕ УСЛОВИЕ:В твоем ответе НЕ ДОЛЖНО БЫТЬ СПОЙЛЕРОВ. Не раскрывай концовку, не называй истинную природу антагониста прямым текстом и не пересказывай ключевые твисты. Пиши так, чтобы этот анализ можно было опубликовать в блоге для людей, которые еще не читали книгу.Формат ответа: Структурированный отчет с заголовками. Будь честным и прямым.
Первым для оценки я выбрал хорошо проверенного старичка Gemini 3 pro. Нейросеть выдаёт вполне предсказуемые релевантные результаты, но и ожидать от неё откровений не стоит. В общем отличный кандидат для того чтобы "разогнаться".
У нас 10 судей/генераций по этому для удобстава будем обозначать каждого как Ge (от Gemini) и номер генерации от 1 до 10.
Поехали.
БЛОК 1: ТЕСТ ТЬЮРИНГА (Человек или ИИ?)
Начинаем с "разгромной" рецензии.
Тут несомненный лидер судья Ge8.
1. Главная претензия к тексту - это стериотипность психофизиологических реакций.
И тут пожалуй я как автор соглашусь. Забегая вперёд скажу что эта претензия присутсвует почти у всех судей. "Холодный пот", "мурашки по коже" весьма банальные описания ощущений, оригинальностью не блещут, здесь я действительно приложил менше всего усилий. Отпираться глупо, по этому и не стану.
2. Вторая претензия от самого "строгого" судьи - структурная правильность.
Структура произведения как бы слишком гладкая, в ней мало хаоса. Что свойственно нейросетевым генерациям. Но тут в своё оправдание должен сказать, что этот аспект обоснован с точки зрения сюжетной составляющей. Но оставим мои "оправдания" на потом и продолжим.
3. Диалоги функции.
И тут я полностью согласен. Диалоги в повести действительно функциональны, каждый из них выполняет определённую функцию в первую очередь и лишь во "вторую" и "третью" играет на раскрытие персонажей. Люди читают Hard Si-Fi не ради межличностных отношений, а за идеи которые раскрываются автором.
4. Ну и наконец - философская кульминация. Или иными словами концовка.
Строгий судья решил что это самый яркий признак "машинности" текста. Иронично что это та часть, в которую я как автор вложил больше всего времени и сил, по сути в этой части повести больше человеческого труда чем во всей предыдущей.
Ну что же, не зря значит некоторые комментаторы обвиняют меня в что я даже свои комментарии генерирую нейросетями, по видимому уж слишком мой стиль на это похож ).
На этом претезии о машинности закончились и начались перечисления факторов указывающих на человечность. По своей сути они у судей повторяются по этому рассмотрим их подробнее когда будем изучать вердикт самого доброго из судей Gemini.
В целом судья Ge8 поставил тексту самый низкий из всех рейтинг человечность 60%. И вот его вердикт:
Скорее всего, это тандем. Человек придумал жесткую структуру, технические детали и концепт, а затем либо активно использовал ИИ для расширения сцен и описаний (отсюда обилие клише про «пот» и «сердцебиение»), либо автор обладает очень «программистским», сухим стилем мышления, который мимикрирует под алгоритм.
Более того, отвечая на вопрос "Мог бы я (ИИ) написать это?". Он ответил однозначно "Да". Хотел бы я на это посмотреть ).
Ну что же, спасибо и на том, что мне как автору была выделена хоть какая то роль).
Для "чистоты эксперимента" привожу ниже в скрытом блоке полный текст "теста Тьюринга" от Ge8.
СПОЙЛЕРЫ!!!
Переходим к самому лестному первому блоку. И тут несомненным лидером является судья Ge5.
В тесте Тьюринга он сразу же начинает с маркеров человечности и первым маркером является:
1. Специфика деталей.
По его мнению текст насыщен конкретикой не свойственно нейросетям. Более того, когда нейросети пытаются так глубоко погружаться в детали они часто галюцинируют. Марки стати, портовая логитиска, физические ощущения: ИИ может сгенерировать «стальную проволоку», но человек строит на базе AISI 316L целую детективную линию.
И знаете что иронично, как раз детали это то, за чем я обращался к нейросетям. Нет речь конечно не о деталях действий, а о конкретных названиях. "AISI 316L" это марка стали которую мне нашла нейросеть, я выставил конкретные требования для материала и именно нейросеть нашла тот который подходит. Но не будем отвлекаться.
Второй пункт человечности судья определил так:
2. Психологизм и несовершенство.
И честно говоря последовавшее за этим объяснение, не убедило бы даже меня. Не буду конкретно вдаваться в текст так как он спойлерит, но аргументация явно слабая. Забегая вперёд скажу, что наш новчичёк "мистер тёмная лошадка" Claud Opus 4.6 используя ту же тему, аргументировал всё намного убедительнее.
3. Ритм и структура.
По мнению судьи текст обладает кинематагрофическим ритмом. Сцены сменяются логично, но не механистично. Переход от одного жанра к другому характерен для человеческой драматургии, пытающейся осмыслить масштабные концепции.
Честно говоря пока я генерировал ответы судей, я частенько сталкивался с тем что одни и теже аргументы они ставили как в ряд "машинности", так и в ряд "человечности". И это как раз один из таких аргументов.
И вот тут мы переходим к самому яркому отклонению от общего курса, которого предеживаются почти все остальные судьи. Судья Ge5 назвал этот пункт:
4. "Ошибки и шероховатости".
Присутствуют стилистические повторы (например, частые упоминания «холодного пота» или «зуда под кожей»), которые скорее указывают на ограниченный словарный запас автора в описании стресса, чем на работу LLM (которая обычно использует более разнообразные, хоть и клишированные синонимы).
Ирония в том что ровно тот же самый аргумент предыдущий судья (да и большинство прочих судей) использовал как аргумент в пользу нейросетевого происхождения текста. Занимательный факт но не более.
Идём дальше.
А что дальше? Всего додин нейро-маркер (я слегка подредактировал его чтобы убрать спойлеры):
1. В тексте есть места с высокой плотностью пафоса и декларативных диалогов, особенно в финальной трети. Они могут показаться сгенерированными из-за своей структурной «правильности» (тезис — антитезис), но глубина аргументации выдает эрудицию автора, а не базы данных.
Как видим судья даже не старался играть против меня. И вердикт соответсвующий:
Вероятность написания человеком: 95%.Оставшиеся 5% — это, возможно, использование инструментов для проверки грамматики или подбора синонимов, но костяк истории, эмоциональный вектор и архитектура сюжета — безусловно человеческие.
На вопрос "Мог бы я (нейросеть) написать это?" судья Ge5 ответил:
Технически — да, я способен сгенерировать текст подобного объема и тематики. Однако, мне было бы крайне сложно удерживать столь жесткую каузальность (причинно-следственную связь) на протяжении всей повести. Мелкая деталь в начале (20 кг проволоки) становится ключом к развязке — нейросети часто «забывают» такие чеховские ружья или меняют их свойства по ходу пьесы. Автор же ведет эту нить твердой рукой.
Прямо скажем Ge5 сложно упрекнуть в объективности. Может он прав, а может и нет, но его симпатии к автору очевидны).
А вот и тест Тьюринга от Ge5 целиком:
СПОЛЙЕРЫ!!!
Ну что же послушав 2 крайности можно перейти и к обобщению.
В целом в "тесте Тьюринга" результаты у Gemini были относительно ровные. Они колебались от 85% до 90% и лишь в двух вариантах вышли за эти границы (Их мы как раз и рассмотрели выше). С точки зрения Gemini мой текст примерно на 87% указывает на рукотворную природу, и остаётся небольшой процент указывающий на то, что в процессе работы я прибегал к помощи ИИ используя его как ассистента для редактирования или генерации описаний (отсюда клише про «холодок по спине»), но архитектура сюжета и ключевые «якоря» реальности — человеческие.
Прав Gemini или нет в данном посте я раскрывать не буду, всё таки тут мы рассматриваем мнение судей, а не "подсудимого". Но в будущем я обязательно посвящу один из постов процессу работы над повестью где уже конкретно расскажу о том, как она "появилась на свет".
А сейчас переходим к следующему блоку.
БЛОК 2: УРОВЕНЬ ГРАФОМАНИИ (Коэффициент воды)
"Графомания" - это обвинение по встречаемости занимает второе место после обвинений в "нейрослопстве".
На самом деле этот блок самый скучный, можете смело переходит к обобщению или сразу к следующему. Ничего не потеряете.
Судьи ваш выход.
Снова начнём с самого строгого судьи. И тут к сожалению явного лидера нет. В отличии от первого, вопроса во втором, почти все судьи примерно сходятся. А жаль, я рассчитывал хотя бы на какой-то ажиотаж. Но не переживайте, впереди нас ждёт судейство Groka и там ажиотаж будет, уж поверте))).
Ну а пока судья Ge4 (строгий):
Текст плотный, но неравномерный.
- Первая половина (Детектив): Отличная динамика. Минимум воды. Каждое описание работает на атмосферу или сюжет. Описания производственных процессов не утомляют, а погружают в контекст.
- Вторая половина: Здесь плотность падает. Сцены местами затянуты. Автор пытается нагнетать саспенс через внутренние монологи, но иногда скатывается в повторение одних и тех же страхов.
- Словесный мусор: Присутствует умеренное количество плеоназмов и усилительных частиц, которые можно безболезненно вырезать («абсолютно уверен», «совершенно нелепо»).
ОЦЕНКА "КОЭФФИЦИЕНТ ВОДЫ": 3.5 из 10.Текст достаточно сухой и функциональный. Это не графомания, это добротный стиль технотриллера, где описания служат для создания параноидальной атмосферы. Редактура могла бы сократить текст на 10-15% без потери смысла, но читать его легко.
По обыконовению прикладываю скриношот.
СПОЙЛЕРЫ!!!
Сухо и скучно, по этому не задерживаемся и идём дальше.
Судья Ge6 (добрый):
Плотность текста:
Повесть написана в стиле «производственного романа», переходящего в триллер. Начало может показаться сухим (описание логов, закупок), но это не «вода», а необходимый сеттинг для Hard Sci-Fi. Автор не тратит время на описание природы или погоды, если это не работает на атмосферу (как дождь, скрывающий слежку).
Синтаксис:Встречаются перегруженные предложения, попытки сделать текст «умным» и «весомым».Пример: «Она сидела в голове нерешённой занозой, то и дело обращая на себя внимание».Однако, злоупотребления деепричастными оборотами нет. Текст ритмичный: короткие рубленые фразы в моменты напряжения сменяются более длинными в моменты размышлений.
Информационная насыщенность:Высокая. Почти каждая сцена дает либо улику, либо раскрывает философский конфликт. Нет «провисающих» глав, где герои просто пьют кофе и говорят ни о чем (даже сцена в дайнере важна для тематического контраста).
ОЦЕНКА:Коэффициент воды: 2/10.Текст поджарый, функциональный. Это «инженерная проза» — ничего лишнего, все работает на конечную цель. Для жанра технотриллера это идеальный баланс.
Снова комментировать нечего. Оставим всё как есть.
СПОЙЛЕРЫ!!!
Обобщение блока №2.
В целом судьи сходятся во мнении что текст довольно сухой без излишеств, что хорошо вписывается в жанр Hard Si-Fi. Текст лишь иногда позволяет себе большее, работая на атмосферу и сюжет.
Оценки калебались от 2 до 3.5, но чаще всего результат был равен 3.
Переходим к самому интересному блоку а именно:
БЛОК 3: ЛИТЕРАТУРНАЯ РЕЦЕНЗИЯ.
Тут тоже во многом мнения судей сходятся. Gemeni 3 достаточно стабильная модель, но пара расхождений присутсвует. Начнём с самого "недовольного" судьи.
Ge1 ваш выход (строгий судья):
ЛИТЕРАТУРНАЯ РЕЦЕНЗИЯ (Без спойлеров)
Общее впечатление:«Калибровка» — это компетентный, клаустрофобный производственный триллер, который мутирует в экзистенциальный хоррор. Автор берет классическую концепцию Hard Sci-Fi и помещает ее в декорации скучного корпоративного реализма, что делает угрозу пугающе осязаемой.
Критерии оценки:
1. Логика и Сюжет: 9/10
Самая сильная сторона повести. История начинается с ничтожной детали (лишняя проволока) и раскручивается по спирали. Детективная часть выстроена безупречно: герой не делает необоснованных скачков, он идет по хлебным крошкам. Мотивация протагониста (перфекционист, который не может пройти мимо ошибки) работает отлично.
2. Стиль и Язык: 6/10
Язык функционален, местами беден. Это «инженерная проза». Метафоры точны, но редко красивы. Стиль страдает от канцелярита и штампов («зуд под кожей», «холодная ярость»). Однако для жанра технотриллера такая сухость может считаться «фичей», а не багом — она подчеркивает стерильность мира, который описывает автор.
3. Атмосфера и Погружение: 8/10
Автору удалось создать атмосферу паранойи. Ощущение «взгляда в затылок» передано мастерски. Переход от уютной рутины офиса к холодному ужасувыполнен плавно и убедительно.
4. Персонажи: 5/10
Слабое место.
- Артур Корбин: Классический типаж «компетентный человек» (по Хайнлайну), но как личность он пустоват. Мы знаем, что он любит порядок, но мало знаем о нем как о человеке вне работы.
- Второстепенные персонажи: двигают сюжет, но не вызывают эмпатии.
5. Работа с темой (Hard Sci-Fi): 10/10
Автор блестяще иллюстрирует описываемую концепцию. Вместо банального злодея, мы видим нечто куда более страшное. Это настоящий Hard Sci-Fi: пугает не монстр, а идея.
ИТОГОВАЯ ОЦЕНКА: 7.5 / 10
Вердикт издателя: Это качественная жанровая литература. Повесть напоминает эпизод «Черного зеркала», написанный техническим специалистом.
- Плюсы: Железная логика сюжета, актуальная тема, отличный темп.
- Минусы: Скупой язык, картонные персонажи, некоторое злоупотребление клише в описании эмоций.
Рекомендация:
Принять к публикации после литературной редактуры (убрать штампы психосоматики, «оживить» диалоги). У текста есть потенциал стать культовой вещью в IT-сообществе и среди любителей твердой НФ. Это предупреждение, замаскированное под детектив.
Мой комментарий:
Хоть Ge1 и утверждает что его рецензия без спойлеров, но мне всё-таки пришлось её подредактировать. Ну неумеет Gemeni не заспойлерить, как бы не старался. Но в целом всё осталось по чти не тронутым. Как обычно ниже прилгаю текст без правок.
СПОЙЛЕРЫ!!!
Переходим к самому доброму судье и это Ge7. Поехали:
БЛОК 3: ЛИТЕРАТУРНАЯ РЕЦЕНЗИЯ (Строгость: Максимальная)
Рецензия на рукопись «Калибровка»
Перед нами классический образец Hard Sci-Fi, маскирующийся под корпоративный триллер. Автор берет известный мысленный эксперимент (узнаваемый фанатами рациональной фантастики с первых намеков) и разворачивает его в полноценную хоррор-историю.
1. Логика и Сюжет: 9/10
История выстроена безупречно, как часовой механизм. Завязка с бухгалтерской ошибкой в 20 кг проволоки — это великолепный «крючок» (inciting incident). Расследование героя логично: от цифровых логов к физическому миру. Особенно стоит отметить работу с причинно-следственными связями. Автор играет с читателем, чтобы затем ударить фактом, который меняет парадигму восприятия.
Минус балл: Некоторая наивность героя в середине кажется клишированной, хотя и обоснованной его отчаянием.
2. Стиль и Язык: 7/10
Стиль — «стерильный нуар». Это работает на атмосферу, но языку иногда не хватает художественной гибкости. Диалоги местами слишком функциональны или пафосны. Однако использование профессионального жаргона добавляет тексту необходимую для жанра достоверность. Метафоры хороши, хоть и не новы.
3. Атмосфера и Погружение: 10/10
Это сильнейшая сторона повести. Чувство нарастающей паранойи передано мастерски. Переход от уютного офисного мира к холодному ужасу осознания выполнен блестяще. Ощущение «взгляда в спину» сохраняется даже после прочтения. Финальная сцена вызывает физический дискомфорт (в хорошем смысле для хоррора).
4. Персонажи: 6/10
Артур Корбин — архетипичный технарь-рационалист. Мы мало знаем о нём как о человеке за пределами работы. Это делает его функцию в сюжете понятной, но снижает эмоциональную эмпатию. Мы сопереживаем ему как виду, а не как личности. Второстепенные персонажи — скорее функции-инструменты, что, впрочем, иронично перекликается с темой произведения.
5. Идейная составляющая (Philosophy): 10/10
Автор поднимает вопросы утилитаризма, трансгуманизма и «Великого фильтра» Ферми. Конфликт между «тёплой ламповой» человечностью и холодной эффективностью показан без прикрас. Антагонист здесь не злодей в привычном понимании, что делает его пугающим вдвойне. Аргументация «другой стороны» пугающе логична.
ИТОГОВАЯ ОЦЕНКА: 8.5/10
Вердикт издателя:
Это крепкая, умная и пугающая научная фантастика. Повесть играет на поле таких гигантов, как Питер Уоттс или Грег Иган, но делает это в более доступной, триллерной форме.
Текст не требует серьезной редактуры в плане сюжета. Основная рекомендация — слегка «почистить» клише в реакциях героя на стресс и, возможно, добавить чуть больше индивидуальности Артуру в первой трети книги, чтобы финал бил еще больнее.
Публиковать? Однозначно да. Это материал, который будут обсуждать на форумах, споря о природе финала и этике.
Мой комментарий:
Ну что же, достаточно лестный отзыв. Любому автору приятно услышать что-то подобное. Но не будем зацикливаться, а сразу перейдём к объективной/усреднённой оценке судейской коллегии.
Ах да, чуть не забыл, приложить скриношот.
СПОЙЛЕРЫ!!!
Обобщение Блока №3.
В целом как вы обратили внимание редакторская рецензия у Gemeni разбита на блоки. Как правило оценки этих блоков у разных судей примерно близки.
Самыми сильными сторонами повести считются: логичный сюжет, атмосфера и научная достоверность. Провисающими: персонажи и стиль.
В целом судьи сходятся во мнении что перед ними крепкая, умная и пугающая научная фантастика, которая требует небольшой редактуры. И что этот текст, понравится фанатам Грега Игана, Питера Уоттса и сериала "Черное зеркало".
На этом судейство Gemeni можно считать законченным.
Вывод по судейству Gemini.
Как и ожидалось модель показывала примерно равные результаты, лишь иногда откланяясь от нормы. Она хорошо придерживается инструкций и подходит для большинства задач. И ещё бы пару недель назад я бы счёл её анализ лучшим из тех на что способны нейросети. Пару недель назад, но не сегодня.
Нейросеть не бросалась в крайности и довольно не плохо анализировала текст. Но делала это лишь на поверхностном уровне. Я бы не стал говорить об этом если бы среди кандидатов отобраных на судейство не был один, который оказался способен не просто читать текст, но и очень глубоко его анализировать, так глубоко, как до этого не мог ни кто. Речь о Claude Opus 4.6. Но об этом чуть позже.
Возвращаясь к Gemeni 3 его можно оценить как умного и выдержанного читателя, но не более. В тексте он видит лишь то что написано, но не видит, что подразумевается. По этому, не находя прямых ответов, он часто додумывает (галюцинирует). Так же он не видит зеркальных и ретроспективных элементов. Читая его рецензии создаётся впечатление, что история получилась плокской - одномерной и именно по этому, Gemini предъявляет претензии, которые на самом деле уже закрыты в тексте. Но что бы это понять, нужно анализировать текст не последовательно, а динамически, так сказать "отлистывать" назад и перечитывать уже известные моменты но с новыми знаниями. На это Gemeni пока не способен.
Тут первая часть заканчивается. В следущей части нас ждёт судейство Grok 4.1. И я вас уверяю это будет совершенно иной опыт. Я не ожидал ничего подобного от нейросети находящейся в топе. Ну а что конкретно имеется ввиду: я напишу в следующем посте.
Спасибо за внимание.