Подключил новую топовую нейронку — а она оказалась хуже старой: медленная, дорогая, бесючая. Полез разбираться и выяснил дичь: у производителя ДВА мануала для двух своих моделей, и советы в них противоположные. Переписал свои запросы по мануалу — железяка заработала как надо. В конце поста — файл с готовыми промптами, забирай.
Короче, история. Я в работе постоянно гоняю AI-агентов — это когда нейронка не просто отвечает на вопросы в чатике, а сама ковыряется в файлах, пишет код, проверяет себя и приносит результат. И вот выходит новая модель, Claude Fable 5. Все пишут: мощь, прорыв, рекорды порваны. Ну я и переключился в первый же день.
И знаешь что? Она меня бесила.
Старая модель (Opus 4.8) делала задачу быстро и по делу. Новая — думала. Долго думала. Очень долго. Я полез в логи: на одну задачу она сожгла 200 тысяч токенов за полтора часа. Токены — это, грубо говоря, валюта, которой платишь за каждое слово, которое нейронка прочитала или написала. То есть новая «умная» модель работала дольше, стоила дороже, а на выходе — то же самое, только с философскими отступлениями. Перепроверяла то, что я ей уже сказал. Строила планы там, где надо было просто взять и сделать.
Неделю я думал, что модель сырая. Ну выпустили рано, бывает, подождём обновлений.
А потом случайно открыл документацию производителя. И выпал.
Одна контора — два мануала. И они противоречат друг другу
Оказывается, у Anthropic (это которые Claude делают) теперь отдельная инструкция по общению с КАЖДОЙ моделью. Не общая «как писать запросы нейросети», а персональная: вот мануал для Opus 4.8, вот мануал для Fable 5. Я прочитал оба подряд. Местами это выглядит как издевательство:
Сама не любит раздавать подзадачи помощникам — надо подталкивать: «делегируй, не стесняйся»
Любит порассуждать вместо того, чтобы открыть файл и посмотреть
Режим мощности по умолчанию — на максимум
Раздаёт подзадачи направо и налево — надо, наоборот, сдерживать
Если дать ей подробную пошаговую инструкцию — работает ХУЖЕ. Документация прямо пишет: старые наработки «слишком детальные, удаляйте»
Режим мощности — средне-высокий, на максимуме начинает страдать перфекционизмом
Прочитай ещё раз второй пункт про Fable. Мои старые промпты — подробные, выверенные, годами шлифованные — новую модель ДУШИЛИ. Это как дать опытному мастеру инструкцию «возьми отвёртку в правую руку, поверни по часовой»: он либо обидится, либо начнёт выполнять буквально и потратит час там, где нужно пять минут.
Я переписал свои запросы по мануалу: убрал пошаговщину, оставил только цель, критерии готовности и границы. И железяка, которая неделю меня бесила, внезапно заработала так, как обещали в рекламе. Быстро, чётко, без философии.
Нет, осадочек остался, конечно. Но виноват был я, а не робот.
Самое смешное из этих мануалов
Пока читал документацию, собрал коллекцию перлов. Это всё реальные официальные рекомендации, не шутки:
«Не показывайте модели счётчик оставшейся памяти». У Fable 5 есть особенность: если она видит, что рабочая память заканчивается, начинает нервничать — комкает работу, предлагает «давайте я подведу итоги и закончим». Лечится двумя способами: спрятать от неё счётчик или написать ей «памяти у тебя полно, работай спокойно». Прятать часы от сотрудника, чтобы не дёргался. Дожили.
Кремовый дизайн. У Opus 4.8 есть любимый стиль: если попросить её сделать сайт и не уточнить дизайн — она нарисует кремовый фон, изящный шрифт с засечками и терракотовые акценты. Всегда. Даже если ты просил панель управления для завода. Причём фразой «не надо кремового» не лечится — она просто выберет другой любимый цвет и будет рисовать его. Помогает только конкретное ТЗ по цветам.
Заблокировала слово «привет». У новой модели строгие фильтры безопасности, и в первые дни они так лютовали, что одному бедолаге заблокировало сессию, в которой было одно слово — «hello!». Фильтр сработал не на сообщение, а на служебную обвязку. Производитель потом извинился: мол, перестарались с настройкой, простите.
«Не просите её объяснить ход рассуждений». Раньше это был классический приём: «объясни, как ты пришла к выводу». На новой модели такая просьба официально считается попыткой выудить внутреннюю кухню — и нейронка отказывается отвечать. У меня эта фраза годами жила в рабочих шаблонах. Пришлось искать по всем файлам и вычищать.
А у конкурентов вообще третий путь
У OpenAI (это которые ChatGPT) всё по-другому — но не так, как ты ждёшь.
Они пошли инженерным путём: вместо «уговаривайте модель текстом» вынесли главные настройки в отдельные крутилки. Сколько думать — крутилка. Насколько подробно отвечать — крутилка. Хочешь, чтобы модель писала короче, — не пишешь ей «будь лаконичнее, умоляю», а буквально ставишь параметр «краткость: высокая». Звучит как мелочь, а на деле — другая философия: у Anthropic ты воспитываешь сотрудника словами, у OpenAI — выставляешь ему настройки в админке.
Но в одном обе конторы сошлись, и это главная новость: обе официально пишут — сменил модель, переписывай запросы заново. Старые не переноси. То, что лечило прошлую модель, калечит новую.
(Отступление для тех, кто верстал сайты в нулевые: помнишь отдельные костыли под IE6, под Оперу, под ранний Файрфокс? Вот. Мы вернулись туда же, только теперь костыли — под нейронки. Я-то думал, что индустрия научилась. Ха.)
Что с этим делать простому человеку
Если ты пользуешься нейронкой раз в неделю через чатик — вообще забей, тебя это всё не касается. Спрашивай как спрашивал.
А вот если гоняешь агентов, пишешь рабочие шаблоны запросов или строишь что-то поверх API — три правила, которые я вынес:
Пиши цель, а не процесс. Не «сначала открой файл, потом проверь то, потом это», а «вот результат, который мне нужен, вот как проверить, что он достигнут». Современные модели планируют лучше, чем твоя пошаговая инструкция.
Убери капс и угрозы. Все эти «ОБЯЗАТЕЛЬНО!!», «НИКОГДА не делай» — наследие старых тупых моделей. Новые слушаются с первого раза, а от криков начинают перегибать в другую сторону.
Новая модель — новые запросы. Не тащи старые шаблоны. Прочитай мануал конкретной модели (да, теперь у каждой свой) и собери заново. Полчаса вложений — недели сэкономленных нервов.
Где я всё равно плююсь
Чтобы не было ощущения, что я тут рекламирую светлое будущее. Новая модель всё ещё медленная — ходы по несколько минут это норма, и к этому надо привыкать. Фильтры безопасности иногда срабатывают на ровном месте. А ещё мне теперь приходится держать ТРИ набора шаблонов: под Opus, под Fable и под ChatGPT. Это решаемо, но бесит. Чувствую себя коллекционером инструкций к утюгам.
И да, минусы прилетят от тех, кто скажет «нечего вообще с этими нейронками возиться». Понимаю. Но они уже возят половину моей рутины, так что выбора особо нет.
Забирай готовое
Я свои переписанные промпты выложил файлом в телеграм-канал: базовый шаблон, надстройки под Fable 5 и Opus 4.8 и заготовки для раздачи задач агентам — бери и адаптируй под себя. Канал: t.me/maslennikovigor, файл прикреплён к последнему посту.
Вопросы и «у меня не так» — в комменты или в телегу @maslennikovig, отвечаю сам.