ploughlike_elk | (no subject)

Быстро же я подобрался к пределу возможностей ИИ. Разочарован - это мягко сказано...

Реализовать на нем полноценную систему администрации автосервиса не выходит - даже автосервиса из одного механика. Уже сколько времени бьюсь, снижая требования к системе все ниже и ниже - и все равно не работает.

Вот вам пример простейшей задачи: в сервис приходит машина, определи какое ТО на ней уже сделано по записям в базе данных и какое, соответственно, клиенту надо напомнить что уже давно пора, какое на подходе, а какое пусть не предписано еще официально, но было бы полезно сделать если хочется чтобы машина жила подольше. Я уж даже не задаю задачу "свяжись с клиентом и/или другими гаражами и выясни у них что и когда на машине уже делали", да бог с ним, люди тоже такое не делают. Но, блядь, вот тебе база данных машин клиентов, вот тебе база данных всех работ сделанных на этих машинах - разберись и хотя бы составь сообщение которое можно послать клиенту.

И нет, ИИ этого не может. Машину четко не определяет - и не соображает где и какие уточняющие вопросы надо задать если чего не ясно. Если даже поправишь - исправления не запоминает. Данные берет откуда попало, а если не находит - просто изобретает. Наконец, чем больше его обучаешь - тем больше начинает ошибаться и глючить! И это все при огромном расходе токенов, т.е. ИИ-помощник который все равно остается тупой по цене быстро приближается к помощнику живому. Более того, мои собственные затраты времени на дрессировку робота становятся уже таковы что никакого роста эффективности работы нет, наоборот она падает!

О том чтобы он мне сметы на ремонт считал, держал "в голове" контекст коммуникации с клиентами, отвечал на их сообщения или коммуницировал с поставщиками и вовсе речи не идет - ИИ даже близко этого не вытягивает.

Пределы использования по сути получаются такие:

1. Переформатирование и переписывание текстов или сообщений в нужном ключе, языке и стиле - то есть изложение моих мыслей и соображений в той или иной форме. Иногда из этого вырисовываются действительно новые и свежие идеи или быстрее разворачиваются те что уже были, но сам ИИ этого не заметит, он не осознает что случайно сгенерировал что-то умное - это я это вижу и осознаю.

2. Написать несложный программный код для выполнения той или иной одноплановой задачи. Только в спарке с человеком и только пока код не усложняется выше какого-то предела, не шибко-то и высокого. Запрос вида "напиши мне компьютерную игру или мультимедийный продукт на заданную тему" можете даже не пытаться задавать.

3. Быстрый, но ненадежный и ограниченный поиск в интернете. Полноценный поиск чего-то нужного ИИ не тянет.

4. Генерация всякой бесполезной хрени: картиночек, музончика, видосиков и бессмысленных текстов.

Ну и все. А шуму-то было, а страхов... Короче, если вас все ж таки заменили на ИИ, то немного же вы стоили в плане разумности и интеллекта необходимого для вашей работы. Быть успешно замененным на ИИ это реально жесткое оскорбление.

Flat | Top-Level Comments Only

From:

theyregonnapay

made my day, чудик. а как щеки надувал, 'может тебе ключи от квартиры..'
--
btw, вопрос то в том, зачем ты бессмысленно лгал про свои успехи чудесного использования; это ведь тебе сталo очевидно не вчера.

Edited Date: 2025-12-31 04:43 pm (UTC)

From:

sobriquet9

Как в анекдоте про собаку, которая играет в шахматы. "Нифига она не умная, счёт 3:2 в мою пользу".

Что умеет ИИ не так важно, важно, что про это думает начальство. Если оно думает, что можно персонал уволить и заменить ИИ, то уволит. А что за ИИ надо всё потом переделывать, это будут уже проблемы оставшихся.

From:

ploughlike_elk

Дело не в "умности", а в ограниченности круга задач который можно решать с использованием ИИ. Этот круг оказался сильно меньше чем хотелось бы.

From:

sobriquet9

Я к тому что сам факт, что радиус этого круга ненулевой, должен быть удивителен. Потому что там внутри по сути очень простой механизм, хоть и натренированный на большом количестве данных.

Лингвисты работали много лет над тем, чтоб хоть один человнческий язык понять, а эта железка научилась говорить на всех языках одновременно без ошибок совершенно внезапно и непонятным образом. И даже решать задачки, где раньше считалось что длоя этого нужно думать. Теперь приходится переопределять, что такое думать.

From:

ploughlike_elk

Ненулевой, совершенно верно. Я и не говорю что технология бесполезная - не просто полезная, но и незаменимая уже. Но увы, дальше гладкого чесания языком ее возможности не идут, а жаль.

From:

pan_netnet

ну вот и придумали создать стат. модели языка по которым идиот угадывает слово, которое должно идти после, рукодствуясь статичтической вероятностью. к дманию это имееет такое е отношение как песрчные куличи в песочнице к свежему круасану.

думание предпогагает, как миннимум, рефлекцию ощщений от свобвенный огронов восприятия посредством языка как единственного инстумента мышления. а идиот целиком и полностью живет в языковой реальности. вернее даже не в ней, а в совокупности вероятностей выпадния того или иного слова. на реальность ему абсллютно похуй.

From:

sobriquet9

Выплеснули с водой ребёнка. Статистику придумали не год назад, статмодели языка существовали в разном виде лет сто как, если не больше.

То, что embedding плюс нейронка с LTSM и attention может сделать намного больше, чем угадать следующее слово, это был реальный и нехилый прорыв в научно-техническом прогрессе. Таких уже давно не было.

From:

pan_netnet

это словоблудие. статистика разная бывает. средняя зп, мдианная и модальная - все три есть правоверные статистические показатели. только вот картину они риуют разную. и надо иметь немалую инфуицию со знанием исседлкемого объекта шоб понять какой из показателей лучше описывает реальную картину.

то шо немчура в 19 не смогла создать статмодель, которая бы генерила более-менее правдивый текст(если не заглубляться в бред, который идиот выдает), то не значит шо их потоки создали шота принципиально новое. те паче думающее.

From:

theyregonnapay

только что чуть не превратил в кирпич телефон за штуку. ставлю ром с даунгрейдом с 14 на 13. две модели не смогли написать скрип просто взяв из flashfile.xml названия файлов в последовательном порядке, с середины нацахли менять порядок.там двух десятка файлов.
и эти гнойные пидарасы строят цифровой гулаг. просто на их рожи посмотреть - советские комсомольские функционеры вроде Ходора, просто светлые гении с честью и совестью.
вашим бы унять этих козлов вроде карпа, финка и прочих кушнеров. последний кстати и на вакцинках поднимался в том числе.

From:

ploughlike_elk

Цифровой гулаг в их исполнении я ожидаю просто с нетерпением!

From:

dragonru

Вообще-то не так. Внутри там очень сложный механизм. Но образовался он сам по себе в результате простых воздействий.

From:

theyregonnapay

менеджмент думает по-другому четко понимая, что завтра и его собственник выгонит на мороз.
но играет в игру умри ты сегодня.
вопрос, кто собственник. и что-то мне подсказывает, что это (в частности) не Ларри Финк.

From:

peterzulu

Как я понимаю, версия платная? Какая из них платных?

From:

ploughlike_elk

ChatGPT, Pro plan

From:

kotvsopagah

Ну так "пиздеть не мешки ворочать"(с)

From:

pan_netnet

ты гляди! до технаря стало доходить то, шо гкманитарии и так знали, посмеиваясь над попытками смодлировать рабоу человеческог ума.

вот кстати до подруги тоже начинает доходить. сильно она озаботилась инфобезом после некоторых инцидентов. так сильно шо выучила слова виртуализация и "не храни все яйца в одной корзине". только вот страть с халяве все та же. поэтому задала идиоты написать конфиг к одной весьма попярной утилите. а на с ним не запускается. пришлось ручками проверять по ману шо так идиот написал. оказалось шо одного параметра нет в принципе. на вопрос "нахуя ты, тупая генеративная модель, вставил это в конфиг" отвечает,шо вы ж закаывали то-то и то-то, а этот параметр это и делает. утилита и впраду способна только вот параметр совсем иной прописывать нужно.

этой гадости нельзя доверить написать даже постецйший sh-скрипт.

From:

theyregonnapay

не круасан, это точно. как и говорил один само-выпилившийсй экспат, на этой архитектуре у них не получится ничего.

Q: You didn't explain me why you messed up with the order
A: You're right—I did mess up in that one manual example, and I apologize for the confusion.When I wrote the manual erase sequence, I grouped the erases together for brevity and put oem fb_mode_clear in the middle, but that's not how it appears in your flashfile.xml. In the actual file, the oem fb_mode_clear is listed at the very end, after all the erase steps...

Q: I'm not interested in apologies, only in explanations of the reasons, because you didn't check any statistical data. It's just a sequence of lines.
A: The reasoning for my earlier mistake in reordering the oem fb_mode_clear step was purely human error in summarization, not based on any technical, statistical, or data-driven justification...

Q: wow, you are not a human, so find the real reason.
A: The real reason I reordered that oem fb_mode_clear step in the manual example is pattern-matching error in my internal processing...
When I generated the manual list, my response synthesis pulled from that common pattern and "grouped" the erases for conciseness, inadvertently placing the oem command inside the group instead of strictly after all erases as your specific XML requires.

From:

thenexus6

С поиском у меня обратное впечатление. Возможности поиска оно расширяет невероятно. Раньше нужно было довольно точно знать, что ищешь. И в тех темах где я хорошо разбираюсь, проблем никогда и не было.

Но сейчас можно описать что угодно своими словами, получить ссылки на действительно нужный документ, и уже после просмотра результатов охуеть, насколько же использованные слова были свои.

Оно же в языке разбирается настолько, что во многих случаях ещё и само "исправит" ошибки сканирования старых газет, книг и тп.

From:

dragonru

"Если вы не любите кошек - вы неправильно их готовите". Все вышеперечисленное ИИ сам по себе делает плохо - а вот написать вам систему, которая это сделает хорошо, причем написать с минимальным участием человека - это он может

"в сервис приходит машина, определи какое ТО на ней уже сделано по записям в базе данных и какое, соответственно, клиенту надо напомнить что уже давно пора, какое на подходе, а какое пусть не предписано еще официально, но было бы полезно сделать если хочется чтобы машина жила подольше." - вот на написание такой программы в принципе может вообще хватить одного промпта. Хотите - сделаю такую програмку для вас и покажу, как она делалась?

Edited Date: 2026-01-01 06:39 am (UTC)

From:

ploughlike_elk

Хочу. Сделайте и покажите. Можем даже в отдельный пост вынести.

From:

dragonru

Тогда несколько вопросов. Лучше обсудить их тут или пойти в Телеграм или куда еще? Чтобы я вам рассказывал по шагам, что и как делаю.

"какое ТО на ней уже сделано по записям в базе данных" - это сделаю
А вот с какой частотой надо делать ТО - как это лучше всего записывать.
Пока я думаю - хватит трех основных таблиц: первая - какие ТО вообще есть. Вторая - какие нужны для этой модели и как часто, третья (точнее, тут 2 таблицы) - какие ТО делались на данной машине и когда. Пока обойдусь только первой и третьей - этого хватит для MVP (minimal viable prototype)

Edited Date: 2026-01-01 07:47 am (UTC)

From:

dragonru

Ну вот, готово.
Делал максимально просто, как proof of concept
Попросил Gemini сделать промпт - https://gemini.google.com/share/a8c9480552f2
и закинул этот промпт в Claude.
Куда вам скинуть получившийся файл?

From:

theyregonnapay

поц, гребаный самоучка, это работающий прототип. работающий в соответствии со спецификацией (твоего заказчика) или его же юзер сториз. в простейшем виде лось будет смотрет на твой поц с т.зр . Given-When-Then и если у тебя не будет Then или он будет не тот, что заказывал лось, тебя погонят ссаными тряпками.

From:

dragonru

Не знаешь, как выпендриться? Ты где увидел спецификацию, по которой надо делать? Нетути ее, есть только одна фраза. А связаться, чтобы детально обсудить прототип - тоже не получилось. Ты в таких случаях что говоришь? "У меня лапки" или "Клиент сам дурак"? А я делаю набросок, чтобы клиент посмотрел и понял, чего он хочет. Надеюсь, понятие proof of concept тебе знакомо?

From:

theyregonnapay

ок. peace. my bad. бесы терзали 24+ hrs. lol. ты просто попал под руку.
до клиента тут как до луны; лось уже таких набросков набросает вагон и маленькую телегу. ладно, я прикалывался немного над твоим ПОЦ потому что в даном случае это не про подтверждение твоих представлений, а соответствие прототипа, показывающего работу в принципе, пожеланиям потенциального заказчика, изложенным в его крике лосиной души.
бабло ксати лось найдет и гораздо больше моей сотки баксов. если покажешь пруф, а не bs. в чем ты обломаешься 110+ %.

From:

ploughlike_elk

Лось бабло найдет, не вопрос. Пожалуйста, если есть желающие мне дать работающую программу которая мне будет помогать А) продавать выгодные мне операции ТО, и B) поддерживать машины клиентов в добром здравии бесконечно долго через поддержание ТО в идальном обьеме - предлагайте свою цену решения и я начну считать выгодно мне это или нет. В экономически разумных пределах, естессно - ровно так же как и вы в ремонт и тем более ТО своих корыт не хотите вкладывать больше чем стоит их замена на новые.

From:

ploughlike_elk

https://ploughlike-elk.dreamwidth.org/407863.html

From:

theyregonnapay

> а вот написать вам систему, которая это сделает хорошо, причем написать с минимальным участием человека - это он может
---
пиздеж. полный. ставлю 100 канадских баксов, если ты напишешь что-то очень отдаленно напоминающее заказ лося.

From:

tmg_tt

ну одним просто промтом такая задача не решается - нужно или нанять человека \ команду которая под вашу задачу \ требования развернет агента или самому изучить тему и погрузится чуть-чуть в это дело

если будете изучать, то надо направлять размышленя модели
- или использовать Structured outputs https://platform.openai.com/docs/guides/structured-outputs
- или Schema-Guided Reasoning https://github.com/vamplabAI/sgr-agent-core подход

в обоих случаях это не один промт, а надо поднимать агента у себя через docker или на VPS какой-то или на сервисе который предоставляет инфру для работы с агентами

но вообще задачи посложнее вашей \ работа с корпоративной документацией успешно решаются со 100% точностью и проводят по этому вопросу соревнования, где можно посмотреть решения или даже забрать себе опенсорсные решения

- вот лидерборд с 100% точностью https://erc.timetoact-group.at/benchmarks/erc3-dev
- описание соревнования https://erc.timetoact-group.at/
- пример дефолтного агента для соревнования https://github.com/trustbit/erc3-agents/tree/main/sgr-agent-erc3-prod
- опенсорсных агентов \ обсуждение соревнования можно найти в канале https://t.me/llm_under_hood

From:

tmg_tt

как раз для синих воротничков это и будет выглядеть страшно, они думали - что ллм это галюны про свиные крылышки и смешные картинки, а на завтра сократили 3 отдела огромной корпорации и в бухгалтерии от 120 человек, оставили 4х и когда пошел резюме обновлять оказалось, что на рынке труда остались только вакансии для работы руками (пока)

From:

ploughlike_elk

Нет, это не будет выглядеть страшно, это будет выглядеть прекрасно и замечательно. Вы забыли что на данный момент все эти 120 бухгалтеров не производят ровно ничего что можно есть, потреблять материально. А вот потреблять этого материального они хотят ничуть не меньше. Вакансий в сфере материального производства выше крыши уже сейчас, а будет еще больше. Низкая же оплата тех кто до сих пор был занят в сфере материального производства именно тем и была вызвана чхто произведенный ими продукт надо было еще и делить на всех этих бухгалтеров.

Абсолютно неважно как именно это будет происходить, через рост зарплат или через падение цен на произведенные материальные блага, но когда больше людей будет занято производтвом материальных благ вот тогда и вырастет их уровень материального благосостояния. Естественно будут и те кто попробует загребать это все под себя, но их монополии на сложность приходит конец. Так что ultimately все и будут работать ручками - если жрать захотят.

From:

ploughlike_elk

самому изучить тему и погрузится чуть-чуть в это дело так это я уже и сделал. Только вы вон тут сколько на меня неведомых мне терминов вывалили да еще и заявили что мне надо кого-то нанять, еще и целый коллектив! Вот этот коллектив, значицца, за деньги послужит прокладкой между мной и искусственным псевдо-интелллектом и решит задачу... которую я вообще-то уже решаю и сам, без них всех. Ценой затраты какой-то части своего времени, конечно, но, давайте прямо - оплата труда всех этих людей будет мне стоить дороже чем выгода от сэкономленного времени в ближайшие несколько лет и поэтому ТАКОЕ решение задачи для меня бесмысленно. Эдак, знаете ли, вы мне можете и автозавод предложить построить для решения задач автосервиса - нуачо, самое же лучшее решение это просто дать клиенту новую машину в которой все работает и будет работать еще как минимум 20 - 30 тыс. км пока не забьются фильтры и не износятся колодки. Только бензин заливай и езди.

Идите занимайтесь корпоративными лидербордами и дальше, потому как предложенное вами решение для меня так же применимо как построить на заднем дворе автозавод.

From:

ploughlike_elk

Если перевести всё это с профессионального новояза на честный русский, то вы мне сказали следующее:

"Чтобы машина начала делать то, что вы и так делаете головой,
вам нужно:
— изучить ещё одну профессию,
— развернуть инфраструктуру,
— описать мир в терминах, удобных машине,
— и постоянно эту конструкцию обслуживать».

Если для того, чтобы инструмент начал приносить пользу, нужно построить вокруг него отдельную инфраструктуру, нанять людей и изменить свой способ мышления — инструмент не подходит для задачи.

Я не отказываюсь от ИИ. Я просто не готов обслуживать его как хозяина, когда он (точнее, настоящий полноценный ИИ, а не этот высокоуровневый язык программирования который мне выдают за "искусственный интеллект" уже в который раз в истории) должен обслуживать меня.

Кстати сказать, сформулировать и выразить эту мысль мне таки помогла языковая модель. Вот ЭТО она умеет. А написать нужную мне программу - нет, не умеет.

From:

glumov

Просто выбран неправильный инструмент.
Берётся NotebookLM, загружаются собственные документы и регламенты (а дозволяется грузить всякую чепуху из интернетика) - вуаля! все прекрасно работает.
А если пытаться проехаться на инструменте для генерации гуманитарных текстов, то и выхлоп будет соответствующий.

From:

theyregonnapay

"покажи сиськи", voila

From:

ploughlike_elk

Может быть. Посмотрим-попробуем другой инструмент.

From:

theholm

LLM-ам нельзя разрешать пользоваться своими знаниями которые в не забили при тренировке. Ну и надеяться, что оно "помнит" предыдущее на значительную глубину тоже не стоит. Все что нужно для ответа должно быть в запросе. Мне часто приходится отвечать на вопросы где правильный ответ RTFM. Но нынешнее поколение впадает в депрессию от токого. Я выработал себе методу что заставить робота тыкать носом в документацию. Выглядит примерно так:
* вот оригинальный вопрос
* вот массив с документацией (ее может быть дохрена)
* вот правильный ответ на вопрос ( это ключевое)
"Разверни ответ и добавив ссылки на документацию включая имя документа и раздел. Не включай полный ответ на вопрос, только место где найти ответ"

Вот с этом оно справляется не плохо ( но проверить все равно стоит)

В вашем случае подобный подход должен сработать. Скормить ей рекомендации по сервису, ваши личные наблюдения и что было сделано. Ответ должен быть удовлетворительный.

From:

theyregonnapay

> Все что нужно для ответа должно быть в запросе.
они такое пробовали. с месяц или больше назад. сейчас контекст хранят на серверах. можно вернуться и продолжить.
у маска нужно знать id, например
grok?conversation=19998...
так работает, но затык в технологии на которой не взлетишь. я выше кусок приводил на супер простом примере. а бабла уже сожжено/украдено немерено. сомнительно, что хaвтит на второй заход.

From:

theholm

Вот не надо пользоваться ихней вебмордой или аппом где контроля за размером контекста нет/мало (Я говорю про OpenAI, модели/морды от X-AI/Google/M$ я не трогал). Обработка длинного контекста стоит денег, соответственно официальные клиенты стараются его уменьшить с соответствующем результатом для качества. Пользуйте локальные клиенты и используйте модели через API. Больше контроля и скорее всего дешевле.

From:

ploughlike_elk

Вот точно не дешевле. С тем обьемом токенов что я уже обрабатываю я бы уже платил под тысячу баксов в месяц. Это при том что этого обьема все равно не хватает для полноценного функционала, надо будет еще больше. А это уже убивает всю экономику процесса замены человека на ИИ - человек банально дешевле получится. Двадцать баксов в месяц конечно халява. Двести баксов - приемлемо. Больше этого оно уже начинает быть экономически бессмысленно ДЛЯ МЕНЯ. И то что оно работает для какой-то там корпорации мне абсолютно похуй. Да и вам, кстати, тоже должно быть похуй когда вы в своей многомиллионной или миллиардной корпорации зарабатываете в реальном исчислении даже меньше чем я в своем гаражике с одним подьемником.

Больше контроля - угу. Но и больше требований к моей квалификации как пользователя: давай, механик, разбирайся как "задеплоить агента", "наладить протоколы API" или какие у вас там еще заклинания есть. Ненене, батенька, я не то чтоб не могу этого сделать в принципе, но вообще-то любые траты моего времени на это отнимаются от моего времени отдыха или времени зарабатывания денег. Вы ГАРАНТИРУЕТЕ что мне, в моем обьеме бизнеса, мне это не просто окупится, но принесет прибыль? То же самое относится к предложению "нанять квалифицированного программиста": не, нучо, давайте вашу оценку стоимости такой работы, под ключ, чтобы уже все работало - а я тогда подумаю выгодно мне это или нет. Прикиньте, я-то работаю именно так: даю клиенту оценку стоимости достижения результата, а он уж решает станет он это делать, надо ли оно ему, или нафиг машину выкинуть. Или поискать другого механика который пообещает достижения резульатата дешевле. И так же как я, не получите нахуй никакой оплаты пока оно не заработает как обещали. Welcome to my world, не хотите ТАК поработать? На флат-рейте, ага.

From:

ploughlike_elk

То есть я сам должен подумать и найти правильный ответ, оставив LLM лишь цветасто развернуть мою мысль? Ну вот в той стороне что я работаю на клиентов оно и меня так и происходит. И это экономит время, не вопрос.

Но мне самому, вовнутрь, не нужно цветасто расписать ответ на вопрос на который я сам ответил себе. Мне нужно чтобы робот нашел и дал мне ответ на этот вопрос, а не подтвердил уверенно и с апломбом что я прав. Он, собственно, и так это всегда делает, его послушать так я вообще один из наиболее выдающихся мыслителей за всю историю человечества так и фонтанирующий гениальными мыслями, тонкими наблюдениями и острыми формулировками.