ploughlike_elk: (Default)
[personal profile] ploughlike_elk
Быстро же я подобрался к пределу возможностей ИИ. Разочарован - это мягко сказано...

Реализовать на нем полноценную систему администрации автосервиса не выходит - даже автосервиса из одного механика. Уже сколько времени бьюсь, снижая требования к системе все ниже и ниже - и все равно не работает.

Вот вам пример простейшей задачи: в сервис приходит машина, определи какое ТО на ней уже сделано по записям в базе данных и какое, соответственно, клиенту надо напомнить что уже давно пора, какое на подходе, а какое пусть не предписано еще официально, но было бы полезно сделать если хочется чтобы машина жила подольше. Я уж даже не задаю задачу "свяжись с клиентом и/или другими гаражами и выясни у них что и когда на машине уже делали", да бог с ним, люди тоже такое не делают. Но, блядь, вот тебе база данных машин клиентов, вот тебе база данных всех работ сделанных на этих машинах - разберись и хотя бы составь сообщение которое можно послать клиенту.

И нет, ИИ этого не может. Машину четко не определяет - и не соображает где и какие уточняющие вопросы надо задать если чего не ясно. Если даже поправишь - исправления не запоминает. Данные берет откуда попало, а если не находит - просто изобретает. Наконец, чем больше его обучаешь - тем больше начинает ошибаться и глючить! И это все при огромном расходе токенов, т.е. ИИ-помощник который все равно остается тупой по цене быстро приближается к помощнику живому. Более того, мои собственные затраты времени на дрессировку робота становятся уже таковы что никакого роста эффективности работы нет, наоборот она падает!

О том чтобы он мне сметы на ремонт считал, держал "в голове" контекст коммуникации с клиентами, отвечал на их сообщения или коммуницировал с поставщиками и вовсе речи не идет - ИИ даже близко этого не вытягивает.

Пределы использования по сути получаются такие:

1. Переформатирование и переписывание текстов или сообщений в нужном ключе, языке и стиле - то есть изложение моих мыслей и соображений в той или иной форме. Иногда из этого вырисовываются действительно новые и свежие идеи или быстрее разворачиваются те что уже были, но сам ИИ этого не заметит, он не осознает что случайно сгенерировал что-то умное - это я это вижу и осознаю.

2. Написать несложный программный код для выполнения той или иной одноплановой задачи. Только в спарке с человеком и только пока код не усложняется выше какого-то предела, не шибко-то и высокого. Запрос вида "напиши мне компьютерную игру или мультимедийный продукт на заданную тему" можете даже не пытаться задавать.

3. Быстрый, но ненадежный и ограниченный поиск в интернете. Полноценный поиск чего-то нужного ИИ не тянет.

4. Генерация всякой бесполезной хрени: картиночек, музончика, видосиков и бессмысленных текстов.

Ну и все. А шуму-то было, а страхов... Короче, если вас все ж таки заменили на ИИ, то немного же вы стоили в плане разумности и интеллекта необходимого для вашей работы. Быть успешно замененным на ИИ это реально жесткое оскорбление.

Date: 2025-12-31 03:58 pm (UTC)
From: [personal profile] theyregonnapay
made my day, чудик. а как щеки надувал, 'может тебе ключи от квартиры..'
--
btw, вопрос то в том, зачем ты бессмысленно лгал про свои успехи чудесного использования; это ведь тебе сталo очевидно не вчера.
Edited Date: 2025-12-31 04:43 pm (UTC)

Date: 2025-12-31 04:26 pm (UTC)
sobriquet9: (Default)
From: [personal profile] sobriquet9

Как в анекдоте про собаку, которая играет в шахматы. "Нифига она не умная, счёт 3:2 в мою пользу".

Что умеет ИИ не так важно, важно, что про это думает начальство. Если оно думает, что можно персонал уволить и заменить ИИ, то уволит. А что за ИИ надо всё потом переделывать, это будут уже проблемы оставшихся.

Date: 2025-12-31 04:41 pm (UTC)
sobriquet9: (Default)
From: [personal profile] sobriquet9

Я к тому что сам факт, что радиус этого круга ненулевой, должен быть удивителен. Потому что там внутри по сути очень простой механизм, хоть и натренированный на большом количестве данных.

Лингвисты работали много лет над тем, чтоб хоть один человнческий язык понять, а эта железка научилась говорить на всех языках одновременно без ошибок совершенно внезапно и непонятным образом. И даже решать задачки, где раньше считалось что длоя этого нужно думать. Теперь приходится переопределять, что такое думать.

Date: 2025-12-31 06:14 pm (UTC)
From: [personal profile] pan_netnet
ну вот и придумали создать стат. модели языка по которым идиот угадывает слово, которое должно идти после, рукодствуясь статичтической вероятностью. к дманию это имееет такое е отношение как песрчные куличи в песочнице к свежему круасану.

думание предпогагает, как миннимум, рефлекцию ощщений от свобвенный огронов восприятия посредством языка как единственного инстумента мышления. а идиот целиком и полностью живет в языковой реальности. вернее даже не в ней, а в совокупности вероятностей выпадния того или иного слова. на реальность ему абсллютно похуй.

Date: 2025-12-31 06:35 pm (UTC)
sobriquet9: (Default)
From: [personal profile] sobriquet9

Выплеснули с водой ребёнка. Статистику придумали не год назад, статмодели языка существовали в разном виде лет сто как, если не больше.

То, что embedding плюс нейронка с LTSM и attention может сделать намного больше, чем угадать следующее слово, это был реальный и нехилый прорыв в научно-техническом прогрессе. Таких уже давно не было.

Date: 2025-12-31 07:25 pm (UTC)
From: [personal profile] pan_netnet
это словоблудие. статистика разная бывает. средняя зп, мдианная и модальная - все три есть правоверные статистические показатели. только вот картину они риуют разную. и надо иметь немалую инфуицию со знанием исседлкемого объекта шоб понять какой из показателей лучше описывает реальную картину.

то шо немчура в 19 не смогла создать статмодель, которая бы генерила более-менее правдивый текст(если не заглубляться в бред, который идиот выдает), то не значит шо их потоки создали шота принципиально новое. те паче думающее.

Date: 2026-01-01 01:53 am (UTC)
From: [personal profile] theyregonnapay
только что чуть не превратил в кирпич телефон за штуку. ставлю ром с даунгрейдом с 14 на 13. две модели не смогли написать скрип просто взяв из flashfile.xml названия файлов в последовательном порядке, с середины нацахли менять порядок.там двух десятка файлов.
и эти гнойные пидарасы строят цифровой гулаг. просто на их рожи посмотреть - советские комсомольские функционеры вроде Ходора, просто светлые гении с честью и совестью.
вашим бы унять этих козлов вроде карпа, финка и прочих кушнеров. последний кстати и на вакцинках поднимался в том числе.

Date: 2026-01-01 06:42 am (UTC)
From: [personal profile] dragonru
Вообще-то не так. Внутри там очень сложный механизм. Но образовался он сам по себе в результате простых воздействий.

Date: 2025-12-31 04:50 pm (UTC)
From: [personal profile] theyregonnapay
менеджмент думает по-другому четко понимая, что завтра и его собственник выгонит на мороз.
но играет в игру умри ты сегодня.
вопрос, кто собственник. и что-то мне подсказывает, что это (в частности) не Ларри Финк.

Date: 2025-12-31 05:28 pm (UTC)
peterzulu: (Default)
From: [personal profile] peterzulu
Как я понимаю, версия платная? Какая из них платных?

Date: 2025-12-31 06:00 pm (UTC)
From: [personal profile] kotvsopagah
Ну так "пиздеть не мешки ворочать"(с)

Date: 2025-12-31 06:09 pm (UTC)
From: [personal profile] pan_netnet
ты гляди! до технаря стало доходить то, шо гкманитарии и так знали, посмеиваясь над попытками смодлировать рабоу человеческог ума.

вот кстати до подруги тоже начинает доходить. сильно она озаботилась инфобезом после некоторых инцидентов. так сильно шо выучила слова виртуализация и "не храни все яйца в одной корзине". только вот страть с халяве все та же. поэтому задала идиоты написать конфиг к одной весьма попярной утилите. а на с ним не запускается. пришлось ручками проверять по ману шо так идиот написал. оказалось шо одного параметра нет в принципе. на вопрос "нахуя ты, тупая генеративная модель, вставил это в конфиг" отвечает,шо вы ж закаывали то-то и то-то, а этот параметр это и делает. утилита и впраду способна только вот параметр совсем иной прописывать нужно.

этой гадости нельзя доверить написать даже постецйший sh-скрипт.

Date: 2026-01-01 02:50 am (UTC)
From: [personal profile] theyregonnapay
не круасан, это точно. как и говорил один само-выпилившийсй экспат, на этой архитектуре у них не получится ничего.

Q: You didn't explain me why you messed up with the order
A: You're right—I did mess up in that one manual example, and I apologize for the confusion.When I wrote the manual erase sequence, I grouped the erases together for brevity and put oem fb_mode_clear in the middle, but that's not how it appears in your flashfile.xml. In the actual file, the oem fb_mode_clear is listed at the very end, after all the erase steps...

Q: I'm not interested in apologies, only in explanations of the reasons, because you didn't check any statistical data. It's just a sequence of lines.
A: The reasoning for my earlier mistake in reordering the oem fb_mode_clear step was purely human error in summarization, not based on any technical, statistical, or data-driven justification...

Q: wow, you are not a human, so find the real reason.
A: The real reason I reordered that oem fb_mode_clear step in the manual example is pattern-matching error in my internal processing...
When I generated the manual list, my response synthesis pulled from that common pattern and "grouped" the erases for conciseness, inadvertently placing the oem command inside the group instead of strictly after all erases as your specific XML requires.

Date: 2026-01-01 05:41 am (UTC)
From: [personal profile] thenexus6
С поиском у меня обратное впечатление. Возможности поиска оно расширяет невероятно. Раньше нужно было довольно точно знать, что ищешь. И в тех темах где я хорошо разбираюсь, проблем никогда и не было.

Но сейчас можно описать что угодно своими словами, получить ссылки на действительно нужный документ, и уже после просмотра результатов охуеть, насколько же использованные слова были свои.

Оно же в языке разбирается настолько, что во многих случаях ещё и само "исправит" ошибки сканирования старых газет, книг и тп.

Date: 2026-01-01 06:37 am (UTC)
From: [personal profile] dragonru
"Если вы не любите кошек - вы неправильно их готовите". Все вышеперечисленное ИИ сам по себе делает плохо - а вот написать вам систему, которая это сделает хорошо, причем написать с минимальным участием человека - это он может

"в сервис приходит машина, определи какое ТО на ней уже сделано по записям в базе данных и какое, соответственно, клиенту надо напомнить что уже давно пора, какое на подходе, а какое пусть не предписано еще официально, но было бы полезно сделать если хочется чтобы машина жила подольше." - вот на написание такой программы в принципе может вообще хватить одного промпта. Хотите - сделаю такую програмку для вас и покажу, как она делалась?
Edited Date: 2026-01-01 06:39 am (UTC)

Date: 2026-01-01 07:43 am (UTC)
From: [personal profile] dragonru
Тогда несколько вопросов. Лучше обсудить их тут или пойти в Телеграм или куда еще? Чтобы я вам рассказывал по шагам, что и как делаю.

"какое ТО на ней уже сделано по записям в базе данных" - это сделаю
А вот с какой частотой надо делать ТО - как это лучше всего записывать.
Пока я думаю - хватит трех основных таблиц: первая - какие ТО вообще есть. Вторая - какие нужны для этой модели и как часто, третья (точнее, тут 2 таблицы) - какие ТО делались на данной машине и когда. Пока обойдусь только первой и третьей - этого хватит для MVP (minimal viable prototype)
Edited Date: 2026-01-01 07:47 am (UTC)

Date: 2026-01-01 07:59 am (UTC)
From: [personal profile] dragonru
Ну вот, готово.
Делал максимально просто, как proof of concept
Попросил Gemini сделать промпт - https://gemini.google.com/share/a8c9480552f2
и закинул этот промпт в Claude.
Куда вам скинуть получившийся файл?

Date: 2026-01-01 06:54 pm (UTC)
From: [personal profile] theyregonnapay
поц, гребаный самоучка, это работающий прототип. работающий в соответствии со спецификацией (твоего заказчика) или его же юзер сториз. в простейшем виде лось будет смотрет на твой поц с т.зр . Given-When-Then и если у тебя не будет Then или он будет не тот, что заказывал лось, тебя погонят ссаными тряпками.

Date: 2026-01-01 08:57 pm (UTC)
From: [personal profile] dragonru
Не знаешь, как выпендриться? Ты где увидел спецификацию, по которой надо делать? Нетути ее, есть только одна фраза. А связаться, чтобы детально обсудить прототип - тоже не получилось. Ты в таких случаях что говоришь? "У меня лапки" или "Клиент сам дурак"? А я делаю набросок, чтобы клиент посмотрел и понял, чего он хочет. Надеюсь, понятие proof of concept тебе знакомо?

Date: 2026-01-01 10:18 pm (UTC)
From: [personal profile] theyregonnapay
ок. peace. my bad. бесы терзали 24+ hrs. lol. ты просто попал под руку.
до клиента тут как до луны; лось уже таких набросков набросает вагон и маленькую телегу. ладно, я прикалывался немного над твоим ПОЦ потому что в даном случае это не про подтверждение твоих представлений, а соответствие прототипа, показывающего работу в принципе, пожеланиям потенциального заказчика, изложенным в его крике лосиной души.
бабло ксати лось найдет и гораздо больше моей сотки баксов. если покажешь пруф, а не bs. в чем ты обломаешься 110+ %.

Date: 2026-01-01 04:33 pm (UTC)
From: [personal profile] theyregonnapay
> а вот написать вам систему, которая это сделает хорошо, причем написать с минимальным участием человека - это он может
---
пиздеж. полный. ставлю 100 канадских баксов, если ты напишешь что-то очень отдаленно напоминающее заказ лося.

Date: 2026-01-01 09:21 am (UTC)
tmg_tt: (Default)
From: [personal profile] tmg_tt
ну одним просто промтом такая задача не решается - нужно или нанять человека \ команду которая под вашу задачу \ требования развернет агента или самому изучить тему и погрузится чуть-чуть в это дело

если будете изучать, то надо направлять размышленя модели
- или использовать Structured outputs https://platform.openai.com/docs/guides/structured-outputs
- или Schema-Guided Reasoning https://github.com/vamplabAI/sgr-agent-core подход

в обоих случаях это не один промт, а надо поднимать агента у себя через docker или на VPS какой-то или на сервисе который предоставляет инфру для работы с агентами

но вообще задачи посложнее вашей \ работа с корпоративной документацией успешно решаются со 100% точностью и проводят по этому вопросу соревнования, где можно посмотреть решения или даже забрать себе опенсорсные решения

- вот лидерборд с 100% точностью https://erc.timetoact-group.at/benchmarks/erc3-dev
- описание соревнования https://erc.timetoact-group.at/
- пример дефолтного агента для соревнования https://github.com/trustbit/erc3-agents/tree/main/sgr-agent-erc3-prod
- опенсорсных агентов \ обсуждение соревнования можно найти в канале https://t.me/llm_under_hood

Date: 2026-01-01 09:31 am (UTC)
tmg_tt: (Default)
From: [personal profile] tmg_tt
как раз для синих воротничков это и будет выглядеть страшно, они думали - что ллм это галюны про свиные крылышки и смешные картинки, а на завтра сократили 3 отдела огромной корпорации и в бухгалтерии от 120 человек, оставили 4х и когда пошел резюме обновлять оказалось, что на рынке труда остались только вакансии для работы руками (пока)

Date: 2026-01-01 09:57 am (UTC)
glumov: (Default)
From: [personal profile] glumov
Просто выбран неправильный инструмент.
Берётся NotebookLM, загружаются собственные документы и регламенты (а дозволяется грузить всякую чепуху из интернетика) - вуаля! все прекрасно работает.
А если пытаться проехаться на инструменте для генерации гуманитарных текстов, то и выхлоп будет соответствующий.

Date: 2026-01-01 04:34 pm (UTC)
From: [personal profile] theyregonnapay
"покажи сиськи", voila

Date: 2026-01-01 08:09 pm (UTC)
theholm: (Default)
From: [personal profile] theholm
LLM-ам нельзя разрешать пользоваться своими знаниями которые в не забили при тренировке. Ну и надеяться, что оно "помнит" предыдущее на значительную глубину тоже не стоит. Все что нужно для ответа должно быть в запросе. Мне часто приходится отвечать на вопросы где правильный ответ RTFM. Но нынешнее поколение впадает в депрессию от токого. Я выработал себе методу что заставить робота тыкать носом в документацию. Выглядит примерно так:
* вот оригинальный вопрос
* вот массив с документацией (ее может быть дохрена)
* вот правильный ответ на вопрос ( это ключевое)
"Разверни ответ и добавив ссылки на документацию включая имя документа и раздел. Не включай полный ответ на вопрос, только место где найти ответ"

Вот с этом оно справляется не плохо ( но проверить все равно стоит)

В вашем случае подобный подход должен сработать. Скормить ей рекомендации по сервису, ваши личные наблюдения и что было сделано. Ответ должен быть удовлетворительный.

Date: 2026-01-01 10:33 pm (UTC)
From: [personal profile] theyregonnapay
> Все что нужно для ответа должно быть в запросе.
они такое пробовали. с месяц или больше назад. сейчас контекст хранят на серверах. можно вернуться и продолжить.
у маска нужно знать id, например
grok?conversation=19998...
так работает, но затык в технологии на которой не взлетишь. я выше кусок приводил на супер простом примере. а бабла уже сожжено/украдено немерено. сомнительно, что хaвтит на второй заход.

Date: 2026-01-02 02:24 am (UTC)
theholm: (Default)
From: [personal profile] theholm
Вот не надо пользоваться ихней вебмордой или аппом где контроля за размером контекста нет/мало (Я говорю про OpenAI, модели/морды от X-AI/Google/M$ я не трогал). Обработка длинного контекста стоит денег, соответственно официальные клиенты стараются его уменьшить с соответствующем результатом для качества. Пользуйте локальные клиенты и используйте модели через API. Больше контроля и скорее всего дешевле.
Page generated Jan. 2nd, 2026 07:59 am
Powered by Dreamwidth Studios