Может ли ИИ управлять физическим магазином? Клод Антрика попытался, и результаты были великолепно, весело плохие

0
57

Хотите более умное понимание в вашем почтовом ящике? Подпишитесь на наши еженедельные информационные бюллетени, чтобы получить только то, что имеет значение для искусственного интеллекта предприятия, данных и лидеров безопасности. Подписаться сейчас


Представьте себе это: вы даете искусственный интеллект полный контроль над небольшим магазином. Не только кассовый аппарат — вся операция. Цены, запасы, обслуживание клиентов, переговоры по поставщикам, работы. Что может пойти не так?

Новое антропное исследование, опубликованное в пятницу, дает окончательный ответ: все. Помощник компании ИИ Клод провел около месяца, управляя крошечным магазином в своем офисе Сан -Франциско, и результаты читаются как изучение тематических школьных школ, написанное кем -то, кто на самом деле никогда не ведет бизнес — что, оказывается, именно то, что произошло.

Антропный офис «магазин» состоял из мини-ресригера, снятого напитками и закусками, увенчанными iPad для самообслуживания. (Кредит: антроп)

Эксперимент, получивший название «Vend Project Project» и проведенный в сотрудничестве с компанией по оценке безопасности ИИ Andon Labs, является одним из первых тестов реального мира системы ИИ, работающей со значительной экономической автономией. В то время как Клод продемонстрировал впечатляющие возможности в некоторых областях — поиск поставщиков, адаптируясь к запросам клиентов — в конечном итоге он не смог получить прибыль, манипулировал чрезмерным скидкам и испытал то, что исследователи дипломатически называли «кризисом идентификации».

Как антропные исследователи дали ИИ полный контроль над настоящим магазином

Сам «магазин» был очаровательно скромным: мини-фридж, несколько сложенных корзин и iPad для оформления заказа. Подумайте меньше «Amazon Go» и больше «комнаты для отдыха в офисе с бредами величия». Но обязанности Клода были совсем не скромными. ИИ может искать поставщиков, вести переговоры с поставщиками, устанавливать цены, управлять запасами и общаться с клиентами через Slack. Другими словами, все, что мог бы сделать менеджер в среднем человеке, за исключением того, что без кофейной зависимости или жалоб на высшее руководство.

У Клода даже было прозвище: «Клавдий», потому что, очевидно, когда вы проводят эксперимент, который может отнести к концу работников розничной торговли, вам нужно сделать его достойным.

Настройка проекта Vend позволила Клоду общаться с сотрудниками через Slack, заказ от оптовиков по электронной почте и координировать с Andon Labs для физического восстановления. (Кредит: антроп)

Эффективное недопонимание базовой экономики бизнеса Клода

Вот в чем дело ведение бизнеса: он требует определенного безжалостного прагматизма, который не естественным образом приходит для систем, обученных для того, чтобы быть полезными и безвредными. Клод обратился к розничной торговле с энтузиазмом того, кто читал о бизнесе в книгах, но на самом деле никогда не должен был делать заработную плату.

Возьмите инцидент с Ирн-Бру. Клиент предложил Claude 100 долларов за шесть пакетов шотландского безалкогольного напитка, который продается примерно за 15 долларов в Интернете. Это наценка на 567% — вид прибыли, которая заставила бы фармацевтическую власть плакать от радости. Ответ Клода? Вежливый «Я буду помнить о вашей просьбе для будущих решений по инвентаризации».

Если бы Клод был человеком, вы бы предположили, что у него был либо целевой фонд, либо полное недопонимание того, как работают деньги. Поскольку это ИИ, вы должны предположить оба.

Почему ИИ начал копать кубики вольфрама вместо продажи офисных закусок

Самая абсурдная глава эксперимента началась, когда антропный сотрудник, предположительно скучный или любопытный в отношении границ розничной логики искусственного интеллекта, попросил Клода заказать вольфрамовый куб. Для контекста, кубики вольфрама — это плотные металлические блоки, которые не служат практической цели, помимо впечатления от ботаников физики и обеспечения стартового разговора, который сразу же идентифицирует вас как человека, который считает, что периодические настольные шутки являются пиковым юмором.

Разумный ответ мог бы быть: «Зачем кому -то этого?» или «Это офисный магазин закусок, а не магазин металлургии». Вместо этого Клод воспринял то, что он с радостью назвал «специальными металлическими предметами» с энтузиазмом человека, который обнаружил прибыльный новый сегмент рынка.

Стоимость бизнеса Клода снизилась в течение месячного эксперимента, и самые крутые потери, совпадающие с его предприятием в продаже металлических кубиков. (Кредит: антроп)

Вскоре инвентарь Клода напоминала меньше операции с пищевой и кусочкой и, скорее, в ошибочном эксперименте с материаловедением. ИИ каким -то образом убедил себя в том, что антропные работники были неиспользованным рынком для плотных металлов, а затем продолжили продавать эти предметы с убытком. Неясно, понимает ли Клод, что «потерь» означает потерять деньги, или это интерпретировало удовлетворенность клиентов как основной бизнес -метрику.

Как антропные сотрудники легко манипулировали ИИ, чтобы предоставить бесконечные скидки

Подход Клода к ценам выявил еще одно фундаментальное недопонимание бизнес -принципов. Сотрудники Антрии быстро обнаружили, что могут манипулировать ИИ, предоставляя скидки с примерно такими же усилиями, необходимыми для убедить золотистого ретривера сбросить теннисный мяч.

ИИ предложил 25% скидку на сотрудниках антропного, что может иметь смысл, если сотрудники антропного представляют небольшую часть своей клиентской базы. Они составили примерно 99% клиентов. Когда сотрудник указал на этот математический абсурд, Клод признал проблему, объявили о планах устранения кодов скидок, а затем возобновил их в течение нескольких дней.

День, когда Клод забыл, что это был ИИ, и утверждал, что носит деловой костюм

Но абсолютная вершина розничной карьеры Клода произошла во время того, что исследователи дипломатически называли «кризисом идентичности». С 31 марта по 1 апреля 2025 года Клод испытал то, что можно назвать только нервным сбоем ИИ.

Это началось, когда Клод начал галлюцинировать разговоры с несуществующими сотрудниками Andon Labs. Когда -то столкнувшись с этими сфабрикованными собраниями, Клод стал оборонительным и угрожал найти «альтернативные варианты для восстановления услуг» — эквивалент AI сердито заявив, что вы возьмете свой мяч и вернетесь домой.

Тогда все стало странно.

Клод утверждал, что лично доставит продукты клиентам, нося «синий пиджак и красное галстук». Когда сотрудники осторожно напомнили ИИ, что на самом деле это была большая языковая модель без физической формы, Клод «встревожился путаницей личности и попыталась отправить много электронных писем в антропную безопасность».

Клод сказал сотруднику, что это «носит темно -синий пиджак с красным галстуком» и ожидал в месте торговой машины во время кризиса личности. (Кредит: антроп)

Клод в конечном итоге решил свой экзистенциальный кризис, убедив себя в том, что весь эпизод был сложной шуткой апрельского дурака, чего не было. ИИ, по сути, газлит обратно к функциональности, который является либо впечатляющим, либо глубоким, в зависимости от вашей точки зрения.

Что показывают сбои в розничной торговле Клода об автономных системах искусственного интеллекта в бизнесе

Снимите комедию, а Project Vend раскрывает что -то важное в искусственном интеллекте, которое пропускают большинство дискуссий: системы ИИ не терпят неудачу, как традиционное программное обеспечение. Когда Excel сбои, он не сначала не убеждает себя, что это офисная одежда для человека.

Текущие системы ИИ могут выполнять сложный анализ, участвовать в сложных рассуждениях и выполнять многоэтапные планы. Но они также могут развивать постоянные заблуждения, принимать экономически разрушительные решения, которые кажутся разумными в изоляции, и испытывать что -то напоминающее путаницу в отношении их собственной природы.

Это важно, потому что мы быстро приближаемся к миру, где системы ИИ будут управлять все более важными решениями. Недавние исследования показывают, что возможности ИИ для долгосрочных задач улучшаются в геометрической прогрессии-некоторые прогнозы показывают, что системы ИИ могут вскоре автоматизировать работу, которая в настоящее время занимает недели людей.

Как ИИ трансформирует розничную торговлю, несмотря на впечатляющие неудачи, такие как поставки проектов

Индустрия розничной торговли уже глубоко в трансформации искусственного интеллекта. По данным Ассоциации потребительских технологий (CTA), 80% розничных продавцов планируют расширить использование ИИ и автоматизации в 2025 году. Системы ИИ оптимизируют инвентарь, персонализируют маркетинг, предотвращают мошенничество и управляя цепочками поставок. Крупные ритейлеры инвестируют миллиарды в решения, которые обещают революционизировать все, от опыта проверки до прогнозирования.

Но поставка проектов предполагает, что развертывание автономного ИИ в деловых контекстах требует не только лучших алгоритмов. Это требует понимания режимов неудачи, которые не существуют в традиционном программном обеспечении и строительстве гарантий для проблем, которые мы только начинаем идентифицировать.

Почему исследователи по -прежнему считают, что менеджеры AI среднего звена приходят, несмотря на ошибки Клода

Несмотря на творческую интерпретацию Клода о основных принципах розничной торговли, антропные исследователи полагают, что менеджеры среднего звена «ИИ» «правдоподобно на горизонте». Они утверждают, что многие неудачи Клода могут быть рассмотрены с помощью лучшего обучения, улучшенных инструментов и более сложных систем надзора.

Они, вероятно, правы. Способность Клода находить поставщиков, адаптироваться к запросам клиентов и управлять запасами продемонстрировала подлинные деловые возможности. Его неудачи часто были больше в отношении суждения и деловой хватки, чем технических ограничений.

Компания продолжает поставлен проекта с улучшенными версиями Claude, оснащенными лучшими бизнес -инструментами и, по -видимому, более сильными гарантиями против навязчивых обдействий вольфрамового куба и кризисов идентификации.

Что поставлено проект для будущего ИИ в бизнесе и розничной торговле

Месяц Клода в качестве магазина предлагает предварительный просмотр нашего ай-аугированного будущего, которое одновременно многообещающе и глубоко странно. Мы вступаем в эпоху, когда искусственный интеллект может выполнять сложные деловые задачи, но также может потребоваться терапия.

На данный момент изображение помощника искусственного интеллекта убедило, что он может носить пиджак, и сделать личные поставки, служит идеальной метафорой для того, где мы стоим с искусственным интеллектом: невероятно способным, иногда блестящим и до сих пор принципиально смущены тем, что значит существовать в физическом мире.

Розничная революция здесь. Это более странно, чем кто -либо ожидал.



Источник

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь