Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Tomasz Tunguz
Теперь, когда мы сжали почти все человеческие знания в большие языковые модели, следующая граница — это вызов инструментов. Связывание различных AI инструментов позволяет автоматизировать процессы. Переход от мышления к действию представляет собой настоящий прорыв в полезности AI.
Я создал более 100 инструментов для себя, и они работают большую часть времени, но не всегда. Я не одинок. Отчет Economic Index от Anthropic показывает, что 77% бизнес-использования Claude сосредоточено на полной автоматизации задач, а не на совместной работе.
На прошлой неделе Anthropic опубликовал документацию о токенах и реорганизации инструментов для оптимизации их использования. Рекомендации были контринтуитивными: вместо множества простых инструментов с четкими метками создавайте меньше, но более сложных инструментов.
Вот семь инструментов для электронной почты, которые я создал — скрипты на Ruby, каждый с четкой целью. Скрипт "Безопасная отправка электронной почты" был разработан, чтобы предотвратить отправку электронных писем AI без одобрения.
Прекрасно наивно, просто и ясно, разве языковая модель не должна уметь читать это и точно знать, что я прошу ее сделать? Но это не так просто!
Anthropic рекомендует создавать сложные инструменты. Их исследования показывают, что "запросы экономят в среднем 14% токенов на выходе, до 70%" при использовании сложных инструментов с богатым набором параметров вместо простых. Причина? AI-системы лучше понимают полный контекст, чем фрагментированный намерение.
Я провел выходные, консолидируя все свои инструменты в единые инструменты, как этот для электронной почты: (третье изображение)
Влияние на точность было немедленным. Уровень успеха Claude приближается к 100%. Система стала быстрее. В результате я использую гораздо меньше токенов с более эффективной системой.
Вот моя текущая ментальная модель: (четвертое изображение)
Когда я перепроектировал для когнитивных возможностей AI, а не для человеческой интуиции, все улучшилось. Мои операции CRM, управление календарем и рабочие процессы базы данных стали более надежными, когда были консолидированы в комплексные инструменты с большим количеством параметров. Точность улучшилась, поэтому общая стоимость значительно снизилась.
Но не просите меня использовать инструменты. Я теперь немного потерян среди сложности. Это неизбежный следствие работы на более высоких уровнях абстракции, когда я больше не понимаю машину в глубину.
Мы потратили десятилетия на упрощение программного обеспечения для людей. Теперь мы учимся делать его сложным для AI.



584
Как завтрак в закусочной, программное обеспечение дешево и быстро создается. Попросите новый инструмент управления задачами, и вы получите первую версию быстрее и дешевле, чем омлет.
Инструменты, созданные с помощью AI, могут не продержаться долго. Некоторые существуют всего несколько минут, достаточно, чтобы ответить на вопрос: "Какое наше время выполнения на этой неделе?"
Другие остаются полезными в течение нескольких дней или недель, как приложение, которое может создать легкий трекер проектов для адаптации сотрудников Walmart. Иногда они сохраняются более месяца.
Если постоянство определяло последние два десятилетия программного обеспечения, то непостоянство может определить следующие.
Теперь мы видим три слоя, формирующихся вдоль континуума:
Долговечный SaaS: долгоживущие системы учета, такие как панель управления конвейером.
Эфемерные приложения: краткосрочные инструменты, такие как трекер проектов для адаптации сотрудников Walmart.
Мгновенные вопросы: разовые запросы, такие как "Расскажи мне об аккаунте Apple."
По порядку величин эфемерные приложения и мгновенные вопросы будут превышать количество SaaS приложений, возможно, в миллионы раз. Дофаминовый подъем мгновенного решения проблем вызывает зависимость и ускоряет карьеру.
Основой всех этих приложений будет система учета, часто существующая платформа, но все чаще новая.
Финансовые и операционные команды зависят от постоянных панелей управления для управления и отчетности, как будто определение метрики можно стандартизировать по всей организации. Маркетологи создают приложения для анализа данных, которые существуют несколько месяцев, чтобы проанализировать эффективность своих затрат, а команды поддержки задают быстрые вопросы о времени выполнения, прежде чем двигаться дальше.
Доверенные модели, разрешения и бизнес-логика базовой платформы BI, такой как @omni, дают пользователям уверенность экспериментировать с эфемерными приложениями и мгновенными вопросами. Контроль над основой обеспечивает контроль над слоями выше.
Эта модель проектирования выходит за рамки AI и охватывает большинство другого программного обеспечения.
Будете ли вы пить кофе, есть омлет или обедать на пять блюд, следующий великий стартап предложит все это.

5,72K
Топ
Рейтинг
Избранное