Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Tomasz Tunguz
Agora que comprimimos quase todo o conhecimento humano em grandes modelos de linguagem, a próxima fronteira é a chamada de ferramentas. Encadear diferentes ferramentas de IA permite a automação. A transição de pensar para agir representa o verdadeiro avanço na utilidade da IA.
Eu construí mais de 100 ferramentas para mim, e elas funcionam na maioria das vezes, mas não sempre. Não estou sozinho. O relatório do Índice Econômico da Anthropic revela que 77% do uso empresarial do Claude se concentra na automação de tarefas completas, e não na co-pilotagem.
A Anthropic publicou documentação na semana passada sobre eficiência de tokens e re-arquitetura de ferramentas para otimizar seu uso. A orientação foi contraintuitiva: em vez de muitas ferramentas simples com rótulos claros, crie menos ferramentas, mas mais complexas.
Aqui estão as sete ferramentas de e-mail que construí - scripts Ruby, cada um com um propósito claro. O script "Safe Send Email" foi projetado para impedir que a IA enviasse e-mails sem aprovação.
Belamente ingênuo, simples e claro, não deveria um modelo de linguagem ser capaz de ler isso e saber exatamente o que eu estava pedindo para fazer? Mas não é tão simples!
A Anthropic recomenda a criação de ferramentas complexas. A pesquisa deles mostra que "as solicitações economizam uma média de 14% em tokens de saída, até 70%" ao usar ferramentas sofisticadas e ricas em parâmetros em vez de simples. A razão? Sistemas de IA entendem o contexto completo melhor do que a intenção fragmentada.
Passei o fim de semana consolidando todas as minhas ferramentas em ferramentas unificadas, como esta para e-mail: (terceira imagem)
O impacto na precisão foi imediato. A taxa de sucesso do Claude se aproxima de 100%. O sistema é mais rápido. Como resultado, estou usando muito menos tokens com um sistema mais eficiente.
Aqui está meu modelo mental atual: (quarta imagem)
Quando redesenhei para a cognição da IA em vez da intuição humana, tudo melhorou. Minhas operações de CRM, gerenciamento de calendário e fluxos de trabalho de banco de dados tornaram-se todos mais confiáveis quando consolidados em ferramentas abrangentes e ricas em parâmetros. A precisão melhorou, então o custo total foi reduzido significativamente.
Mas não me peça para usar as ferramentas. Agora estou um pouco perdido em meio à complexidade. Este é um corolário inevitável de trabalhar em níveis mais altos de abstração, sem entender mais profundamente a máquina.
Passamos décadas tornando o software simples para as pessoas. Agora estamos aprendendo a torná-lo complexo para a IA.



580
Como o café da manhã em uma diner, o software é barato e rápido de fazer. Peça uma nova ferramenta de gestão de tarefas e você terá a primeira versão em menos tempo e por menos dinheiro do que uma omelete.
Ferramentas construídas por IA podem não durar muito. Algumas sobrevivem apenas alguns minutos, o tempo suficiente para responder "Qual é o nosso tempo de resposta esta semana?"
Outras permanecem úteis por alguns dias ou semanas, como um aplicativo que pode criar um rastreador de projetos leve para a integração do Walmart. Às vezes, elas persistem por mais de um mês.
Se a permanência definiu as últimas duas décadas de software, a impermanência pode definir a próxima.
Agora vemos três camadas se formando ao longo de um continuum:
SaaS Durável: sistemas de registro de longa duração, como um painel de pipeline.
Aplicativos Efêmeros: ferramentas de curta duração, como o rastreador de projetos de integração do Walmart.
Perguntas Instantâneas: consultas únicas, como "Fale-me sobre a conta da Apple."
Por ordens de magnitude, aplicativos efêmeros e perguntas instantâneas superarão o número de aplicações SaaS, talvez milhões para um. A alta de dopamina da resolução instantânea de problemas é viciante e acelera carreiras.
Apoiado em todas essas aplicações estará um sistema de registro, muitas vezes uma plataforma existente, mas cada vez mais uma nova.
As equipes de finanças e operações dependem de painéis persistentes para governança e relatórios, como se a definição de uma métrica pudesse ser padronizada em toda a organização. Os profissionais de marketing criam aplicativos de dados que duram alguns meses para analisar o desempenho de seus gastos pagos, e as equipes de suporte fazem perguntas rápidas sobre o tempo de resposta antes de seguir em frente.
Os modelos confiáveis, permissões e lógica de negócios de uma plataforma de BI subjacente como @omni dão aos usuários confiança para experimentar aplicativos efêmeros e perguntas instantâneas. O controle da fundação garante o controle das camadas acima.
Esse padrão de design se estende além da IA para a maioria dos outros softwares.
Se você vai ter um café, uma omelete ou uma refeição de cinco pratos, a próxima grande startup servirá tudo isso.

5,71K
Top
Classificação
Favoritos