Esta tese é de ستنفورد و هارفارد, razão pela qual a maioria dos sistemas de “inteligência artificial agente” se sente impressionada nas apresentações e depois se deteriora completamente quando é usada na prática.


Chama-se تكييف الذكاء الاصطناعي الوكيل, e é a tese mais importante que li este ano.
De momento, toda a gente está obcecada em construir agentes independentes. Damos-lhes ferramentas, memória e um objetivo, e esperamos que eles executem as nossas tarefas.
Mas, quando os colocamos no mundo real, eles fantasiam chamadas às ferramentas. Falham ao planear a longo prazo. Entram em colapso.
Aqui está a razão:
Tentamos comprimir toda a aprendizagem na mente da inteligência artificial.
Quando os programadores tentam corrigir um agente avariado, normalmente apenas ajustam o modelo principal para produzir respostas finais melhores.
Os investigadores descobriram uma falha fatal nesta abordagem.
Se apenas recompensar a inteligência artificial por obter a resposta final correta, ela fica preguiçosa.
Ela aprende literalmente a parar de usar as suas ferramentas. Tenta adivinhar a resposta em vez de fazer o trabalho. Ignora a calculadora e tenta fazer as contas na cabeça.
Para corrigir isso, os investigadores criaram uma nova estrutura de 4 partes sobre como os agentes aprendem de facto.
E a conclusão mais importante inverte completamente o conceito atual.
Em vez de continuar a re-ensinar o enorme cérebro, caro, do agente, os sistemas mais fiáveis fazem o oposto.
Congelam o cérebro. E fazem o تكييف das ferramentas.
Chama-se تكييف الأدوات تحت إشراف الوكيل.#GateSquareAprilPostingChallenge $BTC
BTC0,05%
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar