Como posicionar a riqueza futura através do AI Agent? Este artigo dá-lhe a resposta

O autor do texto original: Rocky

Reimpressão: Daisy, Mars Finance

Você precisa conhecer #AI Agent, este livro (artigo) é uma leitura obrigatória para todos. 'AGENT AI' de Fei-Fei Li, é o livro mais empolgante e com visão de futuro que li este ano, e é fácil de entender, sem termos técnicos complexos e lógica algorítmica, vale a pena ler para qualquer pessoa comum, há um link para o texto completo nos comentários finais.

Posso dizer com responsabilidade que o AI Agent é a área mais promissora para investimentos em inteligência artificial, tanto no mercado de ações quanto no campo da Web3. Também é a direção mais próxima do To C que os cidadãos comuns podem perceber. Para o público em geral, é a área mais acessível e de uso em larga escala.

Como descrito em sua introdução, o sistema de agentes de IA é capaz de perceber e agir em diferentes domínios e aplicações. O treinamento do Agente de IA tem demonstrado habilidades de compreensão multimodal no mundo físico. Ele fornece um framework para treinamento sem relação com a realidade, combinando a IA generativa com várias fontes de dados independentes. Apresentamos uma visão geral do sistema de IA de agente capaz de perceber e agir em muitos domínios e aplicações, como um paradigma de agente em direção à AGI.

O artigo menciona especificamente o estado atual da tecnologia AI Agent na interação humano-computador multimodal (HCI), perspectivas de aplicação e direções futuras de desenvolvimento, destacando algumas direções de tecnologia central e inovadora que merecem uma reflexão e exploração mais aprofundadas, não permitindo que o AI Agent se limite apenas à interação de voz e interação visual, o seu alcance é ainda mais amplo:

  1. O conceito e significado central da HCI multimodal

A HCI multimodal integra vários modos de informação, como voz, texto, imagem e toque, para alcançar uma interação natural, flexível e eficiente entre humanos e computadores. O objetivo principal dessa tecnologia é:

• Melhore a naturalidade e a imersão da interação.

• Expandir a adequação do cenário de interação homem-máquina.

• Promover a capacidade dos computadores de compreenderem a diversidade de entradas humanas.

  1. Direções futuras

O artigo realiza uma revisão sistemática de cinco áreas de pesquisa:

  1. Visualização e interação de Big Data

Concepto: transformar dados complexos numa representação gráfica fácil de entender, melhorando a experiência do utilizador através de múltiplos canais sensoriais (visual, tátil, auditivo, etc.).

Progresso:

• Exploração de visualização de dados baseada em realidade virtual (RV) e realidade aumentada (RA);

• No campo médico e de pesquisa, ajuda os usuários a entender melhor a distribuição de dados por meio do feedback tátil, como a força e a vibração.

Aplicação:

• Monitorização de cidades inteligentes: exibir em tempo real os dados de tráfego da cidade através de mapas de calor dinâmicos.

• Análise de dados médicos: explorar dados multidimensionais em conjunto com feedback tátil.

  1. Interação baseada na percepção do campo sonoro

Conceito: Usar um array de microfones e algoritmos de aprendizado de máquina para analisar as mudanças no campo sonoro do ambiente, ajudando a realizar interações homem-máquina não visuais.

Progress:

• Melhoria na precisão da tecnologia de localização de fonte sonora;

• Tecnologia de interação por voz robusta em ambientes com ruído.

Aplicação:

• Casa inteligente: controle de voz de dispositivos, realizando tarefas sem a necessidade de toque.

• Tecnologia de assistência a deficientes: fornecer uma forma de interação baseada em som para usuários com deficiência visual.

  1. Interação física de objetos de realidade mista

Conceito: misturar a tecnologia de realidade mista (MR) para integrar informações virtuais com o mundo físico, permitindo aos usuários controlar o ambiente virtual usando objetos reais.

Progress:

• Otimização da interação de objetos virtuais baseada no feedback tátil.

• Alta precisão de mapeamento de objetos físicos-virtuais.

Aplicação:

• Educação e treinamento: ensino imersivo através de simulação de ambientes reais.

• Design industrial: validar produtos usando protótipos virtuais.

  1. Interação Vestível

Conceito:

Através de dispositivos vestíveis como smartwatches e dispositivos de monitoramento de saúde, a interação é realizada por meio de gestos, toques ou tecnologia eletrônica da pele.

Progresso:

• A sensibilidade e durabilidade do sensor de pele aumentaram;

• O algoritmo de fusão de vários canais melhora a precisão da interação.

Aplicação:

• Monitorização da saúde: rastreamento em tempo real da frequência cardíaca, sono e atividade física;

• Jogos e entretenimento: controle personagens virtuais por meio de dispositivos vestíveis.

  1. Interação de diálogo homem-máquina

Conceito:

Pesquisar tecnologias de reconhecimento de voz, reconhecimento de emoções, síntese de voz, etc., para permitir que o computador compreenda e responda melhor às entradas de linguagem do usuário.

Progress:

• A popularização de grandes modelos de linguagem (como o GPT, etc.) melhora muito a naturalidade dos sistemas de diálogo;

• Aumento da precisão da tecnologia de reconhecimento de emoções por voz.

Aplicação:

• Chatbot: suporte para interação por voz em vários idiomas.

• Assistente Inteligente: resposta personalizada a comandos de voz.

Portanto, vemos muitos projetos de Agentes de IA, especialmente na área de Web3, que ainda estão principalmente no nível de assistentes inteligentes para interação homem-máquina, como tweets de 24 horas, chat de voz AI personalizado para milhares de pessoas, chat de casais, etc. Mas recentemente também observamos algumas combinações inovadoras de dados de saúde corporal, como anéis (não vou mencionar especificamente qual empresa, você pode procurar por si mesmo), que vêm com integração de IA #Depin 项目+ #, que será mais valiosa e interessante, e os investidores também vão gostar mais. Afinal, investimos em duas empresas, hardware + software + AI, esta será uma direção com potencial!

  1. As áreas em que as empresas tecnológicas estão atualmente a investir fortemente

  2. Expandir os métodos de interação: Explorar novos métodos de interação, como a perceção olfativa e de temperatura, para reforçar ainda mais a dimensão da integração multimodal.

  3. Otimizar a combinação multimodal: projetar maneiras eficientes e flexíveis de combinar várias modalidades para que possam trabalhar em conjunto de forma mais natural.

  4. Miniaturização de dispositivos: desenvolver dispositivos mais leves e com menor consumo de energia para se adequar ao uso diário.

  5. Interação distribuída entre dispositivos: Melhorar a interoperabilidade entre dispositivos para interações multidispositivos sem descontinuidades.

  6. Melhoria da robustez do algoritmo: especialmente em ambientes abertos, aumentar a estabilidade e a tempo-realidade do algoritmo de percepção e fusão multimodal.

  7. Cenários de aplicação de investimento dignos

• Reabilitação médica: auxilia os pacientes na reabilitação e aconselhamento psicológico por meio de feedback de voz, imagem e toque.

• Escritório e Educação: Fornecer assistente de escritório inteligente e plataforma de educação personalizada para melhorar a eficiência e a experiência.

• Simulação militar: combina a tecnologia de realidade mista para simulação de combate e treinamento tático.

• Entretenimento e Jogos: Criar uma experiência imersiva de jogos e entretenimento, aumentando a interação do usuário com o ambiente virtual.

Resumo: Neste artigo, o Dr. Li utiliza aplicações de cenários futuros para a implementação do Agente de IA, sistematicamente delineando as tecnologias centrais de HCI multimodal e combinando aplicações práticas e direções futuras de pesquisa para a IA, #SOL 链生态的),比如手表,比如吊坠等。这里面的机会比传统只做单一的 #AI. Não há tempo a perder!

AGENT-16.88%
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
0/400
Sem comentários
  • Marcar
Negocie criptomoedas a qualquer hora e em qualquer lugar
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)