Вы должны познакомиться с #AI Агент, это книга (статья), которую нельзя пропустить. 'AGENT AI' Ли Фей-Фей - это книга, которую я прочитал в этом году и которая оказала на меня наибольшее впечатление и показала будущее направление. Ее текст легко понять, в ней нет глубоких специальных терминов и алгоритмической логики. Это стоит прочитать каждому обычному человеку, в конце текста есть ссылка на полный текст.
Я могу ответственно заявить, что AI Agent - это самая перспективная область инвестиций в области искусственного интеллекта в среднесрочной и долгосрочной перспективе (независимо от того, в какой области - в американском фондовом рынке или в области Web3), и это направление наиболее близкое к потребителям, которое они могут ощутить. Для обычных людей это самая доступная и масштабируемая область, с которой они могут непосредственно столкнуться и использовать в больших масштабах.
Как описано в его вступительной статье, система AI Agent способна воспринимать и действовать в различных областях и приложениях. AI Agent представляет собой перспективный подход к общему искусственному интеллекту (AGI). Обучение AI Agent уже показало способность к многомодальному пониманию физического мира. Он предоставляет фреймворк для обучения, независимого от реальности, путем комбинирования генеративного искусственного интеллекта с несколькими независимыми источниками данных. Мы представляем общую концепцию системы искусственного интеллекта агента, способную воспринимать и действовать во многих различных областях и приложениях, как парадигму для достижения AGI.
В статье подробно рассматривается текущее положение дел, перспективы применения и направления развития технологии AI Agent в мультимодальном человеко-машинном взаимодействии (HCI), обнаруживая некоторые ключевые технологии и направления инноваций, которые следует тщательно изучить и исследовать. Не допустим, чтобы AI Agent ограничивался только голосовым взаимодействием и визуальным взаимодействием, его область гораздо шире:
Основные понятия и значение мульти-модального HCI
Много모дальный HCI путем интеграции речи, текста, изображений, тактильных и других информационных режимов обеспечивает естественное, гибкое и эффективное взаимодействие между человеком и компьютером. Основная цель этой технологии:
• Улучшить естественность взаимодействия и погружения.
• Расширение применимости человеко-компьютерного взаимодействия.
• Повышение способности компьютера понимать разнообразные способы ввода человека.
Направление будущего развития
В статье была проведена систематическая классификация пяти областей исследований:
Визуализация и взаимодействие с большими данными
Концепция: преобразование сложных данных в графическое представление, которое легко понять, с использованием различных восприятий (зрение, осязание, слух и т. д.) для улучшения пользовательского опыта.
Прогресс:
• Визуализация данных на основе виртуальной реальности (VR) и дополненной реальности (AR) для исследований;
• В медицинских и научных исследованиях тактильная обратная связь, такая как силовая и вибрационная обратная связь, помогает пользователям лучше понять распределение данных.
Приложение:
• Мониторинг умного города: отображение данных о потоке города в реальном времени с помощью динамической тепловой карты.
• Анализ медицинских данных: исследование многомерных данных в сочетании с тактильной обратной связью.
Интерактив на основе восприятия звуковой сцены
Концепция: использование массива микрофонов и алгоритмов машинного обучения для анализа изменений в звуковом поле окружающей среды с целью обеспечения невизуального взаимодействия между человеком и машиной.
Прогресс:
• Повышение точности технологии локализации источников звука;
• Технология речевого взаимодействия с устойчивостью к шумовой среде.
Приложение:
• Умный дом: управление голосом устройствами без необходимости контакта.
• Технология помощи для инвалидов: предоставляет зрячим пользователям звуковые способы взаимодействия.
Взаимодействие с физическими объектами в смешанной реальности
Концепция: Технология смешанной реальности (MR) объединяет виртуальную информацию с физическим миром, позволяя пользователям манипулировать виртуальной средой с помощью объектов реального мира.
Прогресс:
• Оптимизация взаимодействия с виртуальными объектами на основе физического тактильного ощущения;
• Высокоточная технология отображения физических и виртуальных объектов.
Применение:
• Обучение и тренировка: обучение в иммерсивной среде, которая имитирует реальные условия.
• Промышленный дизайн: проверка продукта с использованием виртуального прототипа.
Интерактивность носимых устройств
Концепция:
Взаимодействие осуществляется с помощью носимых устройств, таких как смарт-часы, устройства для мониторинга здоровья и др., используя жесты, касание или технологию электроники на коже.
Прогресс:
• Улучшена чувствительность и долговечность датчика кожи;
• Алгоритм объединения множественных каналов улучшает точность взаимодействия.
Приложение:
• Мониторинг здоровья: в режиме реального времени отслеживание сердечного ритма, сна и физической активности;
• Игры и развлечения: управление виртуальными персонажами с помощью носимых устройств.
Взаимодействие человека и машины в диалоге
Концепция:
Изучение технологий распознавания речи, распознавания эмоций, синтеза речи и т. д., чтобы компьютер лучше понимал и реагировал на языковой ввод пользователя.
Прогресс:
• Популяризация больших языковых моделей (таких как GPT и т. д.) значительно повысила естественность систем диалога;
• Повышение точности технологии распознавания эмоций в голосе.
Применение:
• Робот службы поддержки: поддержка многоязычного голосового взаимодействия.
• Интеллектуальный помощник: персонализированный ответ на голосовые команды.
Поэтому мы видим много проектов AI Agent, особенно в области Web3, которые все еще ограничены уровнем интеллектуальных помощников для межчеловеческого общения, таких как 24-часовые твиты, AI голосовые чаты и чаты для пар. Но недавно мы также наблюдаем инновации в области данных о здоровье тела, комбинируя AI с умными носимыми устройствами, такими как кольца (я не буду называть конкретное имя, вы можете найти их сами), это также является ценным и интересным для #Depin 项目+ #AI блокчейна или приложений, что понравится инвесторам, ведь мы инвестировали в 2 компании, аппаратное обеспечение + программное обеспечение + AI, это потенциальное направление!
Текущие области, в которые активно вкладываются технологические компании
Расширение способов взаимодействия: исследование новых способов взаимодействия, таких как обоняние и температурное восприятие, для дальнейшего улучшения мультимодального слияния.
Оптимизация комбинирования нескольких режимов: разработка эффективных и гибких способов комбинирования различных режимов для более естественного сотрудничества.
Миниатюризация оборудования: разработка более компактных и энергоэффективных устройств для повседневного использования.
Распределенное взаимодействие между устройствами: повышение взаимодействия между устройствами для реализации безшовного взаимодействия между несколькими устройствами.
Повышение устойчивости алгоритмов: особенно в открытой среде, повышение стабильности и реального времени мульти-модальных алгоритмов восприятия и слияния.
Инвестиционные сценарии, которые стоит рассмотреть
• Медицинская реабилитация: с помощью звука, изображений и тактильной обратной связи помогает пациентам в реабилитационном тренировочном процессе и психологическом консультировании.
• Офисное образование: предоставление интеллектуального помощника в офисе и персонализированной платформы образования, повышение эффективности и улучшение опыта.
• Военное моделирование: сочетание технологии дополненной реальности для симуляции боевых действий и тактического обучения.
• Развлечения и игры: создание погружающего игрового и развлекательного опыта, усиление взаимодействия пользователя с виртуальной средой.
Обзор: доктор Ли систематически обработал основные технологии мульти-модального HCI с использованием будущих сценариев применения AI Agent, совместно с практическими применениями и направлениями будущих исследований, для #SOL 链生态的),比如手表,比如吊坠等。这里面的机会比传统只做单一的 #AI, изучение #AIAgent 的投资者指明了方向和投资的逻辑。这篇文章,可以说是2024年必读的AI书籍,让我更清晰地认识到多模态人机交互技术在推动未来智能化生活中的关键作用,揭示了它在开放环境和复杂场景下的巨大潜力。投资未来,才能把握财富!还是那句话:布局 #AI. Нет времени терять!
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
Как распределить богатство в будущем с помощью AI Agent? Эта статья даст вам ответ.
Автор оригинала: Rocky
Репост: Дейзи, Финансовый огонь на Марсе
Вы должны познакомиться с #AI Агент, это книга (статья), которую нельзя пропустить. 'AGENT AI' Ли Фей-Фей - это книга, которую я прочитал в этом году и которая оказала на меня наибольшее впечатление и показала будущее направление. Ее текст легко понять, в ней нет глубоких специальных терминов и алгоритмической логики. Это стоит прочитать каждому обычному человеку, в конце текста есть ссылка на полный текст.
Я могу ответственно заявить, что AI Agent - это самая перспективная область инвестиций в области искусственного интеллекта в среднесрочной и долгосрочной перспективе (независимо от того, в какой области - в американском фондовом рынке или в области Web3), и это направление наиболее близкое к потребителям, которое они могут ощутить. Для обычных людей это самая доступная и масштабируемая область, с которой они могут непосредственно столкнуться и использовать в больших масштабах.
Как описано в его вступительной статье, система AI Agent способна воспринимать и действовать в различных областях и приложениях. AI Agent представляет собой перспективный подход к общему искусственному интеллекту (AGI). Обучение AI Agent уже показало способность к многомодальному пониманию физического мира. Он предоставляет фреймворк для обучения, независимого от реальности, путем комбинирования генеративного искусственного интеллекта с несколькими независимыми источниками данных. Мы представляем общую концепцию системы искусственного интеллекта агента, способную воспринимать и действовать во многих различных областях и приложениях, как парадигму для достижения AGI.
В статье подробно рассматривается текущее положение дел, перспективы применения и направления развития технологии AI Agent в мультимодальном человеко-машинном взаимодействии (HCI), обнаруживая некоторые ключевые технологии и направления инноваций, которые следует тщательно изучить и исследовать. Не допустим, чтобы AI Agent ограничивался только голосовым взаимодействием и визуальным взаимодействием, его область гораздо шире:
Много모дальный HCI путем интеграции речи, текста, изображений, тактильных и других информационных режимов обеспечивает естественное, гибкое и эффективное взаимодействие между человеком и компьютером. Основная цель этой технологии:
• Улучшить естественность взаимодействия и погружения.
• Расширение применимости человеко-компьютерного взаимодействия.
• Повышение способности компьютера понимать разнообразные способы ввода человека.
В статье была проведена систематическая классификация пяти областей исследований:
Концепция: преобразование сложных данных в графическое представление, которое легко понять, с использованием различных восприятий (зрение, осязание, слух и т. д.) для улучшения пользовательского опыта.
Прогресс:
• Визуализация данных на основе виртуальной реальности (VR) и дополненной реальности (AR) для исследований;
• В медицинских и научных исследованиях тактильная обратная связь, такая как силовая и вибрационная обратная связь, помогает пользователям лучше понять распределение данных.
Приложение:
• Мониторинг умного города: отображение данных о потоке города в реальном времени с помощью динамической тепловой карты.
• Анализ медицинских данных: исследование многомерных данных в сочетании с тактильной обратной связью.
Концепция: использование массива микрофонов и алгоритмов машинного обучения для анализа изменений в звуковом поле окружающей среды с целью обеспечения невизуального взаимодействия между человеком и машиной.
Прогресс:
• Повышение точности технологии локализации источников звука;
• Технология речевого взаимодействия с устойчивостью к шумовой среде.
Приложение:
• Умный дом: управление голосом устройствами без необходимости контакта.
• Технология помощи для инвалидов: предоставляет зрячим пользователям звуковые способы взаимодействия.
Концепция: Технология смешанной реальности (MR) объединяет виртуальную информацию с физическим миром, позволяя пользователям манипулировать виртуальной средой с помощью объектов реального мира.
Прогресс:
• Оптимизация взаимодействия с виртуальными объектами на основе физического тактильного ощущения;
• Высокоточная технология отображения физических и виртуальных объектов.
Применение:
• Обучение и тренировка: обучение в иммерсивной среде, которая имитирует реальные условия.
• Промышленный дизайн: проверка продукта с использованием виртуального прототипа.
Концепция:
Взаимодействие осуществляется с помощью носимых устройств, таких как смарт-часы, устройства для мониторинга здоровья и др., используя жесты, касание или технологию электроники на коже.
Прогресс:
• Улучшена чувствительность и долговечность датчика кожи;
• Алгоритм объединения множественных каналов улучшает точность взаимодействия.
Приложение:
• Мониторинг здоровья: в режиме реального времени отслеживание сердечного ритма, сна и физической активности;
• Игры и развлечения: управление виртуальными персонажами с помощью носимых устройств.
Концепция:
Изучение технологий распознавания речи, распознавания эмоций, синтеза речи и т. д., чтобы компьютер лучше понимал и реагировал на языковой ввод пользователя.
Прогресс:
• Популяризация больших языковых моделей (таких как GPT и т. д.) значительно повысила естественность систем диалога;
• Повышение точности технологии распознавания эмоций в голосе.
Применение:
• Робот службы поддержки: поддержка многоязычного голосового взаимодействия.
• Интеллектуальный помощник: персонализированный ответ на голосовые команды.
Поэтому мы видим много проектов AI Agent, особенно в области Web3, которые все еще ограничены уровнем интеллектуальных помощников для межчеловеческого общения, таких как 24-часовые твиты, AI голосовые чаты и чаты для пар. Но недавно мы также наблюдаем инновации в области данных о здоровье тела, комбинируя AI с умными носимыми устройствами, такими как кольца (я не буду называть конкретное имя, вы можете найти их сами), это также является ценным и интересным для #Depin 项目+ #AI блокчейна или приложений, что понравится инвесторам, ведь мы инвестировали в 2 компании, аппаратное обеспечение + программное обеспечение + AI, это потенциальное направление!
Текущие области, в которые активно вкладываются технологические компании
Расширение способов взаимодействия: исследование новых способов взаимодействия, таких как обоняние и температурное восприятие, для дальнейшего улучшения мультимодального слияния.
Оптимизация комбинирования нескольких режимов: разработка эффективных и гибких способов комбинирования различных режимов для более естественного сотрудничества.
Миниатюризация оборудования: разработка более компактных и энергоэффективных устройств для повседневного использования.
Распределенное взаимодействие между устройствами: повышение взаимодействия между устройствами для реализации безшовного взаимодействия между несколькими устройствами.
Повышение устойчивости алгоритмов: особенно в открытой среде, повышение стабильности и реального времени мульти-модальных алгоритмов восприятия и слияния.
Инвестиционные сценарии, которые стоит рассмотреть
• Медицинская реабилитация: с помощью звука, изображений и тактильной обратной связи помогает пациентам в реабилитационном тренировочном процессе и психологическом консультировании.
• Офисное образование: предоставление интеллектуального помощника в офисе и персонализированной платформы образования, повышение эффективности и улучшение опыта.
• Военное моделирование: сочетание технологии дополненной реальности для симуляции боевых действий и тактического обучения.
• Развлечения и игры: создание погружающего игрового и развлекательного опыта, усиление взаимодействия пользователя с виртуальной средой.
Обзор: доктор Ли систематически обработал основные технологии мульти-модального HCI с использованием будущих сценариев применения AI Agent, совместно с практическими применениями и направлениями будущих исследований, для #SOL 链生态的),比如手表,比如吊坠等。这里面的机会比传统只做单一的 #AI, изучение #AIAgent 的投资者指明了方向和投资的逻辑。这篇文章,可以说是2024年必读的AI书籍,让我更清晰地认识到多模态人机交互技术在推动未来智能化生活中的关键作用,揭示了它在开放环境和复杂场景下的巨大潜力。投资未来,才能把握财富!还是那句话:布局 #AI. Нет времени терять!