Anda perlu mengenal #AI Agent, buku (makalah) ini adalah bacaan wajib yang tidak bisa dilewatkan. AGENT AI oleh Li Feifei, ini adalah buku yang paling menyenangkan dan berorientasi masa depan yang saya baca tahun ini, dan mudah dipahami tanpa istilah profesional yang dalam dan logika algoritma, layak dibaca oleh setiap orang biasa, tautan lengkapnya terdapat di komentar akhir tulisan.
Saya dapat dengan bertanggung jawab memberitahu semua orang: AI Agent adalah bidang investasi paling menarik di bidang kecerdasan buatan (baik itu saham Amerika maupun di wilayah Web3), juga merupakan arah yang paling dekat dengan pengguna To C yang dapat dirasakan, bagi masyarakat umum, ini adalah bidang yang paling langsung dapat diakses dan dapat digunakan secara massal.
Seperti yang dijelaskan dalam pendahuluan makalah ini: gambaran umum sistem AI Agent, sistem ini mampu merasakan dan bertindak dalam berbagai domain dan aplikasi. AI Agent adalah pendekatan yang menjanjikan menuju Kecerdasan Buatan Umum (AGI). Pelatihan AI Agent telah terbukti mampu memahami multimodalitas di dunia fisik. Ini menyediakan kerangka kerja untuk pelatihan yang tidak terkait dengan kehidupan nyata, dengan memanfaatkan kecerdasan buatan yang generatif dan menggabungkannya dengan beberapa sumber data independen. Kami menyajikan gambaran umum tentang sistem kecerdasan agen yang mampu merasakan dan bertindak dalam banyak domain dan aplikasi sebagai paradigma agen menuju AGI.
Di antara artikel tersebut, AI Agent menekankan situasi teknologi, prospek aplikasi, dan arah perkembangan HCI (interaksi manusia-komputer multimodal) di masa depan, yang menunjukkan beberapa teknologi inti dan arah inovatif yang layak kita pertimbangkan dan gali lebih dalam. Jangan biarkan AI Agent hanya berhenti pada interaksi suara dan interaksi visual, jangkauannya lebih luas:
Konsep Inti dan Makna dari HCI Multimodal
Interaksi manusia dan komputer yang alami, fleksibel, dan efisien dapat dicapai melalui integrasi berbagai mode informasi seperti suara, teks, gambar, dan sentuhan dalam HCI multimodal. Tujuan inti dari teknologi ini adalah:
• Meningkatkan kealamian dan keimajinan interaksi.
• Memperluas kegunaan skenario interaksi manusia dan mesin.
• Meningkatkan kemampuan komputer untuk memahami beragam mode masukan manusia.
arah pengembangan masa depan
Artikel ini melakukan tinjauan sistematis dari lima bidang penelitian:
Interaksi Visualisasi Big Data
Konsep: Mengubah data kompleks menjadi representasi visual yang mudah dipahami, meningkatkan pengalaman pengguna melalui saluran multisensoris (visual, taktil, pendengaran, dll).
Perkembangan:
• Eksplorasi visualisasi data berbasis realitas virtual (VR) dan realitas tambahan (AR);
• Dalam bidang medis dan penelitian, umpan balik sentuhan (seperti umpan balik kekuatan dan getaran) membantu pengguna memahami distribusi data dengan lebih baik.
Aplikasi:
• Pemantauan Kota Pintar: Menampilkan data lalu lintas kota secara real-time melalui peta panas dinamis.
• Analisis Data Medis: Menyelidiki data multidimensi dengan umpan balik sensorik.
Berinteraksi berbasis persepsi medan suara
Konsep: Menganalisis perubahan medan suara di lingkungan menggunakan larik mikrofon dan algoritma pembelajaran mesin, membantu mencapai interaksi manusia-mesin non-visual.
Kemajuan:
• Peningkatan akurasi teknologi penentuan lokasi sumber suara;
• Teknologi interaksi suara yang tangguh dalam lingkungan berisik.
Aplikasi:
• Rumah pintar: kendalikan perangkat dengan suara, tugas selesai tanpa sentuhan.
• Teknologi Difabel: Memberikan cara interaksi berbasis suara untuk pengguna dengan gangguan penglihatan.
Interaksi fisik realitas campuran
Konsep: Menggabungkan informasi virtual dengan dunia fisik melalui teknologi realitas campuran (MR), pengguna dapat mengontrol lingkungan virtual menggunakan objek di dunia nyata.
Kemajuan:
• Optimalisasi Interaksi Objek Virtual Berbasis Rasa Sentuhan Fisik;
• Teknologi pemetaan objek fisik-virtual yang akurat tinggi.
Aplikasi:
• Pendidikan dan Pelatihan: Melalui simulasi lingkungan nyata untuk pembelajaran yang mendalam.
• Desain Industri: Validasi produk menggunakan prototipe virtual.
Interaksi yang Dapat Dipakai
Konsep:
Melalui perangkat yang dapat dipakai seperti jam tangan pintar dan perangkat pemantauan kesehatan, interaksi dapat diimplementasikan melalui gerakan, sentuhan, atau teknologi elektronik kulit.
Kemajuan:
• Peningkatan sensitivitas dan daya tahan sensor kulit;
• Algoritma penggabungan multi-channel meningkatkan akurasi interaksi.
Aplikasi:
• Pemantauan Kesehatan: Pelacakan real-time detak jantung, tidur, dan status olahraga;
• Hiburan game: Mengendalikan karakter virtual melalui perangkat wearable.
interaksi percakapan manusia dan mesin
Konsep:
Mempelajari teknologi pengenalan suara, pengenalan emosi, sintesis suara, dan lainnya sehingga komputer dapat lebih memahami dan merespons masukan bahasa dari pengguna.
Progress:
• Pemasyarakatan model bahasa besar (seperti GPT) secara signifikan meningkatkan kealamian sistem percakapan;
• Peningkatan akurasi teknologi pengenalan emosi suara.
Aplikasi:
• Bot Layanan Pelanggan: Mendukung interaksi suara dalam berbagai bahasa.
• Asisten Cerdas: Respons perintah suara yang dipersonalisasi.
Jadi kami melihat banyak proyek AI Agent, terutama di bidang Web3, sebagian besar masih berfokus pada asisten cerdas dalam interaksi percakapan manusia-mesin, seperti tweet 24 jam, obrolan suara AI seribu wajah, obrolan pasangan, dan sebagainya. Namun, akhir-akhir ini kami juga melihat kombinasi AI dan perangkat wearable cerdas untuk menyediakan inovasi dalam bidang data kesehatan tubuh, seperti cincin (saya tidak akan menyebutkan merek tertentu, Anda bisa mencarinya sendiri), juga merupakan kombinasi antara AI dan rantai blok atau aplikasi #Depin 项目+ #, yang akan lebih bernilai dan menarik, juga akan lebih disukai oleh para investor. Karena pada akhirnya kami telah menginvestasikan di 2 perusahaan, gabungan perangkat keras+perangkat lunak+AI ini akan menjadi arah yang sangat berpotensi!
Saat ini, perusahaan teknologi telah banyak berinvestasi di bidang-bidang tertentu.
Memperluas cara berinteraksi: Menjelajahi metode interaksi baru, seperti penciuman dan sensor suhu, untuk lebih meningkatkan dimensi penggabungan multi-modal.
Optimalisasi kombinasi multimodal: Desain cara kombinasi multimodal yang efisien dan fleksibel, sehingga mode yang berbeda dapat bekerja secara lebih alami bersama.
Peminiaturan perangkat: Mengembangkan perangkat yang lebih ringan, lebih hemat energi untuk digunakan sehari-hari.
Interaksi Terdistribusi lintas Perangkat: Meningkatkan interoperabilitas antar perangkat, mewujudkan interaksi multi-perangkat yang mulus.
Peningkatan ketahanan algoritma: Terutama dalam lingkungan terbuka, meningkatkan stabilitas dan waktu nyata algoritma persepsi dan integrasi multimodal.
Skema Investasi yang Layak
• Rehabilitasi Medis: Membantu pasien dalam latihan rehabilitasi dan pengembangan psikologis melalui umpan balik suara, gambar, dan sentuhan.
• Kantor Pendidikan: Menyediakan asisten kantor pintar dan platform pendidikan yang personalisasi, meningkatkan efisiensi dan pengalaman.
• Simulasi Militer: Menggabungkan teknologi realitas campuran, digunakan untuk simulasi pertempuran dan pelatihan taktis.
• Hiburan dan Permainan: Membangun pengalaman permainan dan hiburan yang mendalam, meningkatkan interaksi pengguna dengan lingkungan virtual.
Ringkasan: Dalam artikel ini, Dr. Li secara sistematis merangkum teknologi inti HCI multimodal dan menerapkannya dalam skenario masa depan menggunakan AI Agent, serta menggabungkan aplikasi praktis dan arah penelitian masa depan untuk mendukung pengembangan dan pembelajaran AI. Tidak boleh ditunda!
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
Bagaimana cara menata masa depan keuangan melalui AI Agent? Artikel ini memberi Anda jawabannya
Penulis asli: Rocky
Repost: Daisy, Mars Finance
Anda perlu mengenal #AI Agent, buku (makalah) ini adalah bacaan wajib yang tidak bisa dilewatkan. AGENT AI oleh Li Feifei, ini adalah buku yang paling menyenangkan dan berorientasi masa depan yang saya baca tahun ini, dan mudah dipahami tanpa istilah profesional yang dalam dan logika algoritma, layak dibaca oleh setiap orang biasa, tautan lengkapnya terdapat di komentar akhir tulisan.
Saya dapat dengan bertanggung jawab memberitahu semua orang: AI Agent adalah bidang investasi paling menarik di bidang kecerdasan buatan (baik itu saham Amerika maupun di wilayah Web3), juga merupakan arah yang paling dekat dengan pengguna To C yang dapat dirasakan, bagi masyarakat umum, ini adalah bidang yang paling langsung dapat diakses dan dapat digunakan secara massal.
Seperti yang dijelaskan dalam pendahuluan makalah ini: gambaran umum sistem AI Agent, sistem ini mampu merasakan dan bertindak dalam berbagai domain dan aplikasi. AI Agent adalah pendekatan yang menjanjikan menuju Kecerdasan Buatan Umum (AGI). Pelatihan AI Agent telah terbukti mampu memahami multimodalitas di dunia fisik. Ini menyediakan kerangka kerja untuk pelatihan yang tidak terkait dengan kehidupan nyata, dengan memanfaatkan kecerdasan buatan yang generatif dan menggabungkannya dengan beberapa sumber data independen. Kami menyajikan gambaran umum tentang sistem kecerdasan agen yang mampu merasakan dan bertindak dalam banyak domain dan aplikasi sebagai paradigma agen menuju AGI.
Di antara artikel tersebut, AI Agent menekankan situasi teknologi, prospek aplikasi, dan arah perkembangan HCI (interaksi manusia-komputer multimodal) di masa depan, yang menunjukkan beberapa teknologi inti dan arah inovatif yang layak kita pertimbangkan dan gali lebih dalam. Jangan biarkan AI Agent hanya berhenti pada interaksi suara dan interaksi visual, jangkauannya lebih luas:
Interaksi manusia dan komputer yang alami, fleksibel, dan efisien dapat dicapai melalui integrasi berbagai mode informasi seperti suara, teks, gambar, dan sentuhan dalam HCI multimodal. Tujuan inti dari teknologi ini adalah:
• Meningkatkan kealamian dan keimajinan interaksi.
• Memperluas kegunaan skenario interaksi manusia dan mesin.
• Meningkatkan kemampuan komputer untuk memahami beragam mode masukan manusia.
Artikel ini melakukan tinjauan sistematis dari lima bidang penelitian:
Konsep: Mengubah data kompleks menjadi representasi visual yang mudah dipahami, meningkatkan pengalaman pengguna melalui saluran multisensoris (visual, taktil, pendengaran, dll).
Perkembangan:
• Eksplorasi visualisasi data berbasis realitas virtual (VR) dan realitas tambahan (AR);
• Dalam bidang medis dan penelitian, umpan balik sentuhan (seperti umpan balik kekuatan dan getaran) membantu pengguna memahami distribusi data dengan lebih baik.
Aplikasi:
• Pemantauan Kota Pintar: Menampilkan data lalu lintas kota secara real-time melalui peta panas dinamis.
• Analisis Data Medis: Menyelidiki data multidimensi dengan umpan balik sensorik.
Konsep: Menganalisis perubahan medan suara di lingkungan menggunakan larik mikrofon dan algoritma pembelajaran mesin, membantu mencapai interaksi manusia-mesin non-visual.
Kemajuan:
• Peningkatan akurasi teknologi penentuan lokasi sumber suara;
• Teknologi interaksi suara yang tangguh dalam lingkungan berisik.
Aplikasi:
• Rumah pintar: kendalikan perangkat dengan suara, tugas selesai tanpa sentuhan.
• Teknologi Difabel: Memberikan cara interaksi berbasis suara untuk pengguna dengan gangguan penglihatan.
Konsep: Menggabungkan informasi virtual dengan dunia fisik melalui teknologi realitas campuran (MR), pengguna dapat mengontrol lingkungan virtual menggunakan objek di dunia nyata.
Kemajuan:
• Optimalisasi Interaksi Objek Virtual Berbasis Rasa Sentuhan Fisik;
• Teknologi pemetaan objek fisik-virtual yang akurat tinggi.
Aplikasi:
• Pendidikan dan Pelatihan: Melalui simulasi lingkungan nyata untuk pembelajaran yang mendalam.
• Desain Industri: Validasi produk menggunakan prototipe virtual.
Konsep:
Melalui perangkat yang dapat dipakai seperti jam tangan pintar dan perangkat pemantauan kesehatan, interaksi dapat diimplementasikan melalui gerakan, sentuhan, atau teknologi elektronik kulit.
Kemajuan:
• Peningkatan sensitivitas dan daya tahan sensor kulit;
• Algoritma penggabungan multi-channel meningkatkan akurasi interaksi.
Aplikasi:
• Pemantauan Kesehatan: Pelacakan real-time detak jantung, tidur, dan status olahraga;
• Hiburan game: Mengendalikan karakter virtual melalui perangkat wearable.
Konsep:
Mempelajari teknologi pengenalan suara, pengenalan emosi, sintesis suara, dan lainnya sehingga komputer dapat lebih memahami dan merespons masukan bahasa dari pengguna.
Progress:
• Pemasyarakatan model bahasa besar (seperti GPT) secara signifikan meningkatkan kealamian sistem percakapan;
• Peningkatan akurasi teknologi pengenalan emosi suara.
Aplikasi:
• Bot Layanan Pelanggan: Mendukung interaksi suara dalam berbagai bahasa.
• Asisten Cerdas: Respons perintah suara yang dipersonalisasi.
Jadi kami melihat banyak proyek AI Agent, terutama di bidang Web3, sebagian besar masih berfokus pada asisten cerdas dalam interaksi percakapan manusia-mesin, seperti tweet 24 jam, obrolan suara AI seribu wajah, obrolan pasangan, dan sebagainya. Namun, akhir-akhir ini kami juga melihat kombinasi AI dan perangkat wearable cerdas untuk menyediakan inovasi dalam bidang data kesehatan tubuh, seperti cincin (saya tidak akan menyebutkan merek tertentu, Anda bisa mencarinya sendiri), juga merupakan kombinasi antara AI dan rantai blok atau aplikasi #Depin 项目+ #, yang akan lebih bernilai dan menarik, juga akan lebih disukai oleh para investor. Karena pada akhirnya kami telah menginvestasikan di 2 perusahaan, gabungan perangkat keras+perangkat lunak+AI ini akan menjadi arah yang sangat berpotensi!
Saat ini, perusahaan teknologi telah banyak berinvestasi di bidang-bidang tertentu.
Memperluas cara berinteraksi: Menjelajahi metode interaksi baru, seperti penciuman dan sensor suhu, untuk lebih meningkatkan dimensi penggabungan multi-modal.
Optimalisasi kombinasi multimodal: Desain cara kombinasi multimodal yang efisien dan fleksibel, sehingga mode yang berbeda dapat bekerja secara lebih alami bersama.
Peminiaturan perangkat: Mengembangkan perangkat yang lebih ringan, lebih hemat energi untuk digunakan sehari-hari.
Interaksi Terdistribusi lintas Perangkat: Meningkatkan interoperabilitas antar perangkat, mewujudkan interaksi multi-perangkat yang mulus.
Peningkatan ketahanan algoritma: Terutama dalam lingkungan terbuka, meningkatkan stabilitas dan waktu nyata algoritma persepsi dan integrasi multimodal.
Skema Investasi yang Layak
• Rehabilitasi Medis: Membantu pasien dalam latihan rehabilitasi dan pengembangan psikologis melalui umpan balik suara, gambar, dan sentuhan.
• Kantor Pendidikan: Menyediakan asisten kantor pintar dan platform pendidikan yang personalisasi, meningkatkan efisiensi dan pengalaman.
• Simulasi Militer: Menggabungkan teknologi realitas campuran, digunakan untuk simulasi pertempuran dan pelatihan taktis.
• Hiburan dan Permainan: Membangun pengalaman permainan dan hiburan yang mendalam, meningkatkan interaksi pengguna dengan lingkungan virtual.
Ringkasan: Dalam artikel ini, Dr. Li secara sistematis merangkum teknologi inti HCI multimodal dan menerapkannya dalam skenario masa depan menggunakan AI Agent, serta menggabungkan aplikasi praktis dan arah penelitian masa depan untuk mendukung pengembangan dan pembelajaran AI. Tidak boleh ditunda!