نتائج البحث عن "AUDIO"
06:18

أصدرت كيمي نموذج الصوت الأساسي العام الجديد Kimi-Audio

جين10 بيانات 26 أبريل، اليوم، أصدرت Kimi مشروع مفتوح المصدر جديد - نموذج Kimi-Audio الأساسي الصوتي العام الجديد. ووفقًا لما تم تقديمه، فإن هذا النموذج يدعم التعرف على الصوت، وفهم الصوت، وتحويل الصوت إلى نص، والحوار الصوتي، وغيرها من المهام المتنوعة.
المزيد
AUDIO-1.95%
03:22

تم اختيار ورقة البحث المتعلقة بنموذج لغة الصوت Qwen2-Audio المفتوح المصدر لتوليف الصوت والنص الخاص بها ضمن مؤتمر ACL الرفيع المستوى لعام 2024.

أخبار بوابة جيتيو: في 13 أغسطس، قام فريق تونجي تشونغ الخاص بـ Alibaba بإطلاق نموذج Qwen2-Audio المفتوح المصدر، وهو جزء من عائلة Qwen2 المفتوح المصدر. يتيح Qwen2-Audio القدرة على الإجابة على الأسئلة من خلال الصوت دون الحاجة إلى إدخال النص، حيث يمكنه فهم وتحليل الإشارات الصوتية المدخلة من المستخدم، بما في ذلك الأصوات البشرية والصوت الطبيعي والموسيقى وما إلى ذلك. هذا النموذج تفوق بشكل ملحوظ على أفضل النماذج السابقة في العديد من التقييمات الرسمية. كما قام فريق التونجي تشونغ بإطلاق تقييم جديد لفهم الصوت بالكامل، وهو يتضمن بحثًا مختارًا في مؤتمر ACL2024 الدولي الذي يعقد هذا الأسبوع.
AUDIO-1.95%
  • 3
03:40
وفقا ل Pinwan ، تظهر صفحة Arxiv أن Alibaba أصدرت مؤخرا نموذجا للغة صوتية يسمى Qwen-Audio. تم تصميم النموذج لتحقيق فهم صوتي عالمي من خلال توسيع التدريب المسبق للغة الصوتية لتغطية أكثر من 30 مهمة وأنواع صوتية مختلفة ، مثل الأصوات البشرية وأصوات الطبيعة والموسيقى والأغاني. أظهرت الأبحاث أن Qwen-Audio يحقق أداء كبيرا في مجموعة واسعة من المهام المعيارية دون الحاجة إلى ضبط دقيق خاص بالمهمة.
AUDIO-1.95%
05:16
في 24 أكتوبر ، أصدرت مجلة تايم قائمة "أفضل الاختراعات 2023" ، والتي تضم 200 ابتكار يغير الطريقة التي نعيش بها. من بينها ، تم اختيار ما مجموعه 14 مشروعا في مجال الذكاء الاصطناعي ، بما في ذلك Adobe Photoshop's Generative Expand and Generative Fill ، و OpenAI's GPT-4 و Dall-E 3 ، و Runway Gen-2 ، و Meta SeamlessM4T ، و Stable Audio وما إلى ذلك.
13:49
وفقًا لموقع TechCrunch، في 13 سبتمبر، أعلنت شركة Stability AI عن إطلاق Stable Audio، وهو مولد موسيقى يعمل بالذكاء الاصطناعي. تدعي Stable أنها الأداة الأولى القادرة على إنشاء موسيقى "عالية الجودة" بتردد 44.1 كيلو هرتز للاستخدام التجاري من خلال تقنية تسمى الانتشار الكامن. من خلال التدريب على البيانات الوصفية الصوتية بالإضافة إلى مدة ووقت بدء الملفات الصوتية، قال Stability أنه بالمقارنة مع أدوات الموسيقى التوليدية التي تم إصدارها مسبقًا، فإن النموذج الأساسي لـ Audio Diffusion يحتوي على ما يقرب من 1.2 مليار معلمة ويمكنه تجميع محتوى ومحتوى الصوت. مدة. قبل عام، أصدرت Stability AI بهدوء Dance Diffusion، ولكن بعد ذلك توقف Harmonai، معهد الأبحاث الذي مولته Stability لإنشاء النموذج، عن تحديث Dance Diffusion. لم يتم تطوير الصوت الثابت الذي تم إطلاقه اليوم بواسطة Harmonai فقط. أنشأ فريق الصوت في Stability، والذي تم إطلاقه رسميًا في أبريل، نموذجًا جديدًا مستوحى من Dance Diffusion كأساس لـ Stable Audio، والذي تم تدريبه بعد ذلك بواسطة Harmonai. حاليًا، يتوفر الصوت الثابت فقط من خلال تطبيق الويب. لم تعلن شركة Stability أيضًا عن خطط لإصدار النموذج الكامن وراء Stable Audio كمصدر مفتوح.
  • 1
19:36
Kim Asendorf: مدير فيديو Metallica الذي يصنع NFT Art مصممًا للتنويم المغناطيسي كشف Kim Asendorf ، وهو خبير تعبيري رقمي وفن الإنترنت ، عن أحدث إصداراته في NFT ، "Colors of Noise". برعاية Peggy Schoenegge لمنصة Feral File ، ستتوفر سلسلة من 50 عملاً فنيًا فريدًا مقابل 0.25 ETH لكل منها. قام Asendorf بدمج الفن المرئي والمسموع لأول مرة في حياته المهنية ، باستخدام Web Audio API لتوليد ضوضاء بيضاء وإنشاء رسوم متحركة.
تحميل المزيد
العلامات الساخنة

أهم المواضيع

المزيد

تقويم العملات الرقمية

المزيد
مستقبل المال والحكم والقانون 2025 في واشنطن
تستعد Constellation لحضور مؤتمر مستقبل المال والحكم والقانون 2025، المقرر عقده في 30 أكتوبر في واشنطن.
2025-10-29
إيقاف تشغيل الشبكة الرئيسية القديمة
أصدرت نيو تذكيرًا رسميًا بأن شبكة نيو ليجاسي الرئيسية ستتوقف عن العمل في 31 أكتوبر. يُحث المستخدمون على إكمال عملية نقل الأصول الخاصة بهم قبل الموعد النهائي لتجنب خطر فقدان الأموال. سيتم إيقاف شبكة ليجاسي بالكامل، والتي تم إطلاقها في الأصل كشبكة أنتشيرز الرئيسية في عام 2016، مما يمثل نهاية مرحلتها التشغيلية ضمن نظام نيو البيئي.
2025-10-30
أسبوع الذكاء الاصطناعي في سياتل
تخطط Arcblock للكشف عن شراكة جديدة خلال أسبوع الذكاء الاصطناعي في سياتل من 27 إلى 31 أكتوبر. ومن المتوقع أن يجذب المؤتمر أكثر من 3,500 مشارك ويضم قائمة بCoinbase وAccenture وشركات أخرى كراعٍ.
2025-10-30
هاكاثون
تطلق Flow Forte Hacks، وهو هاكاثون افتراضي يقدم أكثر من 250,000 دولار من الجوائز والمزايا، بدءًا من 1-31 أكتوبر. يهدف الحدث إلى استكشاف الإمكانيات الكاملة لنظام Flow البيئي. Forte متاحة الآن على شبكة Flow الاختبارية، مما يسمح للمطورين بالبدء مبكرًا في مشاريعهم قبل بدء الهاكاثون.
2025-10-30
كوزموفيرس في سبليت
ستستضيف كوزموس كوزموفيرس 2025 في سبليت، كرواتيا، في الفترة من 30 أكتوبر إلى 1 نوفمبر، حيث يجتمع مطورو البلوكشين، ومساهمو النظام البيئي، وخبراء السياسات لمدة ثلاثة أيام من النقاشات، وورش العمل، والتواصل.
2025-10-31