أداة ذكاء اصطناعي جديدة من قوقل لإنشاء الموسيقى من النصوص

  • تاريخ النشر: الأحد، 29 يناير 2023
مقالات ذات صلة
قوقل تطور 21 أداة تعمل بالذكاء الاصطناعي لتقديم نصائح حول الحياة
أداة جديدة للكشف عن المحتوى المكتوب باستخدام الذكاء الاصطناعي
ابتكار أداة جديدة بالذكاء الاصطناعي للتحدث مع حيواننا الأليف

يمكن لأداة الذكاء الاصطناعي (AI) الجديدة من قوقل الآن إنشاء موسيقى في أي نوع من الرسائل النصية. وفقًا لأبحاث قوقل، فإن التقنية المسماة MusicLM هي نظام تحويل النص إلى موسيقى. إنه يعمل عن طريق تحليل النص وفك تشفير مقياس وتعقيد التكوين.

وجاء في بحث قوقل "نقدم MusicLM وهو نموذج يولد موسيقى عالية الدقة من أوصاف نصية مثل، لحن كمان مهدئ مدعوم بفرقة غيتار، MusicLM يمكن تكييفه على كل من النص واللحن من حيث إنه يمكن أن يحول الألحان الصافرة والخافتة وفقًا للأسلوب الموصوف في تعليق نصي".

فيديو ذات صلة

This browser does not support the video element.

تم تدريب MusicLM على مجموعة بيانات من 280.000 ساعة من الموسيقى لتعلم كيفية إنشاء أغانٍ متماسكة من أوصاف النص والتقاط الفروق الدقيقة مثل الحالة المزاجية واللحن والآلات. تتجاوز إمكانياتها إنتاج مقاطع قصيرة من الأغاني. أظهر باحثو قوقل أن النظام يمكن أن يبني على الألحان الموجودة، سواء كانت همهمة أو غناء أو صفيراً أو عزف على آلة موسيقية.

علاوة على ذلك، وفقًا للبحث، يمكن أن تأخذ MusicLM أيضًا العديد من الأوصاف المكتوبة بالتسلسل، على سبيل المثال "وقت التأمل" و"وقت الاستيقاظ" و"وقت الجري" وإنشاء نوع من "الحكاية" اللحنية أو السرد يصل طوله إلى عدة دقائق. يمكن أيضًا أن يتم توجيهه من خلال مجموعة من الصور والشرح أو إنشاء صوت يتم تشغيله بواسطة نوع معين من الآلات في لعبة معينة.

والجدير بالذكر أن قوقل ليست أول شركة تقوم بذلك. وفقًا لـ TechCrunch، ومع ذلك ، نظرًا للقيود التقنية وبيانات التدريب المحدودة، لم يتمكن أي منهم من إنتاج أغانٍ معقدة بشكل خاص في تكوين الدقة العالية. لذلك، يعتقد الباحثون أن MusicLM ربما يكون أول من يستطيع ذلك.

يلقي MusicLM عملية إنشاء الموسيقى الشرطية كمهمة تصميم تسلسل إلى تسلسل هرمي، ويولد موسيقى عند 24 كيلو هرتز تظل متسقة على مدار عدة دقائق. تُظهر التجارب أن MusicLM يتفوق على الأنظمة السابقة في كل من جودة الصوت والالتزام بوصف النص.

لاحظ باحثو قوقل أيضًا التحديات الأخلاقية العديدة التي يفرضها نظام مثل MusicLM، بما في ذلك الميل إلى دمج المواد المحمية بحقوق الطبع والنشر من بيانات التدريب في الأغاني التي تم إنشاؤها. خلال إحدى التجارب، وجد الباحثون أن حوالي 1 في المائة من الموسيقى التي يولدها النظام تم نسخها مباشرة من الأغاني التي تم التدريب عليها.

كتب المؤلفون المشاركون في البحث "نحن نقر بخطر الاختلاس المحتمل للمحتوى الإبداعي" وأضافوا "نؤكد بشدة على الحاجة إلى مزيد من العمل المستقبلي في معالجة هذه المخاطر المرتبطة بتوليد الموسيقى".