أمازون تكشف عن أكبر نموذج لتحويل النص إلى كلام منطوق على الإطلاق – سعوديوم

أعلن فريق من الباحثين في مجال الذكاء الاصطناعي في أمازون عن تطوير ما وصفوه بأكبر نموذج لتحويل النص إلى كلام على الإطلاق، مما يعني وجود أكبر عدد من المعلمات واستخدام أكبر مجموعة بيانات تدريبية. قاموا بنشر ورقة بحثية على خادم الطباعة المسبقة arXiv تصف كيفية تطوير النموذج والتدريب.

وفقًا لـ techxplore، اكتسبت نماذج الدردشة ذات الذكاء الاصطناعي (LLMs) مثل ChatGPT الاهتمام لقدرتها الشبيهة بالإنسان على الإجابة بذكاء على الأسئلة وإنشاء مستندات عالية المستوى، لكن الذكاء الاصطناعي لا يزال يشق طريقه إلى التطبيقات السائدة الأخرى أيضًا، وفي هذا الجديد جهدًا كبيرًا، حاول الباحثون تحسين قدرة تطبيق تحويل النص إلى كلام من خلال زيادة عدد المعلمات والإضافة إلى قاعدته التدريبية.

النموذج الجديد، الذي يسمى القدرات الناشئة، تحويل النص إلى كلام (TTS) التكيفي الكبير (اختصار BASE TTS)، يحتوي على 980 مليون معلمة وتم تدريبه باستخدام 100 ألف ساعة من الكلام المسجل (الموجود على المواقع العامة)، معظمه باللغة الإنجليزية.

كما قدم الفريق أمثلة لكلمات وعبارات منطوقة بلغات أخرى للسماح للنموذج بنطق العبارات المعروفة بشكل صحيح عندما يواجهها، على سبيل المثال، “au Contraire”، أو “adios,amigo”.

اختبر فريق أمازون أيضًا النموذج على مجموعات بيانات أصغر، على أمل معرفة أين يتقدم ما أصبح معروفًا في مجال الذكاء الاصطناعي بالجودة الناشئة، حيث يتم تطبيق الذكاء الاصطناعي، سواء كان تطبيق LLM أو تطبيق تحويل النص إلى كلام، فجأة يبدو أنه وصل إلى مستوى أعلى من الذكاء.

ووجدوا أنه بالنسبة لتطبيقهم، كانت مجموعة البيانات متوسطة الحجم هي المكان الذي حدثت فيه القفزة إلى مستوى أعلى، عند 150 مليون معلمة.

وأشاروا أيضًا إلى أن هذه القفزة شملت مجموعة من السمات اللغوية، مثل القدرة على استخدام الأسماء المركبة، والتعبير عن العواطف، واستخدام الكلمات الأجنبية، وتطبيق علم اللغويات وعلامات الترقيم وطرح الأسئلة التي تركز على الكلمة الصحيحة في النص.

يقول الفريق أن BASE TTS لن يتم إصداره للجمهور، لأنهم يخشون استخدامه بشكل غير أخلاقي، وبدلاً من ذلك، يخططون لاستخدامه كتطبيق تعليمي.

ويتوقعون تطبيق ما تعلموه حتى الآن لتحسين جودة الصوت البشري لتطبيقات تحويل النص إلى كلام بشكل عام.


مصدر الخبر

مقالات ذات صلة

زر الذهاب إلى الأعلى