
يشارك باحثو Apple أعمالهم في بناء نموذج لغوي واسع النطاق للذكاء الاصطناعي متعدد الوسائط (AI) في ورقة بحثية تسلط الضوء على كيفية تحقيق إمكانات متقدمة لتعليم الأنظمة الصناعية لفهم اللغة وتحليل الصور.
تأتي تطورات الذكاء الاصطناعي الجديدة من شركة آبل في أعقاب تصريحات الرئيس التنفيذي تيم كوك خلال مكالمات أرباح الشركة حيث قال إن ميزات الذكاء الاصطناعي قد تصل في وقت لاحق من هذا العام، وفقًا لموقع Gadgets360.
ووفقا للباحثين، فإنهم يعملون على MM1، وهي عائلة من النماذج متعددة الوسائط تحتوي على ما يصل إلى 30 مليار معلمة. أطلق عليها مؤلفو الورقة اسم “LLM متعدد الوسائط (MLLM).” أبرز مؤلفو الورقة أن برامج تشفير الصور وموصل لغة الرؤية ومكونات الهندسة المعمارية الأخرى واختيارات البيانات تم إجراؤها لإنشاء نموذج ذكاء اصطناعي قادر على فهم كل من النص والمدخلات المستندة إلى الصور.
على سبيل المثال، ذكرت الورقة: “لقد أثبتنا أنه بالنسبة للتدريب المسبق متعدد الوسائط على نطاق واسع، فإن استخدام مزيج دقيق من التسميات التوضيحية للصور ونصوص الصور المتداخلة والبيانات النصية فقط يعد أمرًا بالغ الأهمية لتحقيق أحدث ما توصلت إليه التكنولوجيا ( SOTA) النتائج.” منخفضة عبر معايير متعددة، مقارنة بدرجات التدريب المسبق المنشورة الأخرى.
للتوضيح، نموذج الذكاء الاصطناعي حاليًا في مرحلة ما قبل التدريب، مما يعني أنه لم يتم تدريبه بما يكفي ليعطي المخرجات المطلوبة. هذه هي المرحلة التي يتم فيها استخدام الخوارزمية وبنية الذكاء الاصطناعي لتصميم سير عمل النموذج وكيف سيعالج البيانات في النهاية. أضاف باحثو Apple رؤية الكمبيوتر إلى النموذج باستخدام برامج ترميز الصور وموصل لغة الرؤية، وبعد ذلك، عند الاختبار باستخدام مجموعة من الصور والصور والنصوص ومجموعة بيانات نصية فقط، وجد الفريق أن النتائج كانت تنافسية مقارنة بالنتائج الحالية. نماذج في نفس المرحلة
وعلى الرغم من أهمية هذا الإنجاز، إلا أن هذه الورقة ليست كافية لتأكيد ما إذا كان سيتم إضافة روبوت الدردشة متعدد الوسائط المزود بالذكاء الاصطناعي إلى نظام التشغيل الخاص بشركة Apple. في هذه المرحلة، من الصعب حتى تحديد ما إذا كان نموذج الذكاء الاصطناعي متعدد الوسائط أثناء تلقي المدخلات أو إعطاء المخرجات أيضًا (ما إذا كان يمكنه إنشاء صور الذكاء الاصطناعي أم لا)، ولكن إذا تم التأكد من أن النتائج متسقة بعد مراجعة النظراء ، يمكن القول إن عملاق التكنولوجيا قد اتخذ خطوة كبيرة أخرى نحو بناء نموذج أساسي أصلي للذكاء الاصطناعي.