طورت شركة غوغل نموذج ذكاء اصطناعي لمساعدة العلماء في دراسة طريقة تواصل الدلافين مع بعضها البعض، وفهم ما تقوله.

ويحمل النموذج اسم "DolphinGemma"، وهو أحد النماذج اللغوية الكبيرة، ويعتمد على نماذج الذكاء الاصطناعي المفتوحة المصدر "Gemma" من "غوغل"، والتي بُنيت بدورها على الأسس نفسها لنماذج "Gemini" التجارية للشركة.

ولطالما كان مختلف الأصوات التي تصدرها الدلافينـ بما في ذلك النقرات والصفارات والنبضات، أحد التحديات أمام العلماء لعقود.

وتتعاون "غوغل" في هذا المشروع مع باحثين من معهد جورجيا للتكنولوجيا والمشروع الميداني "Wild Dolphin Project" المتخصص في دارسة الدلافين، بحسب ما كتبته الشركة على مدونتها يوم الاثنين.

وتم تدريب نموذج "DolphinGemma" على تعلُّم بنية الأصوات التي تصدرها الدلافين، والقدرة على توليد تسلسلات صوتية جديدة تشبه أصواتها الحقيقية.

ويستخدم النموذج تقنية صوتية من تطوير "غوغل" تُسمى "SoundStream" لتشفير أصوات الدلافين، مما يسمح بتضمين الأصوات في النموذج أثناء تسجيلها.

ويأمل الفريق أن يُساعد "DolphinGemma" في استنباط أنماط مُعقدة تُتيح إنشاء مفردات مشتركة. وتزعم "غوغل" أن فحص البشر للبيانات بهذه الطريقة سيستغرق وقتًا طويلاً للغاية.

وبدأ مشروع "Wild Dolphin Project" بالفعل في استخدام نموذج "DolphinGemma " خلال موسم العمل الميداني الحالي، مع وعود بفوائد فورية.

ومن خلال تحديد الأنماط الصوتية المتكررة والتجمعات والتسلسلات الموثوقة، يمكن للنموذج مساعدة الباحثين على كشف البُنى الخفية والمعاني المحتملة داخل تواصل الدلافين الطبيعي، وهي مهمة كانت تتطلب سابقًا جهدًا بشريًا هائلًا.

وبمرور الوقت، قد تُستخدم هذه الأنماط، إلى جانب أصوات تركيبية صناعية يُنشئها الباحثون للإشارة إلى أشياء تحب الدلافين اللعب بها، لتطوير مفردات مشتركة تسمح بتواصل تفاعلي حقيقي بين البشر والدلافين.

ويستخدم الفريق هواتف بيكسل من "غوغل" ميدانيًا، لذا كان من الضروري أن يكون النموذج فعالًا. وغالبًا ما يُمثل تشغيل نماذج الذكاء الاصطناعي على الهواتف الذكية تحديًا نظرًا لمحدودية الموارد. وكلما كان النموذج أكبر وأكثر كفاءة، زادت ذاكرة الوصول العشوائي ومعدل المعالجة اللازم لتشغيله.

لكن نموذج "DolphinGemma" عالج هذه المشكلة، إذ يتكون من حوالي 400 مليون معلمة فقط، وهو ما يُعتبر صغيرًا بالنسبة للنماذج اللغوية الكبيرة.

وتخطط "غوغل" لإصدار "DolphinGemma" كنموذج مفتوح المصدر هذا الصيف، لتوفير أدوات للباحثين في أنحاء العالم لتحليل بيانات الصوت خاصتهم وتسريع أبحاثهم عن الأنماط.