في خطوة جديدة تعكس توجهها نحو الذكاء الاصطناعي الصوتي، أعلنت شركة غوغل عن إضافة نموذجها الصوتي Chirp 3 إلى منصة Vertex AI، مما يمهّد الطريق لتطوير تقنيات أكثر تطورًا في تحويل الكلام إلى نص، وتحويل النصوص إلى أصوات عالية الجودة.
تركّز معظم أبحاث الذكاء الاصطناعي التوليدي حتى الآن على النصوص والصور، لكن "غوغل" تدفع بقوة نحو ثورة الصوت، حيث كشفت عن دعم Chirp 3 في منصتها السحابية بدءًا من الأسبوع المقبل.
ويأتي ذلك بعد إعلان الشركة عن إطلاق 8 أصوات جديدة تدعم 31 لغة، مما يعزز إمكانيات إنشاء المساعدات الصوتية، الكتب الصوتية، وكلاء الدعم، والتعليقات الصوتية على الفيديوهات، بحسب تقرير نشره موقع "تك كرانش".
تتزامن هذه الخطوة مع تحركات بارزة من شركات أخرى مثل "Sesame AI"، التي أطلقت حديثًا نموذجًا متقدمًا لإنشاء أصوات قريبة جدًا من الأصوات البشرية، مما يُشعل المنافسة في هذا المجال.
كما تبرز شركة ElevenLabs التي جمعت تمويلات ضخمة لتوسيع تقنياتها في الصوتيات الذكية.
ضوابط صارمة لمنع إساءة الاستخدام
رغم الإمكانيات الهائلة التي يوفرها Chirp 3، أكدت "غوغل" أن هناك قيودًا وضوابط على استخدامه لضمان عدم استغلاله في أغراض غير أخلاقية، حيث صرّح الرئيس التنفيذي لـ Google Cloud، توماس كوريان، بأن فريق السلامة يعمل على معالجة هذه القضايا.
Vertex AI.. منصة "غوغل" لمستقبل الذكاء الاصطناعي
تسعى "غوغل" لتعزيز منصتها Vertex AI، التي أطلقتها عام 2021، لتكون الوجهة الأساسية للمطورين في بناء وتدريب نماذج الذكاء الاصطناعي التوليدي.
وتعمل "غوغل" على منافسة عمالقة التقنية مثل "مايكروسوفت" و"أمازون"، عبر تقديم حلول مبتكرة تشمل نماذج مثل Gemini للذكاء الاصطناعي النصي، Imagen لتوليد الصور، وVeo 2 لتوليد الفيديو.
في ظل هذه التطورات، يبدو أن المستقبل سيكون للصوت، حيث يُتوقع أن يلعب الذكاء الاصطناعي الصوتي دورًا محوريًا في تحسين التفاعل البشري مع الآلات، مما يمهّد الطريق لمرحلة جديدة من الابتكار التكنولوجي.
تعليقات القرّاء
التعليقات المنشورة لا تعبر عن رأي الموقع وإنما تعبر عن رأي أصحابها