المستثمرون يزعجون صوت الذكاء الاصطناعي. هنا حيث يرون أكثر الإمكانات غير المستغلة.
- جمعت شركة Voice AI الشركات الناشئة أكثر من 398 مليون دولار من تمويل VC في عام 2024 ، لكل بيانات Pitchbook.
- تتوسع التكنولوجيا إلى استخدامات Enterprise مثل خدمة العملاء والمساعدين.
- تحدثت BI إلى المستثمرين حول الفرص غير المستغلة في مساحة الصوت الناشئة.
أصبح الصوت سريعًا ساحة المعركة الجديدة لمنظمة العفو الدولية.
من المساعدين الظاهريين الصاخبين إلى أدوات توليف الكلام ، بدأت التكنولوجيا في العام الماضي.
على الرغم من أن AI Voice Tech ليست جديدة ، إلا أن الأدوات أصبحت أكثر تطوراً ، مما دفع التبني من مركز الاتصال إلى وكالات التوظيف.
حالات استخدامها واسعة ، من النسخ الصوتية في الوقت الفعلي إلى توليد أصوات اصطناعية من مطالبات النص.
لقد ألقى المستثمرون الذين يبحثون عن الفرصة التالية في سوق الذكاء الاصطناعي شديدة التنافسية دفاتر الشيكات الخاصة بهم وراء الشركات الناشئة. وفقًا لبيانات Pitchbook ، جمعت الشركات الناشئة التي تقوم بتطوير تكنولوجيا AI Voice أكثر من 398 مليون دولار من تمويل VC في عام 2024.
حصلت Polyai ومقرها لندن ، والتي طورت مساعدين صوتيين لمراكز الاتصال ، على 50 مليون دولار في جولة تمويل من Hedosophia. جمعت لندن ونيويورك إحدى عشرة ، والتي طورت تقنية استنساخ صوتية ، 100 مليون دولار في يناير 2024-ويقال إنها تجمع 200 مليون دولار أخرى ، حسبما ذكرت شركة Business Insider لأول مرة.
وقال سيفيش سوكومار ، المستثمر في شركة VC Balderton: “لقد أدت عمليات الاختراق الأخيرة في معالجة الكلام إلى الكلام في الوقت الفعلي إلى فتح حالات الاستخدام الجديدة ، بما في ذلك المساعدين الظاهريين ودعم العملاء والإنتاجية القائمة على الصوت”. “شركات مثل Elevenlabs و Openai هي في طليعة هذا الفضاء ، حيث تطلق Elevenlabs واجهة برمجة تطبيقات في الوقت الفعلي من المتوقع أن تدفع مزيد من التبني.”
وأضاف سوكومار أن Voice AI هو مساحة ناشئة نسبيًا ، لذلك لا يوجد شاذ راسخ بعد – لكنه يؤدي إلى إثارة المستثمرين للفرص غير المستغلة في القطاع.
نظام إيكولوجي توسيع
تحدد الشركات الناشئة بسرعة كيفية تخصيص تقنية الصوت لمجموعة من احتياجات المؤسسات والمستهلك. ومع وجود Agency AI موضوعًا ساخنًا لكبار المديرين التنفيذيين ، فإن التداخل مع تكنولوجيا الصوت قد يحمل إمكانات عالية.
جمعت Playai ، وهي شركة ناشئة تقوم بتطوير منصة منظمة العفو الدولية لنماذج النص إلى كلام ووكلاء صوت الذكاء الاصطناعي ، 21 مليون دولار من تمويل البذور في نوفمبر.
وقال هاماد سيد ، المؤسس المؤسس في بلاياي: “لقد رأينا زيادة هائلة في الاهتمام ببناء وكلاء الصوت ، والتي يمكن للإنسان التحدث إليها تمامًا كما هو إنسان آخر”. وأضاف “Voice AI تسير في السائدة وستكون واجهة رئيسية في كيفية تفاعل الناس مع التكنولوجيا. المستثمرون يدركون بالتأكيد هذه الفرصة”.
وقال ستيف يانج ، المؤسس والشريك الإداري لشركة Kindred Ventures ، التي دعمت أيضًا Playai ، إن VCS تجوب النظام البيئي لجعل رهانهم الكبير التالي يبحثون الآن عن Voice AI كمكدس تكنولوجيا. تتمثل أطروحة الاستثمار في الشركة في دعم الشركات الناشئة “مع طبقات متعددة مع العديد من حالات الاستخدام في المستهلك والمؤسسة والإبداع.”
“أولاً ، هناك نماذج متخصصة وتأسيسية. ثانياً ، هناك خدمات وأدوات للبنية التحتية ، والتي توفر الوصول والتكامل مع هذه النماذج. وربما الأهم من ذلك ، هناك مساحة تطبيق رأسية شاسعة” ، قال لـ BI.
يعد هذا القطاع جذابًا أيضًا للمستثمرين لأن الصوت هو فئة سهلة للاستفادة منها. وقال جوناثان مستخدم ، الشريك العام في شركة VC Headline: “يمكنك تسعيرها بالنتيجة ، لذلك من السهل جدًا تسييلها”. “لهذا السبب لديك الكثير من جر الإيرادات – من السهل جدًا الحصول على عائد على الاستثمار ، خاصةً إذا كنت تحل محل إنسان يقوم بهذا العمل.”
لقد ارتفعت شهية المستهلك لـ Voice AI. مع وجود المزيد من المستخدمين يفضلون اتخاذ المعلومات من خلال تنسيقات صوتية مثل البودكاست ، أبرز Sukumar الطلب المتزايد للمستهلكين على التحكم في الصوت والواجهات الصوتية. قام ببناء Persuaision ، وهي منصة AI صوت تتيح للمستخدمين ممارسة محادثات في العالم الحقيقي-من المقابلات الوظيفية إلى التواريخ الأولى-لأنه رأى نطاق الصوت لتلبية احتياجات المستهلك هذه.
وقال “إذا تمكن Openai من التقاط وكيل صوت المستهلك ، فسيكونون ما كان من المفترض أن يكون سيري”. “أعتقد أنه سيكون هناك الكثير من التواصل مع الأجهزة الشخصية ، وستكون هناك تجربة أفضل للمستهلكين في التجارة الإلكترونية على هذه الجبهة.”
مختبرات الحدود تلحق بالركب
على الرغم من شعبيتها المتزايدة ، لا يبدو أن Voice AI لديها طاغوت راسخ واحد حتى الآن. قد يكون جزء من السبب هو أن مختبرات الحدود قد بقيت إلى حد كبير عن المساحة ، وربما بسبب القلق من أن سوء استخدام قدرات توليد الصوت قد يؤدي إلى رد فعل عنيف محتمل ، وفقًا لتقرير Air Street Capital لعام 2024.
وقال ناثان بينايش ، مؤسس وشريك عام لشارع Air Street Capital: “على الرغم من تجريد كميات هائلة من بيانات الصوت والفيديو ، إلا أن Frontier Labs كانت بطيئة في إصدار منتجات النص إلى كلام”. وأشار إلى الوضع الصوتي المتقدم من Openai ، والذي تم تأجيله مرارًا وتكرارًا ، و NotebookLM من Google ، والذي “تم إغلاقه نسبيًا”.
لقد بدا خبراء الذكاء الاصطناعى التنبيه بشأن الصعود المحتمل للعرق في عام واحد تميزت بالانتخابات العالمية – لكن هذا لم يكن الأمر كذلك.
وقال بينايش: “في جميع الاحتمالات ، كانت المختبرات حريصة على تجنب السحب في الذعر حول DeepFakes التي ترافق غالبًا الانتخابات الرئيسية. أعتقد أنه من المحتم أن يلعبوا أكثر في هذا الفضاء ، لمجرد أن الفرصة التجارية المحتملة كبيرة جدًا”.
قد تكون التكنولوجيا الكبيرة تتجه نحو الاتجاه. تأخرت خطط Amazon لتكثيف عروضها المساعقة الصوتية من خلال Alexa حتى عام 2025 ، ورفعت Apple مؤخرًا ميزة Siri عن طريق إضافة قدرات ChatGpt.
ومع ذلك ، أشار Benaich إلى أنه لن يكون مهمة سهلة لأي شركة واحدة لتناول التاج. وقال: “إن إزاحة الشركات مثل Elevenlabs ، التي يتمتع بالفعل بالتبني على نطاق واسع وقد تم تحسين أدواتها لمستخدمي المؤسسات لسنوات حتى الآن ، قد يكون تحديًا”.