
نماذج صوتية فائقة السرعة لتطبيقات الذكاء الاصطناعي الحيّة، تنطق بصوت طبيعي خلال أقل من 100 ميلي ثانية.
كارتيزيا (Cartesia) شركة أبحاث متخصّصة في نماذج توليد الصوت السريعة، أسّسها باحثو معهد ستانفورد المسؤولون عن أبحاث State Space Models. يقدّم نموذجهم الرئيسي Sonic-2 تحويل نصّ إلى كلام بأقل تأخير في الصناعة — أقل من 100 ميلي ثانية — ما يجعله المعيار الفعلي لمساعدي العملاء الصوتيين الفوريين، وبيئات الواقع الافتراضي، وألعاب الفيديو، والروبوتات الاجتماعية. كذلك يدعم استنساخ الصوت بكفاءة عالية باللغة الإنجليزية والعربية وأكثر من 15 لغة أخرى. مستخدم بشكل واسع لدى شركات وكلاء الذكاء الاصطناعي الصاعدة لكنه أقل شهرة من ElevenLabs رغم أداء مكافئ. Cartesia is the research lab behind Sonic-2, the fastest text-to-speech model on the market — sub-100ms latency makes it the de facto choice for real-time voice agents, VR experiences, video games, and social robotics. Founded by Stanford researchers behind State Space Models, Cartesia powers many of the voice AI agents you've talked to without knowing it (Vapi, Bland, and dozens of YC-backed agents companies). Supports voice cloning from a short sample in 15+ languages including Arabic. Less famous than ElevenLabs but matches it on quality while leading on latency — a builder's secret weapon.
التصنيف
إنشاء محتوى
تاريخ الإضافة
١٦/٥/٢٠٢٦