ElfLabs , het virale AI-aangedreven platform voor het creëren van synthetische stemmen, heeft vandaag zijn platform uit de bètafase gelanceerd met ondersteuning voor meer dan 30 talen.
Met behulp van een nieuw intern ontwikkeld AI-model zegt ElevenLabs dat de tools nu in staat zijn om automatisch talen te identificeren, waaronder Koreaans, Nederlands en Vietnamees, en emotioneel rijke spraak in die talen te genereren.
In combinatie met het nieuwe model kunnen klanten van ElevenLabs de tool voor het klonen van stemmen van het platform gebruiken om in bijna 30 talen te spreken zonder eerst tekst te hoeven typen.
aerosmith-liedjes van gitaarheld
ElevenLabs is gestart met de droom om alle inhoud universeel toegankelijk te maken in elke taal en met elke stem, zegt CEO en medeoprichter Mati Staniszewski van ElevenLabs in een verklaring. Met deze release zijn we een stap dichter bij het verwezenlijken van deze droom en het beschikbaar maken van AI-stemmen van menselijke kwaliteit in elk dialect. Onze tools voor het genereren van tekst-naar-spraak helpen het speelveld gelijk te maken en bieden gesproken audiomogelijkheden van topkwaliteit aan alle makers.
ElevenLabs, opgericht door Staniszewski, die eerder bij Palantir werkte, en zijn jeugdvriend Piotr Dabkowski, een ex-werknemer van Google, heeft de afgelopen maanden de krantenkoppen gehaald om zowel redenen als Goed En weerzinwekkend . Geïnspireerd door de middelmatige nasynchronisatie van Amerikaanse films die Staniszewski en Dabkowski zagen toen ze opgroeiden in Polen, begon het tweetal aan het ontwerpen van een platform dat het beter zou kunnen doen – uiteraard met behulp van AI.
ElevenLabs werd eind januari in bèta gelanceerd en kwam vrij snel op stoom – dankzij de hoge kwaliteit van de gegenereerde stemmen en het genereuze gratis niveau. Maar zoals eerder vermeld, was de publiciteit niet altijd positief – vooral niet toen slechte acteurs het platform voor hun eigen doeleinden uitbuitten.
Het beruchte prikbord 4chan, bekend om zijn samenzweerderige inhoud, gebruikt ElevenLabs’ tools om haatdragende berichten te delen waarin beroemdheden als acteur Emma Watson worden nagebootst. Elders kon James Vincent van The Verge ElevenLabs gebruiken om de stemmen van doelwitten binnen enkele seconden te klonen. genereren audiofragmenten met alles van bedreigingen met geweld tot uitingen van racisme en transfobie.
Als reactie daarop zei ElevenLabs dat het een reeks nieuwe waarborgen zou introduceren, zoals het beperken van het klonen van stemmen tot betaalde accounts en het aanbieden van een nieuwe AI-detectietool.
ElevenLabs moet echter nog worstelen met de andere controverse die rond zijn platform en andere soortgelijke platforms ontstaat: hun bedreiging voor de stemacteursindustrie.
Moederbord schrijft over hoe stemacteurs steeds vaker wordt gevraagd de rechten op hun stemmen af te staan, zodat klanten AI kunnen gebruiken om synthetische versies te genereren die deze uiteindelijk kunnen vervangen. Ondertussen interne e-mails gezien van The New York Times geven aan dat Activision Blizzard, een van de grootste game-uitgevers ter wereld, werkt aan tools voor AI-ondersteund stemklonen.
Het lijkt erop dat ElevenLabs dit ziet als de natuurlijke vooruitgang van de dingen en zijn werk aanprijst bij uitgevers als Storytel; mediaplatforms zoals TheSoul Publishing en MNTN voor audioboeken en radio-inhoud; en uitgevers als Embark Studios en Paradox Interactive voor videogames (Storytel en TheSoul Publishing zijn strategische investeerders). Het bedrijf beweert dat het meer dan een miljoen geregistreerde gebruikers heeft in de creatieve, entertainment- en publicatiewereld die voor 10 jaar aan audiocontent hebben gemaakt.
tiktok profielweergaven
ElevenLabs, dat onlangs 19 miljoen dollar heeft opgehaald bij investeerders, waaronder Andreessen Horowitz en mede-oprichter van DeepMind Mustafa Suleyman tegen een waardering van 99 dollar, is van plan zijn AI-modellen uiteindelijk uit te breiden naar voice-nasynchronisatie – in de voetsporen van startups als Papercup en Deepdub en bouwen wat het is. vraagt om een basis om emoties en intonatie van de ene taal naar de andere over te kunnen brengen.
Daarnaast zegt ElevenLabs hetis van plan een mechanisme te introduceren waarmee gebruikers stemmen op het platform kunnen delen, hoewel de details vaag blijven.