Adobe werkt aan audiobewerkingssoftware. De software stelt gebruikers in staat getypte woorden in spraak om te zetten, waarbij een stem op basis van samples nagebootst kan worden. Project VoCo bevindt zich nog in de testfase.

Adobe gaf een sneakpreview van Project VoCo tijdens zijn Adobe MAX 2016-evenement in San Diego. Ontwikkelaar Zeyu Jin demonstreerde hoe hij spraakbestanden kon uitbreiden door getypte woorden toe te voegen. De extra woorden werden in dezelfde stem uitgesproken als het oorspronkelijke bestand.

Volgens Jin is een sample van ongeveer twintig minuten voldoende om de spraakeigenschappen van stemmen te analyseren en nieuwe woorden na te bootsen alsof ze van de oorspronkelijke spreker komen.

 

 

 

De directe koppeling tussen spraak en tekst maakt het mogelijk woorden en zinsdelen te wijzigen om spraakbestanden opnieuw op te bouwen zonder opnieuw te hoeven inspreken. Volgens Jin gaat Adobe met VoCo hetzelfde doen op audiogebied als het op grafisch gebied heeft gedaan met Photoshop. Wanneer de audiobewerker op de markt komt en wat de overige mogelijkheden zijn, is nog niet bekend.

 

Microsoft demonstreerde in 2012 al het nabootsen van stemmen bij vertalingen en Google heeft grote stappen gezet bij het op een natuurlijke manier weergeven van spraak van verschillende sprekers op basis van getypte tekst.

 

 

 

Bron: Tweakers.net

 

Aanvullende gegevens