Is this Ernst?

thomasfecker | 26. Januar 2021 16:36

Die Speicherung, Verarbeitung und Übertragung der menschlichen Stimme ist ein zentrales Thema der Berliner Medienwissenschaft. Um die Stimme einer Person nachzubilden zu können, kann das deep machine learning eingesetzt werden. Im Rahmen seiner Abschlussarbeit entwickelte Jemine Corentin das Projekt Real-Time-Voice-Cloning. Die Abschlussarbeit und der dazugehörige Programmcode kann unter GitHub heruntergeladen werden:

Zum Projekt "Real-Time-Voice-Cloning"



Bereits mit den minimalen Trainingsdaten können gute Ergebnisse beim Synthetisieren der menschlichen Stimme erzielt werden. Für die Geistervorlesung werden die neuronalen Netze derzeit trainiert, um die Qualität des Audioausgangs zu verbessern. Es handelt sich dabei um einen zeitintensiven Prozess, der vor allem eine große Anzahl an Trainingsdaten erfordert.


Aber vielleicht ist es nicht Wolfgang Ernst, der eine der zukünftigen Vorlesung zu hören ist ...

Über das Projekt

Diese Website ist Teil der Publikation usw. usw.

Mehr erfahren ...

0 Kommentare

Den Rückkanal nutzen: