20. 尝试让机器拥有声音

大家好,我是 Hivan。

好久不见了,今天我们来讨论下如何让机器拥有声音。

回顾一下我们上一讲的内容,我们已经成功使用 Whisper 模型使得 AI 能够理解我们说的话。这为我们带来了很多应用,例如让 AI 代替我们收听播客并总结内容。然而,这只是单向的交流模式。现在,让我们探索更深入的可能性,让 AI 不仅仅能够“听懂”我们的话,而且通过 ChatGPT 回答我们的问题,并将所有内容合成语音,用声音与我们进行双向交互。

这就是我们本次探索的主题:让 AI 说话。我们将学习如何使用云端 API 进行语音合成(Text-To-Speech),同时也会介绍开源模型,使您能够在本地 CPU 上实现这一功能,让数据安全问题不再是困扰。

让我们一起,给机器赋予声音吧!

使用 Azure 云进行语音合成

语音合成技术早已迈入成熟阶段,你所听到的许多短视频配音都借助此技术实现。无论是科大讯飞阿里云百度AWS Polly还是Google Cloud,国内外的大公司纷纷提供了类似的云服务。然而,今天我们将带您领略微软 Azure 云的语音合成 API,主要是因为以下两个原因:

由于本文在其他平台已经成为收费文章,为了避免损害付费会员权益,所以此处做删减处理。

希望继续观看的,请订阅我的公众号。

20. 尝试让机器拥有声音

https://hivan.me/尝试让机器拥有声音/

作者

Hivan Du

发布于

2023-07-26

更新于

2024-01-16

许可协议

评论