2023-07-26发表从零开始接触人工智能大模型

20. 尝试让机器拥有声音

大家好，我是 Hivan。

好久不见了，今天我们来讨论下如何让机器拥有声音。

回顾一下我们上一讲的内容，我们已经成功使用 Whisper 模型使得 AI 能够理解我们说的话。这为我们带来了很多应用，例如让 AI 代替我们收听播客并总结内容。然而，这只是单向的交流模式。现在，让我们探索更深入的可能性，让 AI 不仅仅能够“听懂”我们的话，而且通过 ChatGPT 回答我们的问题，并将所有内容合成语音，用声音与我们进行双向交互。

这就是我们本次探索的主题：让 AI 说话。我们将学习如何使用云端 API 进行语音合成（Text-To-Speech），同时也会介绍开源模型，使您能够在本地 CPU 上实现这一功能，让数据安全问题不再是困扰。

让我们一起，给机器赋予声音吧！

使用 Azure 云进行语音合成

语音合成技术早已迈入成熟阶段，你所听到的许多短视频配音都借助此技术实现。无论是科大讯飞、阿里云、百度、AWS Polly还是Google Cloud，国内外的大公司纷纷提供了类似的云服务。然而，今天我们将带您领略微软 Azure 云的语音合成 API，主要是因为以下两个原因：

由于本文在其他平台已经成为收费文章，为了避免损害付费会员权益，所以此处做删减处理。

希望继续观看的，请订阅我的公众号。

20. 尝试让机器拥有声音

https://hivan.me/尝试让机器拥有声音/

作者

Hivan Du

发布于

2023-07-26

更新于

2024-01-16

许可协议

#AI

20. 尝试让机器拥有声音

使用 Azure 云进行语音合成

作者

发布于

更新于

许可协议

喜欢这篇文章？打赏一下作者吧

评论

链接

分类

最新文章