会说话机器的类型
随着时间推移,大致出现过四种会说话的机器:机械型、基于共振峰/规则型、基于样本型(拼接式)、生成型(神经/人工智能型)。
会说话机器简史
介绍了从 1773 年冯·肯佩伦的会说话机器到 1982 年 S.A.M. 软件自动嘴巴等不同时期会说话机器的发展。
两个反复出现的模式
一是会说话的机器常通过唱歌来展示;二是会说话的机器编码了产生它们的文化的偏见。
Macintalk 和 say 命令
1984 年苹果推出基于共振峰的 TTS 系统 Macintalk,2001 年添加命令行界面,say 命令有隐藏的低级领域特定语言。
SaySynth
核心思路是在 say 的 DSL 中为音素指定音高当作合成器用,构建了基于 YAML 的音序器,还研究支持替代调音。
这有什么重要意义?
科技公司描绘的人工智能奇点忽略了“类人”并非固定目标,会说话机器历史压缩了人类语音表达范围,使用有局限性的工具更具价值。SaySynth 项目在 GitLab 上,音乐在 Bandcamp 上。