VOCALOID

核心技术: 频域拼接 / AI (V6)

商业模式: 高价买断制

代表角色: 初音ミク

行业的开创者与文化符号。早期依赖真实录音的波形拼接,V6 版本引入了 AI 引擎。虽然拥有最庞大的粉丝基础,但近年来因“塑料感”音质和昂贵的价格,在专业制作领域受到挑战。

UTAU

核心技术: 采样 + 重采样

商业模式: 免费 / 同人自制

代表角色: 重音テト

对商业垄断的反叛。支持用户自制音源和更换重采样器(Resampler)。虽然操作界面古老且硬核 (近些年开源的OpenUtau解决了此问题),但其极高的自由度孕育了万千“民用”歌姬,是 AI 技术早期的孵化器。

CeVIO AI

核心技术: HMM / DNN

商业模式: 买断制

代表角色: 可不

主打“说话与歌唱兼修”。与 虚拟主播 生态深度绑定,推出了“音乐同位体”系列。不同于追求完美的 AI,它擅长保留歌手原本的沙哑、破音等“缺陷美”,拥有独特的声线质感。

Synthesizer V

核心技术: DNN + 扩散模型

商业模式: 买断制

代表角色: Solaria / Mai

当前版本的“性能怪兽”。基于深度神经网络,支持跨语言合成。拥有极为恐怖的拟真度,无需繁琐调教即可生成宛如真人的呼吸与颤音,是目前最强的本地渲染引擎。