OpenAI的Voice Engine：一年未正式发布，安全与监管引发担忧

时间：2025-03-18 05:40

小编：小世评选

2023年3月，OpenAI曾引入一项名为Voice Engine（声音引擎）的人工智能服务，并对其进行了“小规模预览”。近年来，AI技术飞速发展，语音生成模型成为备受瞩目的热点。时至今日，Voice Engine仍未正式发布，OpenAI对此的谨慎态度引发了业界人士的广泛关注。

在这将近一年的时间里，OpenAI并未透露Voice Engine是否将会全面上线及其具体时间。这种延迟的背后，可能反映了公司对技术潜在滥用的忧虑和对监管审查的慎重考量。此前，该公司多次因快速推出相关产品而遭受批评，认为其在追求创新的同时，忽视了技术的安全性和社会责任。

OpenAI的一位发言人在接受TechCrunch采访时表示，公司的目标是通过与合作伙伴的互动来不断学习，以提升Voice Engine的实用性和安全性。他们赞赏该技术在各种领域的应用潜力，包括语音治疗、语言学习、客户支持、游戏角色以及AI虚拟形象等。这表明，尽管发布受阻，OpenAI仍然看好这一技术的广泛应用前景。

Voice Engine是OpenAI在其文本转语音API和ChatGPT语音模式背后的核心技术，旨在生成具有高度真实性的自然语音，使生成的声音与原始说话者几乎无差。通过对大量语音样本的学习，Voice Engine能够考虑说话者的多样化声音特征、口音和说话风格，从而为给定的文字生成相应的语音表达。

在最初的设想中，OpenAI计划于2024年3月7日正式发布Voice Engine，并让最多100名“可信开发者”提前使用，但发布条件和目标人数都在一刻被推迟。这使得Voice Engine的正式推出时间仍然不明朗。而目前，只有十几名合作开发者获得了这项技术的使用权限，显得极其有限。

据悉，OpenAI自2022年开始开发Voice Engine，该公司声称在2023年夏季向全球各级政策制定者展示了这一技术的潜力与风险。目前，包括Livox在内的几家合作伙伴已经获得了Voice Engine的使用权限。作为一家致力于开发便捷沟通工具的初创公司，Livox的首席执行官卡洛斯·佩雷拉（Carlos Pereira）对此充满期待，尽管技术在网络接入方面存在一定局限性，但他认为Voice Engine在语音生成质量及其多语言能力方面无与伦比。

OpenAI在其2024年6月的博客中提到，基于与利益相关者的广泛讨论，Voice Engine将采取多项安全措施，包括为生成音频添加水印，以确保能够追溯其来源。同时，使用该技术时，必须向受众明确声明语音为AI生成。这些政策的落实，代表了OpenAI对社会责任的重视，但如何有效执行这些规章，仍待观察。

在AI技术持续演进的背景下，语音克隆的广泛应用也引发了极大的安全隐患。不法分子利用语音克隆技术制作名人和政客的深度伪造视频，进而在社交媒体上恶意传播，引发社会信任危机。银行安全检查的绕过等问题也在默默增加。这些事件令人担忧，呼唤更为有效的身份验证和管理措施。因此，OpenAI在推出Voice Engine之际，必须思考如何平衡技术的创新性与安全性。

尽管OpenAI表示希望在不久的将来能够推出Voice Engine，甚至可能会在2024年推出，但也有可能永远保持其小规模的探索状态。无论出于品牌形象考虑还是安全风险管理，Voice Engine仍旧是OpenAI历史上时间最长的有限预览项目。

而言，Voice Engine的发布延迟反映了当今AI技术面临的复杂性与挑战，尤其在安全、合规与伦理等方面的深思熟虑已成为技术发展不可或缺的一部分。随着技术方向的不断演进，OpenAI需找到如何在保证创新的同时，遵循社会道德与法规的正确道路，从而在行业内树立良好的榜样。

OpenAI的Voice Engine：一年未正式发布，安全与监管引发担忧

精品推荐

相关文章