OpenAI的Voice Engine:一年未正式发布,安全与监管引发担忧
时间:2025-03-18 05:40
小编:小世评选
2023年3月,OpenAI曾引入一项名为Voice Engine(声音引擎)的人工智能服务,并对其进行了“小规模预览”。近年来,AI技术飞速发展,语音生成模型成为备受瞩目的热点。时至今日,Voice Engine仍未正式发布,OpenAI对此的谨慎态度引发了业界人士的广泛关注。
在这将近一年的时间里,OpenAI并未透露Voice Engine是否将会全面上线及其具体时间。这种延迟的背后,可能反映了公司对技术潜在滥用的忧虑和对监管审查的慎重考量。此前,该公司多次因快速推出相关产品而遭受批评,认为其在追求创新的同时,忽视了技术的安全性和社会责任。
OpenAI的一位发言人在接受TechCrunch采访时表示,公司的目标是通过与合作伙伴的互动来不断学习,以提升Voice Engine的实用性和安全性。他们赞赏该技术在各种领域的应用潜力,包括语音治疗、语言学习、客户支持、游戏角色以及AI虚拟形象等。这表明,尽管发布受阻,OpenAI仍然看好这一技术的广泛应用前景。
Voice Engine是OpenAI在其文本转语音API和ChatGPT语音模式背后的核心技术,旨在生成具有高度真实性的自然语音,使生成的声音与原始说话者几乎无差。通过对大量语音样本的学习,Voice Engine能够考虑说话者的多样化声音特征、口音和说话风格,从而为给定的文字生成相应的语音表达。
在最初的设想中,OpenAI计划于2024年3月7日正式发布Voice Engine,并让最多100名“可信开发者”提前使用,但发布条件和目标人数都在一刻被推迟。这使得Voice Engine的正式推出时间仍然不明朗。而目前,只有十几名合作开发者获得了这项技术的使用权限,显得极其有限。
据悉,OpenAI自2022年开始开发Voice Engine,该公司声称在2023年夏季向全球各级政策制定者展示了这一技术的潜力与风险。目前,包括Livox在内的几家合作伙伴已经获得了Voice Engine的使用权限。作为一家致力于开发便捷沟通工具的初创公司,Livox的首席执行官卡洛斯·佩雷拉(Carlos Pereira)对此充满期待,尽管技术在网络接入方面存在一定局限性,但他认为Voice Engine在语音生成质量及其多语言能力方面无与伦比。
OpenAI在其2024年6月的博客中提到,基于与利益相关者的广泛讨论,Voice Engine将采取多项安全措施,包括为生成音频添加水印,以确保能够追溯其来源。同时,使用该技术时,必须向受众明确声明语音为AI生成。这些政策的落实,代表了OpenAI对社会责任的重视,但如何有效执行这些规章,仍待观察。
在AI技术持续演进的背景下,语音克隆的广泛应用也引发了极大的安全隐患。不法分子利用语音克隆技术制作名人和政客的深度伪造视频,进而在社交媒体上恶意传播,引发社会信任危机。银行安全检查的绕过等问题也在默默增加。这些事件令人担忧,呼唤更为有效的身份验证和管理措施。因此,OpenAI在推出Voice Engine之际,必须思考如何平衡技术的创新性与安全性。
尽管OpenAI表示希望在不久的将来能够推出Voice Engine,甚至可能会在2024年推出,但也有可能永远保持其小规模的探索状态。无论出于品牌形象考虑还是安全风险管理,Voice Engine仍旧是OpenAI历史上时间最长的有限预览项目。
而言,Voice Engine的发布延迟反映了当今AI技术面临的复杂性与挑战,尤其在安全、合规与伦理等方面的深思熟虑已成为技术发展不可或缺的一部分。随着技术方向的不断演进,OpenAI需找到如何在保证创新的同时,遵循社会道德与法规的正确道路,从而在行业内树立良好的榜样。