[ad_1]
生成式 AI 能够生成所有类型的内容,包括文本、艺术、图像,甚至语音。
AI 初创公司 ElevenLabs 自 1 月推出测试版以来,一直支持文本到语音生成和语音克隆,并已积累了超过 100 万注册用户。
还: Meta 推出 Voicebox AI 来复制你的朋友和亲人的声音
周二,ElevenLabs 宣布结束 1900 万美元的 A 轮融资,以及对该平台的一些重大更新,包括解决其最大争议的更新。
自推出以来,Elevenlabs 的语音生成技术产生了积极和消极的影响。
正如 ElevenLabs 所描述的,一些积极的用途包括“独立作者创作有声读物,开发人员为视频游戏中的角色配音,支持视障人士访问在线书面内容,以及为世界上第一个人工智能广播频道提供支持。”
尽管这些用例是积极的并且推动了许多不同行业的业务流程,但也存在同样有害的应用程序。
语音克隆工具可以截取一个人的声音片段来生成新的音频,它已被用于邪恶的手段,让公众人物看起来好像在说可怕的、歧视性的言论。
发布测试版几周后,ElevenLabs 立即开始 推特 解决“语音克隆滥用案例”。 该公司提出了解决该问题的潜在方法,例如额外的帐户验证、验证语音的版权、将语音克隆转移到付费层,甚至手动验证每个请求。
还: Vimeo 添加了一套 AI 工具,使视频创作变得更加容易
今天,它向公众发布了似乎是该公司针对该问题的解决方案,即 AI 语音分类器。 该工具将能够破译上传的音频是否包含来自 ElevenLabs 的 AI 生成的音频。
ElevenLabs 在新闻稿中表示:“AI 语音分类器的发布是公司推动透明度的最新举措,也是他们致力于创建安全的生成媒体环境的基石。”
根据之前发布该工具的帖子,该工具在识别音频未修改时保持 >99% 的准确度。
然而,如果音频经过编解码器或混响转换,准确度会下降到 90% 以上,而且内容处理得越多,准确度下降得越多。
此工具不会防止误用,可能只是在最初的伤害发生后帮助消除混乱。 它解决问题的有效性值得怀疑,但这只是一小步。
这不是人工智能生成技术第一次被滥用来针对公众人物。 例如,AI 音乐生成器能够生成 Drake 和 The Weekend 的合作,这听起来很真实,尽管两位艺术家实际上都没有出现在曲目中。
还: 人工智能生成的音乐能赢得音乐奖吗? 格莱美揭晓新规则
人工智能艺术和图像生成器也被用来生成公众人物进行某些活动的虚假、逼真的图像。 其中一些图像被负面地用作政治宣传,而其他图像则仅用于娱乐目的,例如教皇弗朗西斯穿着河豚大衣的模因。
除了 AI Speech Classifier,ElevenLabs 还宣布其产品套件中加入了“Projects”。
“项目”是一个用于编辑和创建长篇口语内容的工作流程,现在可供抢先体验。 据新闻稿称,它旨在作为音频编辑需求的一站式商店,并为音频创作提供“谷歌文档级别的简单性”。
“项目”功能的添加与我们在其他创意平台(例如 Vimeo、TikTok 和 Adobe Express)中看到的类似。 所有这些平台的目标都是以优化用户工作流程并允许更轻松、优化内容创建的方式实施 AI。
[ad_2]
Source link