• OpenAI ChatGPT 高级语音模式已登陆 Windows 和 Mac 平台

    IT之家 10 月 31 日消息,OpenAI 今日宣布,ChatGPT 的高级语音模式(Advanced Voice Mode,简称 AVM)现已登陆 Windows 和 Mac 平台。AVM 基于 OpenAI 最先进的 GPT-4o 模型运行,允许用户像与真人对话一样与 ChatGPT 进行交流,包括打断、停顿等自然语言行为。OpenAI 表示,AVM 提供了更自然、实时的对话体验,能够实时
    热度:806
    2024-10-31
  • 语音克隆技术引发担忧,OpenAI 再次解释其文本转语音工具

    IT之家 6 月 10 日消息,OpenAI 在几个月内第二次就其文本转语音工具进行解释,并再次强调该工具目前并未大范围开放,且未来也可能不会。 图源 Pexels 无论我们最终是否会大规模部署这项技术,让世界各地的人们理解这项技术的发展方向都非常重要,OpenAI公司
    热度:2562
    2024-06-11
  • 智能座舱算法基础之语音识别篇

    近年来人工智能技术快速发展,比较引人注目的包括智能语音技术、计算机视觉技术和自动语音识别技术等。其中,自动语音识别(ASR),简称语音识别,是重要的组成部分。其主要目标是把语音信号转变为相应的文字,从而让机器具有听觉功能,能够直接接收人的口语
    热度:2577
    2024-02-17
  • 声音如何泄露你的隐私?美国学者谈智能语音的风险

    2018年2月,苹果智能音箱HomePod正式在美国上市。(视觉中国/图) 图罗曾经写过一个故事:一位父亲在家里收到百货公司邮寄的母婴用品广告后,才得知他尚未成年的女儿已经怀孕。商场怎么会比女孩的家人更早知道她怀孕呢? 美国学者、宾夕法尼亚大学教授约瑟夫
    热度:2599
    2023-12-08
  • 苹果介绍语音辅助功能:可用 iPhone 保留自己的声音

    IT之家 12 月 1 日消息,苹果公司今天发布新闻稿,以内科医生兼残疾人权利倡导者 Tristram Ingham 为视角, 介绍了实时语音和个人语音两项新增辅助功能。 实时语音是 Apple 今年秋天推出的另一项语言辅助功能,可以帮助用户输入想说的话,并通过个人声音或系
    热度:2528
    2023-12-01
  • 最强开源语音克隆AI模型:Coqui TTS

    前有HeyGen的火热大家都开始关注 语音克隆 (详情见这篇文章), 后有ChatGPT的 文本转语音 技术让大家眼前一亮! 但是ChatGPT和HeyGen虽好,可不仅要翻墙使用,而且还要购买会员才可以! 那么开源领域有没有好用的?答案是有的! 今天要介绍下2.2W的开源项
    热度:2564
    2023-11-15
  • 用语音控制特斯拉是怎样的体验?科技改变生活,苹果和特斯拉联动

    苹果和特斯拉一直是我最喜欢的两个科技公司,这次它们终于迎来了联动,特斯拉APP推出了最新的版本4.24.0,新功能可以看到增加Apple快捷指令功能,也就意味着我们可以用siri控制我们的特斯拉了。 这其实并不是一个特别新鲜的功能,早在很久,第三方的小特APP
    热度:2616
    2023-08-27
  • 砍掉“Hey”,苹果宣布iPhone/iPad语音助手唤醒词改为“Siri”

    IT之家 6 月 6 日消息,苹果在今年的 WWDC 2023 开发者大会上, 宣布唤醒 Siri 语音助手的唤醒词正式从Hey Siri,更改为Siri。 苹果宣布用户在升级 iOS / iPadOS 17 版本更新之后,可以更容易地唤醒虚拟语音助手。 苹果表示此前之所以使用Hey Siri,主要原因
    热度:2613
    2023-06-06
  • Gurman:未来只需说“Siri”就能唤醒苹果语音助手

    IT之家 5 月 14 日消息,据彭博社记者马克古尔曼(Mark Gurman)报道,苹果公司正在对 Siri 进行重大改进,计划在未来几年内取消目前必须使用的嘿,Siri唤醒语音助手的方式。 古尔曼在最近一期的Power On通讯中称,苹果正在研究让 Siri 能够在使用单个词Siri
    热度:2555
    2023-05-15
  • 微软NaturalSpeech 2来了,基于扩散模型的语音合成

    文本到语音合成(Text to Speech,TTS)作为生成式人工智能(Generative AI 或 AIGC)的重要课题,在近年来取得了飞速发展。多年来,微软亚洲研究院机器学习组和微软 Azure 语音团队持续关注语音合成领域的研究与相关产品的研发。为了合成既自然又高质量的人
    热度:2579
    2023-05-12
  • 仅3秒音频AI就能克隆完整语音,足以骗过银行和你的家人!

    凭借一小段录音而完美复制整个人的口音,在今年之前肯定让人感觉这是科幻电影的情节,但在今年爆火的生成性人工智能GPT的背景下,使得无人不敢不信服。 今年,多家机构都研发了自己的AI。微软最近也推出了一个新的 AI,据说它 只需要你三秒钟的音频样本 即可
    热度:2655
    2023-03-12
  • 专家利用AI生成的语音成功通过银行语音验证系统

    IT之家 2 月 25 日消息,大多数美国和欧洲银行都提供了语音 ID 的登录方式, 不过最新安全专家表示可以使用人工智能(AI)生成的语音来欺骗银行的验证系统。 资深撰稿人约瑟夫考克斯(Joseph Cox)近日在 Vice 平台发布文章,分享了他如何利用 AI 生成的语音
    热度:2584
    2023-02-27
  • 利润下降超60%,语音识别技术难成科大讯飞护城河

    图片来源@视觉中国 文 | 锌财经,作者 | 路世明,编辑 | 大风 1月29日,科大讯飞发布公告称,预计2022年净利润4.67亿元-6.23亿元,同比下降60%-70%。 所谓的疫情和大环境,早已成为万能的背锅侠。虽然不可否疫情产生的影响,但抛开疫情也能发现,科大一揽子
    热度:2541
    2023-02-04
  • 使用OpenAI的Whisper 模型进行语音识别

    语音识别是人工智能中的一个领域,它允许计算机理解人类语音并将其转换为文本。该技术用于 Alexa 和各种聊天机器人应用程序等设备。而我们最常见的就是语音转录,语音转录可以语音转换为文字记录或字幕。 wav2vec2、Conformer 和 Hubert 等最先进模型的最新
    热度:2540
    2023-01-28
  • Meta推首款语音对语音翻译技术 让闽南语能直接变英语

    【CNMO新闻】过去常见语言翻译系统,大多是建立在有实际语音及对应文字内容,并且通过交叉比对或深度学习方式进行翻译。而近日,Meta宣布推出全球第一款能直接以语音对语音方式进行翻译的技术。这一技术之强大,甚至能让原本没有实际对应标准书写文字内容的
    热度:2569
    2022-10-20
  • Meta推首款语音对语音翻译技术 让闽南语能直接变英语

    【CNMO新闻】过去常见语言翻译系统,大多是建立在有实际语音及对应文字内容,并且通过交叉比对或深度学习方式进行翻译。而近日,Meta宣布推出全球第一款能直接以语音对语音方式进行翻译的技术。这一技术之强大,甚至能让原本没有实际对应标准书写文字内容的
    热度:2542
    2022-10-20
  • 淘宝618推出方言语音搜索功能,目前可识别5种方言

    图片来源:东方IC 近日,淘宝上线了方言语音搜索功能,目前已经能够听懂东北话、河北话、山东话、天津话、河南话等5种方言,只要说出方言,就能直达商品。据悉,这是自去年推出长辈模式和语音助手后,淘宝针对中老年用户购物体验的又一次升级。 记者打开淘宝
    热度:2518
    2022-06-18
  • MetaAI连发三篇Textless NLP论文:语音生成的终极答案?

    新智元报道 编辑:LRS 【新智元导读】AI语音生成的特点就是呆板,没有情绪的起伏。最近Meta AI连发了三篇Textless NLP的论文,不仅开源了textlesslib库,还展示了AI对话在语音情感转换的惊人能力! 在日常交流的时候,人们往往会使用一些「非语言」的信号,
  • MetaAI连发三篇Textless NLP论文:语音生成的终极答案?

    新智元报道 编辑:LRS 【新智元导读】AI语音生成的特点就是呆板,没有情绪的起伏。最近Meta AI连发了三篇Textless NLP的论文,不仅开源了textlesslib库,还展示了AI对话在语音情感转换的惊人能力! 在日常交流的时候,人们往往会使用一些「非语言」的信号,
    热度:2558
    2022-04-07
  • 197亿美元!微软再次启动“钞能力”,拿下这家语音巨头意欲何为?

    在疫情风暴肆虐全球之时,不少企业开始收缩业务战线准备过冬。不过,也有一些科技巨头逆势而为,正在闷声干大事,正所谓别人恐惧的时候我贪婪。 近日,微软又一桩百亿级买卖也尘埃落定。微软宣布以197亿美元完成了对语音技术公司Nuance Communications的最终
  • 197亿美元!微软再次启动“钞能力”,拿下这家语音巨头意欲何为?

    在疫情风暴肆虐全球之时,不少企业开始收缩业务战线准备过冬。不过,也有一些科技巨头逆势而为,正在闷声干大事,正所谓别人恐惧的时候我贪婪。 近日,微软又一桩百亿级买卖也尘埃落定。微软宣布以197亿美元完成了对语音技术公司Nuance Communications的最终
  • 中国科研团队搭建冬奥语音及语言服务平台实现沟通无障碍

    已经投入使用的语音转写翻译系统。 科大讯飞供图 中新网合肥1月13日电 (记者 张俊)便携式翻译设备、虚拟人智能问答设备、冬奥通软件语音翻译等具有冬奥特征的多语种智能语音及语言服务设备和平台已经准备就绪,并投入使用。科大讯飞高级副总裁杜兰13日在接受
    热度:2539
    2022-01-14
  • 上海话四川话都能识别!粤省事新增23种方言语音搜索功能

    为提升用户检索服务的效率,助力老年人群体跨越数字鸿沟,粤省事移动政务服务平台升级语音搜索功能,在尊老爱老服务专区和小程序首页搜索框实现语音搜索,并新增23种方言语音输入,让用户体验更加便捷,服务更加贴心。 广东是全国第一人口大省和流动人口最多
    热度:2628
    2022-01-10
  • 上海话四川话都能识别!粤省事新增23种方言语音搜索功能

    为提升用户检索服务的效率,助力老年人群体跨越数字鸿沟,粤省事移动政务服务平台升级语音搜索功能,在尊老爱老服务专区和小程序首页搜索框实现语音搜索,并新增23种方言语音输入,让用户体验更加便捷,服务更加贴心。 广东是全国第一人口大省和流动人口最多
  • 微软史上第二贵收购案获欧盟批准,欲160亿美元拿下语音巨头Nuance

    12月22日消息,欧盟委员会批准微软收购AI语音和图像识别公司Nuance Communications。这笔交易价值约160亿美元,包括债务约197亿美元。 微软在2021年4月12日宣布以197亿美元或每股56美元的价格收购上市公司Nuance Communications,其目标是加速医疗保健行业的
    热度:2540
    2021-12-23
热门标签...
    SQL Error: select a.*,b.* from www_92game_net_enewstags a LEFT JOIN www_92game_net_enewstagsdata b ON a.tagid=b.tagid WHERE isgood=1 group by b.tagid order by a.num desc limit 12
友情链接