语音识别工具
-
OpenAI押注,这家语音AI初创如何扛起10亿美元估值?
作者|Lexie,编辑|Lu “AI赋能教育,颠覆学习体验。” 高效学习一门新语言是许多人心中的梦想技能,然而现实是即使多邻国打卡了上千天,实际对话时还是会词穷,因为大多数的语言学习从阅读和写作开始,而母语者是从听和说开始掌握语言的
-
OpenAI语音转写工具被曝严重缺陷:凭空捏造大段虚假内容
快科技10月28日消息,据报道,OpenAI旗下的AI语音转写工具Whisper被曝存在严重缺陷,竟会无中生有地创造大段乃至整句的虚假信息,这一消息引起了广泛关注。 尤为引人注目的是,有医疗机构公开承认采用了Whisper来记录医生与患者间的会诊内容,此举迅速在网络上掀起了轩然大波
-
因「盒」而来︱英码科技「深元」的AI重构与工具革命
2023的AIoT战场,硝烟愈烈、内卷更甚,也风起云涌。风起于青萍之末,AIoT自融入千行百业以来,直面产业、融入场景、提质增效就是其最初之想与未来之愿。如果以安防视角看,与AIoT日渐交融、兼蓄并发,打通价值发现、创新使能、持续运营的应用闭环,进而从场景中来,到场景中去
-
模型训练:优化人工智能和机器学习,完善DevOps工具的使用
据说法餐的秘诀在于黄油、黄油、更多的黄油。同样,对于DevOps而言,成功的三大秘诀是自动化、自动化、更高程度的自动化,而这一切归根结底都在于构建能够更快速地不断发布新版软件的流程。尽管人们认为在人工智能(AI)和机器学习(ML)方面,包括特征工程和参数调整,仍然涉及大量的手动工作
-
一波未平一波又起?AI大模型再出邪恶攻击工具
AI大模型的快速向前奔跑,让我们见识到了AI的无限可能,但也展示了AI在虚假信息、深度伪造和网络攻击方面的潜在威胁。 据安全分析平台Netenrich报道,近日,一款名为FraudGPT的AI工具近期在暗网上流通,并被犯罪分子用于编写网络钓鱼电子邮件和开发恶意软件
AI大模型 2023-08-10 -
使用 CNN 进行面部情绪识别
面部表情是人类之间交流的重要方式。 在人工智能研究中,深度学习技术已成为增强人机交互的强大工具。心理学中面部表情和情绪的分析和评估涉及评估预测个人或群体情绪的决定。 本研究旨在开发一种能够使用卷积神经网络(CNN)算法和特征提取技术预测和分类面部情绪的系统
-
专访 | NVIDIA :做构建元宇宙的UGC工具
导读 NVIDIA GTC 2023 线上大会将于3月20日至23日举行。据 NVIDIA(英伟达)官方消息,NVIDIA 创始人兼
-
ChatGPT走俏:车载语音交互“驶”向风口
文:谈擎说AI 作者:郑开车去年11月,ChatGPT横空出世,短短几个月就成为现象级应用软件。和“什么都能往里装”的元宇宙相比,这款聊天机器人似乎更接地气、更有实用价值。ChatGPT上线后,很多用户怀揣好奇心与其对话,其对很多宏大问题给出的答复着实令人称叹
-
使用 OpenCV-SeventhSense SOTA 模型进行人脸识别
OpenCV 最近发布了与 SeventhSense 合作的人脸识别 SDK。它是 NIST 人脸识别挑战赛(2022 年 3 月)的前 10 名模型,速度极快且无需 GPU。在 opencv-seventhsense FR webapp 中,你可以创建一个集合并将组织中的人员聚合到组中
-
使用 TensorFlow Lite 在 Android 上进行印地语字符识别
介绍如果你曾经想构建一个用于文本识别的图像分类器,我假设你可能已经从 TensorFlow 的官方示例中实现了经典的手写数字识别应用程序 。该程序通常被称为计算机视觉的“Hello World”,它是 ML 初学者构建分类器应用程序的一个很好的起点
-
专利看腾讯声纹识别技术有进步吗,声音解锁功能不再鸡肋!
知情郎·眼|侃透公司专利事儿今天聊声纹识别。即如何鉴伪声音。顾名思义,即通过声音来识别出来“谁在说话”,是根据语音信号中的说话人个性信息来识别说话人身份的一项生物特征识别技术。微信也有类似声纹解锁功能
-
用机器学习识别排球比赛的阶段
排球比赛的阶段用人工智能分析排球比赛有多种方法。我过去常常跟踪球,以便将比赛时间从整个视频中分离出来。另一种方法是确定游戏阶段,并根据阶段流程做出决策。让我们假设排球比赛包括4个阶段:· 没有开始。没有人或少数人在场上徘徊
机器学习 2022-09-13 -
2022年商业模式研究方法和应用工具研究报告
第一章 商业模式基本介绍商业模式,是对一个组织如何行使其功能的描述,包含了大量的商业元素及它们之间的关系,并能显示一个公司的价值所在。基于不同的研究视角,商业模式具有多种不同的理解,但简言之,商业模式就是关于“做什么”,“如何做”以及“怎样赚钱”的问题
-
大数据可视化软件之10款数据可视化工具推荐
工欲善其事,必先利其器!选择一款好的数据可视化工具,除了能提高数据可视化的工作效率,还能让你的数据以酷炫的图表形式展示出来,从而方便后续的数据分析工作。随着可视化技术的发展,国内国外出现了很多数据可视化软件,想要从这其中挑选一款适合工作需求又好用的工具,就需要我们对这些工具软件有一个大概的了解
-
MIT最新AI面部识别研究:AR技术协助情绪侦测
“自闭症成人的感知神经连接可能是“嘈杂的”(noisy)或低效的。”作者:Claire编辑:tuya出品:财经涂鸦(ID:caijingtuya)对大部分健康的人来说,识别人脸上表达的情绪很容易。微笑可能意味着幸福,而皱眉可能意味着愤怒,但自闭症患者在完成这项任务时有很大的困难
-
使用Python的人脸识别系统
介绍人脸识别不同于人脸检测。在人脸检测中,我们只检测了人脸的位置,在人脸识别任务中,我们识别了人的身份。在本文中,我们将在人脸识别库的帮助下,使用python构建一个人脸识别系统。市场上有许多用于人脸识别的算法
-
解锁随身“ID”,思必驰声纹识别自有奇招
20世纪40年代,“声纹”概念首次在Bell实验室被提出。1966年,美国法院采用“声纹”进行取证后,声纹技术开始在司法场景应用。伴随声纹技术在金融行业使用的标准颁布,声纹技术落地应用迎来了开篇。声纹识别又称“说话人识别”,与语音识别同属于语音前端信号处理环节
声纹识别 2022-05-19 -
图像识别型"智能无人收银系统"的应用化实验
丸红株式会社(以下简称“丸红”)与京瓷株式会社(以下简称“京瓷”)就通过图像识别型“智能无人收银系统”(以下简称“本系统”),实现用于超市图像结算服务的应用化进行实验,签订了基本协议书。今年夏天将首先在神奈川县的超市店铺进行实验
-
刷新中文命名实体识别SOTA,华为云论文入选国际顶会NAACL 2022
4月7日,自然语言处理领域国际顶级学术会议NAACL 2022(The North American Chapter of the Association for Computational Ling
-
分析丨微软197亿美元,拿下这家语音巨头意欲何为?
前言:在疫情风暴肆虐全球之时,不少企业开始收缩业务战线准备过冬。不过,也有一些科技巨头逆势而为,正在闷声干大事,正所谓别人恐惧的时候我贪婪。作者 | 方文图片来源 | 网 络微软第三大收购
-
生物识别技术“百花齐放” | 掌纹识别侵犯性更低!
掌纹识别是一个新兴的生物特征识别技术,凭借其相对于人脸和指纹等其他生物特征的优势,迅速得到了广泛的关注。掌纹相比指纹有着丰富的纹理和更广的特征空间,因此可以实现更高的识别率和更大的用户基数;而且与人脸
-
阿里AI上岗南京钢铁 精准识别发丝级钢板裂纹
细如头发丝的裂纹会严重影响钢板质量,其检测一直是行业老大难,需要工人踩在高温钢板上,打着电筒仔细寻找,一天走上万步,既辛苦还容易看走眼。记者昨日获悉,全国特大型钢企南京钢铁上线了AI质检系统,借助阿里
-
使用Python和docTR提取车辆识别号
VIN(车辆识别号)是一个17个字符的字符串,由数字和大写字母组成,用作汽车的指纹。它可以帮助识别任何一辆汽车的寿命,并获得有关它的具体信息。该唯一标识符在制造过程中打印在车辆的某个位置,以便人们在租车或销售等过程中需要时读取
-
最新输入法报告 超过80%用户认为语音输入提高体验
智能语音是人工智能(AI)领域技术最成熟的分支,得益于前沿语音技术赋能,手机输入法可以实现“出口成章”,进而增强用户的体验。易观发布的《2021年中国第三方输入法用户体验洞察》显示,当前语音与传统拼音一并成为最主流的输入方式
语音输入 2022-03-23 -
构建自定义CNN模型:识别COVID-19
本文让我们从头开始,通过训练和测试我们的自定义图像数据集,来构建我们自己的自定义CNN(卷积神经网络)模型。我们将使用验证集方法来训练模型,从而将我们的数据集划分为训练、验证和测试数据集。在结束时,你
卷积神经网络 2022-03-01 -
人脸识别技术哪家强?OPPO专利解读:多帧超分与深度学习结合提升精度
知情郎·眼|侃透天下专利事儿聊过指纹识别、虹膜识别。今天说人脸识别技术哪家强!国内做人脸识别的科技公司不少。在市场上名气比较大的如炒作了N年的AI四小龙商汤科技、旷视科技、依图科技、云从科技。当年都打
-
使用Pytesseract进行光学字符识别
概述本文,我们将使用计算机视觉技术从图像中提取文本。提取文本后,我们将在该文本上应用 OpenCV 的一些基本功能来增强它并获得更准确的结果。这个项目将非常有用,因为它可以节省从图像打字的时间和精力。范围· 对于将从图像中获取文本的大型组织而言,此应用程序可能会节省时间
-
Python搭建人脸识别考勤系统
介绍在本文中,你将学习如何使用 Python 构建人脸识别系统。人脸识别比人脸检测更进一步。在人脸检测中,我们只检测人脸在图像中的位置,但在人脸识别中,我们制作了一个可以识别人的系统。“人脸识别是验证或识别图片或视频中的人的挑战
-
《2020-2021 中国智能语音行业白皮书》发布,智能语音产业进入规模化深耕期
12月18日,中国智能语音产业发展高峰论坛暨中国语音产业联盟2021年会在北京举行。政产学研各界代表围绕智能语音产业热点,研究语音技术发展脉络,探讨语音产业未来方向,助力人工智能与实体经济深度融合发展
-
传音控股旗下小语种智慧语音助手 获深圳市技术攻关专项资金支持
近日,深圳市科创委公布了2022年技术攻关面上资助项目,传音控股旗下“面向一带一路特定人群的小语种智慧语音助手关键技术研发”成为公司首个入选项目,未来将着力构建高质量智能语音平台,让更多一带一路国家用户体验AI语音的便捷性,同时以小语种语音服务,赋能企业出海
AI语音 2021-12-13 -
腾讯公开谣言类文章识别专利,可提高整体识别率和准确度
近日,腾讯科技(深圳)有限公司公开了“谣言类文章的识别方法及装置”专利,公开号为 CN113761135A。智慧芽专利摘要显示,通过该发明,能够提高谣言类文章的整体识别效率和准确度。IT之家了解到,该专利所述方法包括:确定待识别文章的内容所归属的内容类别;当所述内容类别为目标类别时
-
大手笔收购 Nuance遭欧盟反垄断调查,微软的语音技术如何?
近日,微软此前宣布斥资 160 亿美元(约 1020.8 亿元人民币)收购人工智能和语音技术公司 Nuance。值得一提的是,欧盟反垄断监管机构宣布对该交易进行更深入的调查,要求客户和竞争对手列出一份担忧清单
-
码前原型设计工具,有点厉害
作者:唐韧今天跟你们说一款朋友推荐给我的产品设计工具,试用后觉得还挺厉害的,这里也跟你们聊聊。在此之前,先说几个场景。如果你是产品经理或设计师,那一定遇到过这些尴尬。场景一:梳理需求用 Excel 列
原型设计工具 2021-12-08 -
人脸识别:使用Scikit-Learn构建人脸识别系统
什么是人脸识别人脸识别是将未知个体的人脸与存储记录数据库中的图像进行比较的任务。映射可以是一对一或一对多,这取决于我们是在运行人脸验证还是人脸识别。在本教程中,我们感兴趣的是构建一个面部识别系统,该系统将验证图像(通常称为探测图像)是否存在于预先存在的面部数据库(通常称为评估集)中
-
英伟达最新 AI 工具即将推出,其技术有和厉害之处?
近日,英伟达的最新 AI 工具又让网友用户们激动了。据悉,只要你会上传图片、能画草图,就能够轻松 P 图。如此“魔性”的工具,难怪得到了网友热捧。值得一提的是,对于“手残党”来说,英伟达的 EditGAN 简直就是零基础 P 图神器
-
荣耀60系列正式发布:AI手势识别,Vlog隔空换镜,让拍摄更自由
2021年12月1日,荣耀召开新品发布会,正式发布荣耀60系列。作为针对年轻群体,主打vlog拍摄的手机,荣耀60系列在Vlog拍摄方式上再次创新,推出了业界首创的“AI手势识别,Vlog隔空换镜”功能,让vlog拍摄更加自由,使用场景更加丰富
最新活动更多 >
-
限时免费立即试用>> 燧石技术,赋光智慧,超越感知
-
2月28日火热报名中>> 【免费试用】东集技术年终福利——免费试用活动
-
限时免费点击下载>> 2024储能产业抢占制高点发展蓝皮书
-
2025年3月立即报名>>> 【线下会议】OFweek 2025 工商业储能大会
-
参编单位征集中立即参编>> 2025锂电市场格局及未来研判蓝皮书
-
2025年3月抢先报名>> OFweek 2025(第九届)动力电池产业年会