语音识别
语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。
-
OpenAI语音转写工具被曝严重缺陷:凭空捏造大段虚假内容
快科技10月28日消息,据报道,OpenAI旗下的AI语音转写工具Whisper被曝存在严重缺陷,竟会无中生有地创造大段乃至整句的虚假信息,这一消息引起了广泛关注。 尤为引人注目的是,有医疗机构公开承认采用了Whisper来记录医生与患者间的会诊内容,此举迅速在网络上掀起了轩然大波
-
使用 CNN 进行面部情绪识别
面部表情是人类之间交流的重要方式。 在人工智能研究中,深度学习技术已成为增强人机交互的强大工具。心理学中面部表情和情绪的分析和评估涉及评估预测个人或群体情绪的决定。 本研究旨在开发一种能够使用卷积神经网络(CNN)算法和特征提取技术预测和分类面部情绪的系统
-
ChatGPT走俏:车载语音交互“驶”向风口
文:谈擎说AI 作者:郑开车去年11月,ChatGPT横空出世,短短几个月就成为现象级应用软件。和“什么都能往里装”的元宇宙相比,这款聊天机器人似乎更接地气、更有实用价值。ChatGPT上线后,很多用户怀揣好奇心与其对话,其对很多宏大问题给出的答复着实令人称叹
-
使用 OpenCV-SeventhSense SOTA 模型进行人脸识别
OpenCV 最近发布了与 SeventhSense 合作的人脸识别 SDK。它是 NIST 人脸识别挑战赛(2022 年 3 月)的前 10 名模型,速度极快且无需 GPU。在 opencv-seventhsense FR webapp 中,你可以创建一个集合并将组织中的人员聚合到组中
-
使用 TensorFlow Lite 在 Android 上进行印地语字符识别
介绍如果你曾经想构建一个用于文本识别的图像分类器,我假设你可能已经从 TensorFlow 的官方示例中实现了经典的手写数字识别应用程序 。该程序通常被称为计算机视觉的“Hello World”,它是 ML 初学者构建分类器应用程序的一个很好的起点
-
专利看腾讯声纹识别技术有进步吗,声音解锁功能不再鸡肋!
知情郎·眼|侃透公司专利事儿今天聊声纹识别。即如何鉴伪声音。顾名思义,即通过声音来识别出来“谁在说话”,是根据语音信号中的说话人个性信息来识别说话人身份的一项生物特征识别技术。微信也有类似声纹解锁功能
-
用机器学习识别排球比赛的阶段
排球比赛的阶段用人工智能分析排球比赛有多种方法。我过去常常跟踪球,以便将比赛时间从整个视频中分离出来。另一种方法是确定游戏阶段,并根据阶段流程做出决策。让我们假设排球比赛包括4个阶段:· 没有开始。没有人或少数人在场上徘徊
机器学习 2022-09-13 -
MIT最新AI面部识别研究:AR技术协助情绪侦测
“自闭症成人的感知神经连接可能是“嘈杂的”(noisy)或低效的。”作者:Claire编辑:tuya出品:财经涂鸦(ID:caijingtuya)对大部分健康的人来说,识别人脸上表达的情绪很容易。微笑可能意味着幸福,而皱眉可能意味着愤怒,但自闭症患者在完成这项任务时有很大的困难
-
使用Python的人脸识别系统
介绍人脸识别不同于人脸检测。在人脸检测中,我们只检测了人脸的位置,在人脸识别任务中,我们识别了人的身份。在本文中,我们将在人脸识别库的帮助下,使用python构建一个人脸识别系统。市场上有许多用于人脸识别的算法
-
解锁随身“ID”,思必驰声纹识别自有奇招
20世纪40年代,“声纹”概念首次在Bell实验室被提出。1966年,美国法院采用“声纹”进行取证后,声纹技术开始在司法场景应用。伴随声纹技术在金融行业使用的标准颁布,声纹技术落地应用迎来了开篇。声纹识别又称“说话人识别”,与语音识别同属于语音前端信号处理环节
声纹识别 2022-05-19 -
图像识别型"智能无人收银系统"的应用化实验
丸红株式会社(以下简称“丸红”)与京瓷株式会社(以下简称“京瓷”)就通过图像识别型“智能无人收银系统”(以下简称“本系统”),实现用于超市图像结算服务的应用化进行实验,签订了基本协议书。今年夏天将首先在神奈川县的超市店铺进行实验
-
刷新中文命名实体识别SOTA,华为云论文入选国际顶会NAACL 2022
4月7日,自然语言处理领域国际顶级学术会议NAACL 2022(The North American Chapter of the Association for Computational Ling
-
分析丨微软197亿美元,拿下这家语音巨头意欲何为?
前言:在疫情风暴肆虐全球之时,不少企业开始收缩业务战线准备过冬。不过,也有一些科技巨头逆势而为,正在闷声干大事,正所谓别人恐惧的时候我贪婪。作者 | 方文图片来源 | 网 络微软第三大收购
-
生物识别技术“百花齐放” | 掌纹识别侵犯性更低!
掌纹识别是一个新兴的生物特征识别技术,凭借其相对于人脸和指纹等其他生物特征的优势,迅速得到了广泛的关注。掌纹相比指纹有着丰富的纹理和更广的特征空间,因此可以实现更高的识别率和更大的用户基数;而且与人脸
-
阿里AI上岗南京钢铁 精准识别发丝级钢板裂纹
细如头发丝的裂纹会严重影响钢板质量,其检测一直是行业老大难,需要工人踩在高温钢板上,打着电筒仔细寻找,一天走上万步,既辛苦还容易看走眼。记者昨日获悉,全国特大型钢企南京钢铁上线了AI质检系统,借助阿里
-
使用Python和docTR提取车辆识别号
VIN(车辆识别号)是一个17个字符的字符串,由数字和大写字母组成,用作汽车的指纹。它可以帮助识别任何一辆汽车的寿命,并获得有关它的具体信息。该唯一标识符在制造过程中打印在车辆的某个位置,以便人们在租车或销售等过程中需要时读取
-
最新输入法报告 超过80%用户认为语音输入提高体验
智能语音是人工智能(AI)领域技术最成熟的分支,得益于前沿语音技术赋能,手机输入法可以实现“出口成章”,进而增强用户的体验。易观发布的《2021年中国第三方输入法用户体验洞察》显示,当前语音与传统拼音一并成为最主流的输入方式
语音输入 2022-03-23 -
构建自定义CNN模型:识别COVID-19
本文让我们从头开始,通过训练和测试我们的自定义图像数据集,来构建我们自己的自定义CNN(卷积神经网络)模型。我们将使用验证集方法来训练模型,从而将我们的数据集划分为训练、验证和测试数据集。在结束时,你
卷积神经网络 2022-03-01 -
人脸识别技术哪家强?OPPO专利解读:多帧超分与深度学习结合提升精度
知情郎·眼|侃透天下专利事儿聊过指纹识别、虹膜识别。今天说人脸识别技术哪家强!国内做人脸识别的科技公司不少。在市场上名气比较大的如炒作了N年的AI四小龙商汤科技、旷视科技、依图科技、云从科技。当年都打
-
使用Pytesseract进行光学字符识别
概述本文,我们将使用计算机视觉技术从图像中提取文本。提取文本后,我们将在该文本上应用 OpenCV 的一些基本功能来增强它并获得更准确的结果。这个项目将非常有用,因为它可以节省从图像打字的时间和精力。范围· 对于将从图像中获取文本的大型组织而言,此应用程序可能会节省时间
-
Python搭建人脸识别考勤系统
介绍在本文中,你将学习如何使用 Python 构建人脸识别系统。人脸识别比人脸检测更进一步。在人脸检测中,我们只检测人脸在图像中的位置,但在人脸识别中,我们制作了一个可以识别人的系统。“人脸识别是验证或识别图片或视频中的人的挑战
-
《2020-2021 中国智能语音行业白皮书》发布,智能语音产业进入规模化深耕期
12月18日,中国智能语音产业发展高峰论坛暨中国语音产业联盟2021年会在北京举行。政产学研各界代表围绕智能语音产业热点,研究语音技术发展脉络,探讨语音产业未来方向,助力人工智能与实体经济深度融合发展
-
传音控股旗下小语种智慧语音助手 获深圳市技术攻关专项资金支持
近日,深圳市科创委公布了2022年技术攻关面上资助项目,传音控股旗下“面向一带一路特定人群的小语种智慧语音助手关键技术研发”成为公司首个入选项目,未来将着力构建高质量智能语音平台,让更多一带一路国家用户体验AI语音的便捷性,同时以小语种语音服务,赋能企业出海
AI语音 2021-12-13 -
腾讯公开谣言类文章识别专利,可提高整体识别率和准确度
近日,腾讯科技(深圳)有限公司公开了“谣言类文章的识别方法及装置”专利,公开号为 CN113761135A。智慧芽专利摘要显示,通过该发明,能够提高谣言类文章的整体识别效率和准确度。IT之家了解到,该专利所述方法包括:确定待识别文章的内容所归属的内容类别;当所述内容类别为目标类别时
-
大手笔收购 Nuance遭欧盟反垄断调查,微软的语音技术如何?
近日,微软此前宣布斥资 160 亿美元(约 1020.8 亿元人民币)收购人工智能和语音技术公司 Nuance。值得一提的是,欧盟反垄断监管机构宣布对该交易进行更深入的调查,要求客户和竞争对手列出一份担忧清单
-
人脸识别:使用Scikit-Learn构建人脸识别系统
什么是人脸识别人脸识别是将未知个体的人脸与存储记录数据库中的图像进行比较的任务。映射可以是一对一或一对多,这取决于我们是在运行人脸验证还是人脸识别。在本教程中,我们感兴趣的是构建一个面部识别系统,该系统将验证图像(通常称为探测图像)是否存在于预先存在的面部数据库(通常称为评估集)中
-
荣耀60系列正式发布:AI手势识别,Vlog隔空换镜,让拍摄更自由
2021年12月1日,荣耀召开新品发布会,正式发布荣耀60系列。作为针对年轻群体,主打vlog拍摄的手机,荣耀60系列在Vlog拍摄方式上再次创新,推出了业界首创的“AI手势识别,Vlog隔空换镜”功能,让vlog拍摄更加自由,使用场景更加丰富
-
技术干货 | 识别专栏之二维码导航
# 二维码导航的使用场景 仙工智能的 AGV 支持多种导航方式,二维码导航是其中一种。在狭窄的环境、环境空旷又或者是环境变化比较大的场景下,通过粘贴导航用的二维码和安装在 AGV 车身下的 PGV 读头,可以实现准确、稳定的定位和导航
-
人脸识别并不牢不可破?全球人脸识别技术又如何?
近日,根据技术人员演示,只要拿到一张人脸图片,运用深度合成的办法,就能让人脸动起来,以假乱真,轻松攻破一些人脸识别系统。在专业技术人员的眼中,目前大部分人脸识别技术的算法并不是牢不可破。根据智慧芽数据显示
-
以智能投影换AI语音,科大讯飞布局新赛道
生意的本质就是一场交换,看你拿什么来换。面向垂直领域,推出基于AI技术的软件、硬件,是大小AI企业的通用策略,百度推出小度音箱和投资极米科技,阿里推出天猫魔屏都是同样的逻辑,这也契合科大讯飞的发展路径和趋势
-
欧洲AI监管再收紧,基于AI的生物识别都犯了哪些“罪”?
物联网智库 原创转载请注明来源和出处导 读人脸识别技术经历了技术引进、市场教育、技术完善,到各行各业各领域采用数个阶段,如今已经发展相对成熟,服务于智慧安防、智慧办公、电子商务等各个领域。但近几年随着人脸识别技术广泛普及
-
计算机视觉简史:被称为“人脸识别”的计算机视觉经历了什么?
导语:发展60多年来,机器视觉作为AI技术的急先锋,经历了几轮起落,终于迎来技术上的爆发。但随着技术进入深水区,寻找合适的商业模式真正成为了机器视觉这门技术的最大难点。1999年上映的《黑客帝国》虽然不是人类关于人工智能的第一次影视化探索,却可以说是最有影响力的一次
-
一文学会以极低的 FLOPs 改进图像识别
前言:这篇论文旨在以极低的计算成本解决性能大幅下降的问题。提出了微分解卷积,将卷积矩阵分解为低秩矩阵,将稀疏连接整合到卷积中。提出了一个新的动态激活函数-- Dynamic Shift Max,通过最大化输入特征图与其循环通道移位之间的多个动态融合来改善非线性
-
一文教你使用LBPH算法理解人脸识别
介绍**LBPH(Local Binary Pattern Histogram,局部二进制模式直方图)**是一种人脸识别算法,用于识别人脸。它以其性能以及如何能够从正面和侧面识别人脸而闻名。在开始了解 LBPH 算法之前
-
一文学会使用CNN进行人脸关键点识别
项目概况该项目的目标是预测面部图片上关键点的位置。这可以用作各种应用程序中的组件,包括:图片和视频中的人脸识别。面部表情的研究。用于医学诊断,识别畸形面部症状。识别面部关键点是一个很难解决的话题。人与人的面部特征差异很大
最新活动更多 >
-
11月起立即报名>> 光电类专业2025年秋季空中双选会
-
11月22日立即报名>> 【线上&线下同步会议】领英 跃迁向新 年度管理者峰会
-
11月28日立即报名>>> 2024工程师系列—工业电子技术在线会议
-
11月29日立即预约>> 【上海线下】设计,易如反掌—Creo 11发布巡展
-
即日-11.30免费预约申请>>> 燧石技术-红外热成像系列产品试用活动
-
11月30日立即试用>> 【有奖试用】爱德克IDEC-九大王牌安全产品