视频识别

Sora之后，视频生成模型的中国牌局

Sora，自2月16日OpenAI发布后一直被吐槽是“技术期货”，终于在12月10日，正式版Sora露面了，可以生成最高 1080p 分辨率、最长 20 秒的视频。 OpenAI CEO奥特曼称，Sora正式版是视频生成领域的GPT-1时刻

AI Sora 视频生成模型 2024-12-12

Sora模型（文生视频），谁是盈利最强企业？

文生视频模型Sora，相比此前其他文生视频模型，已经跨越到实用生产力工具，1分钟长度有望大规模应用在短视频领域，扩展视频的能力也有望制作长视频，或将带来新一轮内容创作产业革命。盈利能力通常表现为一定时期内企业收益数额的多少及其水平的高低

Sora模型文生视频 2024-12-05

字节、快手、Vidu“打野”升级，AI视频小步快跑

文｜白鸽编｜王一粟继9月份版本更新之后，光锥智能从生数科技联合创始人兼CEO唐家渝朋友圈获悉，Vidu大模型将于本周再次进行版本升级，Vidu-1.5版本即将上线

AI 科技字节快手 Vidu 2024-11-13

国内AI视频主要玩家落座，进入商业模式PK环节

前言：经过长达半年的不懈努力，国内在大型人工智能模型领域的发展终于迎来了关键时刻。从人工智能驱动的舞蹈表演、火柴人动画的创作，到能够生成时长为5至16秒的高质量视频，AI视频生成技术的整体水平已经实现了质的飞跃

电子工程 AI视频 2024-08-29

实测4款国产头部AI视频大模型：不及预期、差异明显

成为“中国版的Sora”远不是这场AI视频大模型竞赛的终点，而恰恰只是起点。 @科技新知原创作者丨余寐

AI视频大模型 2024-08-06

爆“卷”的AI视频，大厂向左，创企向右

文｜白鸽编｜王一粟 “生成的人物一转身就变成老外，怎么解决呢？” “没有办法，10s中动作大的，人物一致性有问题，只能抽卡，多刷几个，选择一个变化不大的

AI 科技 AI视频大模型 2024-07-31

腾讯智影推“视频AI风格化”功能，剑指泛娱乐AIGC市场？

AI视频？AI滤镜！自从OpenAI推出了Sora，视频生成领域的发展速度明显加快。许多国内外的公司都开始投入研究，推出专门用于视频生成的大模型。同时，他们还将自己的技术整合成易于使用的AIGC产品，让更多人能够使用这些技术

腾讯智影 AI视频 AIGC 大模型泛娱乐 2024-07-10

AI视频模型大混战，谁是你的 No.1？

自从Sora发布以来，AI视频模型的“魔盒”被彻底打开。今年上半年，AI视频模型遍地开花，Viggle、Genmo、即梦、Dream Machine、可灵轮番炸场。这么多的

AI视频模型大混战谁是你的 No.1？ 2024-07-09

Sora发布半年之后，AI视频生成领域风云再起

作者：一号编辑：美美 AI视频最近有些疯狂，Sora可能要着急了。自OpenAI的Sora发布以来，AI视频生成技术便成为了科技界的热门话题。尽管Sora以其卓越的性能赢得了广泛关注，但其迟迟未能面向公众开放，让人期待之余也不免有些焦虑

AI Sora AI视频生成 2024-06-19

视频大模型“造梦机器”爆红：瑕疵真不少，关键是能用！

比不上Sora，但你可以免费用。过去半年，AI 生成视频一直处在断断续续推进的状态。在 OpenAI 年初推出 Sora 时引发空前讨论之后，号称国内首个自研视频大模型的 Vidu，以及后续字节、腾讯、快手等多家国产厂商推出视频生成模型，都在时不时引发外界的关注

大模型 AI视频 Sora AI Luma 2024-06-14

国产视频大模型真的来了，实现一次生成16秒高清视频

日前，在备受瞩目的2024中关村论坛年会未来人工智能先锋论坛上，清华大学联合生数科技正式发布了中国首个长时长、高一致性、高动态性视频大模型——Vidu。这一重大成果的发布，标志着中国在视频大模型领域取得了重要进展，为全球人工智能发展注入了新的活力

视频大模型 Vidu 2024-04-29

对标Sora！国产视频大模型Vidu发布

今年初，文生视频大模型Sora的亮相引发行业高度关注，也在资本市场上掀起浪潮。时隔两个月，清华团队打造了一个中国版的Sora——视频大模型Vidu近日正式发布。近期争。 01

Vidu 生数科技 2024-04-29

对标文生视频模型Sora，中国挑战者Vidu只差一点

追赶 Sora，超越 Sora？ 2 个月前，OpenAI 发布了全新的文生视频模型 Sora，瞬间引爆了全球科技圈，也让马斯克说出了「人类愿赌服输」。在那之后，没有任何一个大模型敢于在文生视频领域「挑衅」Sora

OpenAI 生数科技 Sora vidu AI视频 2024-04-29

Figure 01视频被质疑“注水”？看看创始人怎么说！

引言2023年3月，一家仅创立几个月的机器人公司号称要推出“世界上第一个商业上可行的通用人形机器人”，并放出了几张PPT。接下来的一年中，这家名为Figure的公司经历了——被质疑“碰瓷波士顿动力”—

智能机器人 Figure AI模型 LLM 人形机器人 2024-03-15

文生视频（Sora），谁是成长最快企业？

企业成长能力是随着市场环境的变化，企业资产规模、盈利能力、市场占有率持续增长的能力，反映了企业未来的发展前景。本文为企业价值系列之【成长能力】篇，共选取30家文生视频（Sora）企业作为研究样本，并以营收复合增长、扣非净利复合增长、经营净现金流复合增长等为评价指标

文生视频 Sora 2024-02-26

Sora降世，短视频真的会更好吗？

去年年初，ChatGPT横空出世，瞬间点燃了全球科技圈，今年，科技圈再次迎来重磅消息，OpenAI公司发布了旗下的文生视频大模型Sora，Sora能够根据文本提示生成最长60秒的视频，从公开的样片效果来看，堪称惊艳

Sora 短视频 2024-02-23

Sora爆火100小时：核心团队被扒，卖课狂割韭菜，虚假视频泛滥

作者：文子编辑：小迪 OpenAI这把火烧的太大，也烧的太乱了。核心团队被扒，13人里3人为华人作为龙年科技界的“第一把火”，OpenAI最新爆款文生视频模型Sora的热度正在以惊人的速度持续发酵

AI Sora 2024-02-21

OpenAI还有对手吗？a16z干货：2024年AI视频产品何去何从

引言 2024年的开年震撼同样来自OpenAI。节后还没开工，Altman就带着继ChatGPT的第二个杀手级应用Sora大杀四方。适道看完那条长达60s的演示视频后，脑中只有一句话：大家谁都别想玩了

OpenAI 人工智能 Sora 2024-02-20

OpenAI首个AI视频模型Sora的颠覆与争议

【编辑推荐】有人说，这是影响影视行业和未来技术发展的又一颠覆性事件?，也难怪大家惊呼“现实，不存在了！”不过，Sora和文生图一样，普遍存在生成内容不够精确，所以离真正颠覆影视行业还有很大一段距离

OpenAI Sora AI 2024-02-18

Sora会对视频内容创作产生什么样的影响？

OpenAI的文生视频(text-to-video)AI模型Sora已经发布，并且引发了如洪水一般的新闻报道和评论。我不是AI技术专家，相信大家也早已通过其他渠道了解了Sora的技术细节。我只是想从内

Sora 视频内容创作 2024-02-18

AI视频何时才能跑出一个“Midjourney ”?

文｜郝鑫编｜刘雨琦 AI视频一跃成为“明日之星”，大厂和创业公司们打得热火朝天。去年12月，Pika的出现仿佛点燃了AI视频赛道的引线，一个月之内冒出了近十家公司，谷歌、阿里、字节、腾讯竞相下场，不断将战事推向了高潮

AI AI视频 2024-01-05

OPEN AI投资Pika，文生视频2024将会爆火？

前言：随着文生视频软件技术的不断进步，AIGC技术对多业态应用的赋能将加速实现。自人工智能推出以来，其已经逐渐从理论框架走向实际应用，其对人力和财力成本的节省效果也将在上市公司的业绩中逐渐体现出来

电子工程文生视频 Pika 2023-12-25

AI文生视频，会在明年迎来“GPT时刻”

AI文生视频这条赛道，将为各行业带来新的增量与繁荣。在当下的AI赛道上，AI生文、生图的应用，早已层出不穷，相关的技术，也在不断日新月异。而与之相比，AI文生视频，却是一个迟迟未被“攻下”的阵地

人工智能 AI 2023-12-06

异军突起的视频AI，揭示了什么？

悄然崛起的视频AI，标志着AI竞争进入了下一阶段。在当下的AI赛道上，AI聊天、绘画一类的应用，早已枝繁叶茂。然而，在此类同质化应用扎堆的情况下，一类颇有技术难度，也较少被人提及的方向，正在悄然崛起

人工智能 AI 2023-10-11

阿里云“通义听悟”开放公测！聚焦音视频，可体验大模型摘要能力

6月1日，阿里云宣布通义大模型进展，聚焦音视频内容的AI新品“通义听悟”正式上线，成为国内首个开放公测的大模型应用产品。通义听悟接入了通义千问大模型的理解与摘要能力，可成为用户工作学习中的得力AI助手

阿里云大模型 2023-06-01

使用 CNN 进行面部情绪识别

面部表情是人类之间交流的重要方式。在人工智能研究中，深度学习技术已成为增强人机交互的强大工具。心理学中面部表情和情绪的分析和评估涉及评估预测个人或群体情绪的决定。本研究旨在开发一种能够使用卷积神经网络（CNN）算法和特征提取技术预测和分类面部情绪的系统

CNN 面部情绪识别 2023-05-18

使用 OpenCV-SeventhSense SOTA 模型进行人脸识别

OpenCV 最近发布了与 SeventhSense 合作的人脸识别 SDK。它是 NIST 人脸识别挑战赛（2022 年 3 月）的前 10 名模型，速度极快且无需 GPU。在 opencv－seventhsense FR webapp 中，你可以创建一个集合并将组织中的人员聚合到组中

OpenCV 人脸识别 2023-02-01

使用 Python 从视频片段中确定足球球员球衣的颜色

使用 K－Means 聚类来识别球员球衣颜色足球是世界上最受欢迎的运动。在洪都拉斯，足球能够吸引大众的注意力，并在 90 分钟内让人群陷入情绪的漩涡。多年来，我们看到各种技术被实施，以获取有关比赛内事件和球员表现的各种统计数据和信息

Python 2023-01-05

抖音、快手、视频号排兵布阵VR直播

配图来自Canva可画在国内众多巨头的助推下，“VR＋直播”的形式正在爆发性入侵大众视野。据PICO官方宣布，在2022年11月21日至12月18日卡塔尔世界杯比赛期间，用户可以通过PICO VR一体机，观看从揭幕战到决赛的全部64场世界杯赛事直播

抖音快手视频号 2022-11-25

使用 TensorFlow Lite 在 Android 上进行印地语字符识别

介绍如果你曾经想构建一个用于文本识别的图像分类器，我假设你可能已经从 TensorFlow 的官方示例中实现了经典的手写数字识别应用程序。该程序通常被称为计算机视觉的“Hello World”，它是 ML 初学者构建分类器应用程序的一个很好的起点

TensorFlow 计算机视觉 2022-11-22

阿里达摩院参与制定VCM国际视频标准，提案斩获两项第一

11月18日消息，在国际视频标准MPEG Technical Requirements工作组关于MPEG Video Coding for Machine（以下简称“MPEG-VCM”）的技术征集提案

阿里达摩院 VCM 2022-11-18

从AI作画到AI做视频，这一跳改变了什么？

九月初的时候，AI绘画作品《太空歌剧院》在美国获得了人类艺术竞赛一等奖的新闻让许多人震惊不已。学多人没有想到，画沙雕图的AI竟然这么快就技能进步到超越了人类。AI作画的时间从年初以小时为单位到现在短到秒级别，并且绘出的图像质量越来越高，几乎接近人类专业画家的水平

人工智能 AI作画 AI做视频 2022-10-19

视频创作者饭碗不保！Meta和谷歌推出的AI黑科技来抢活儿了

9月末，Meta发布了新款AI系统Make－A－Video，开启了“用嘴做视频”的时代。谷歌不甘落后，在Make－A－Video推出后一周带着Imagen Video和Phenaki两款类似的人工智能产品登场

元宇宙 Meta 谷歌 2022-10-19

AI“入侵”短视频慌了谁

“注意看，眼前这个男人正在XX”毫不夸张，现在无论我们走到哪都很难逃过上面这个声音。虽然其在努力模仿人类的节奏语调，但还是能一耳朵就能听出来正在解说电影的，不是人，而是AI。输入文案，自动合成语音，AI已成当下短视频批量化生产的标配

AIGC AI作画 2022-10-13

专利看腾讯声纹识别技术有进步吗，声音解锁功能不再鸡肋！

知情郎·眼｜侃透公司专利事儿今天聊声纹识别。即如何鉴伪声音。顾名思义，即通过声音来识别出来“谁在说话”，是根据语音信号中的说话人个性信息来识别说话人身份的一项生物特征识别技术。微信也有类似声纹解锁功能

声音解锁腾讯声纹识别 2022-10-13

用机器学习识别排球比赛的阶段

排球比赛的阶段用人工智能分析排球比赛有多种方法。我过去常常跟踪球，以便将比赛时间从整个视频中分离出来。另一种方法是确定游戏阶段，并根据阶段流程做出决策。让我们假设排球比赛包括4个阶段：· 没有开始。没有人或少数人在场上徘徊

机器学习 2022-09-13

使用计算机视觉反转视频

介绍在本文中，我们将使用［计算机视觉技术开发一个应用程序，该应用程序将反转视频，并且我们将能够将反转的视频保存在我们的本地系统中。在此应用程序中，我们还可以更改其质量，例如 360／720p。因此，让我们首先了解构建这个应用程序需要做什么

计算机视觉反转视频 2022-08-02

MIT最新AI面部识别研究：AR技术协助情绪侦测

“自闭症成人的感知神经连接可能是“嘈杂的”（noisy）或低效的。”作者：Claire编辑：tuya出品：财经涂鸦（ID：caijingtuya）对大部分健康的人来说，识别人脸上表达的情绪很容易。微笑可能意味着幸福，而皱眉可能意味着愤怒，但自闭症患者在完成这项任务时有很大的困难

AI 面部识别 AR 神经网络 2022-06-24

使用Python的人脸识别系统

介绍人脸识别不同于人脸检测。在人脸检测中，我们只检测了人脸的位置，在人脸识别任务中，我们识别了人的身份。在本文中，我们将在人脸识别库的帮助下，使用python构建一个人脸识别系统。市场上有许多用于人脸识别的算法

Python 人脸识别 2022-05-30

解锁随身“ID”，思必驰声纹识别自有奇招

20世纪40年代，“声纹”概念首次在Bell实验室被提出。1966年，美国法院采用“声纹”进行取证后，声纹技术开始在司法场景应用。伴随声纹技术在金融行业使用的标准颁布，声纹技术落地应用迎来了开篇。声纹识别又称“说话人识别”，与语音识别同属于语音前端信号处理环节

声纹识别 2022-05-19