苹果最新专利忙着研究AI图像合成，视觉灵敏度抑制算法精准获取人眼疲劳度！

2022-11-09 15:03

德高行知情郎

关注

知情郎·眼｜

侃透公司专利事儿

今天聊聊苹果的新专利。

看看苹果的工程师最近忙着解决哪些技术难点问题，尤其在AI领域，有啥新进展。

最近苹果日子过的不大顺当，新产品iPhone?14因为郑州富士康疫情也延迟交货了。

01苹果近期在忙啥

苹果最近忙着搞生产！

人家集中精力忙iPhone?14产线如何恢复，帮着友商处理郑州富士康问题。

众所周知，郑州富士康园区是 iPhone 14 Pro 和 iPhone 14 Pro Max 的主要组装工厂。

库克老爷子对iPhone 14 Pro系列寄予厚望，希望新品上市发光发财，延续苹果在高端机的统治力。

可吆喝了半天，帮苹果组装手机的富士康出了篓子。

这些天，郑州富士康员工因疫情逃亡厂区的段子满天飞，郑州园区2万人确诊疫情的消息，吓坏了当地。

这恐怖疫情吓怂了园区，当地员工纷纷跑路！

网友调侃，疫情拖累了产能，郭台铭也许现在焦虑的吃不下饭了！

要知道，郑州园区是生产苹果iPhone?14的主力部队，国内订单大多数都由此地生产，现在园区隔离的隔离，封禁的封禁，一屁股地方，工人吃喝拉撒睡都在一起，搞得疫情感染人数都难统计了，还咋开工。

更惨的是，库克新品发布会刚吆喝半天苹果14性能有多牛，然后就没下文了。

现在园区产线鸡飞蛋打，也不知道何时能复工。

没办法，苹果再牛，也得为疫情让道，得照顾大陆园区员工的情绪，也只有延后订单生产，支持富士康宽慰工人！

人家日前发了公告表示支持富士康抗疫，优先保障员工健康。

这局势，估计明年苹果，富士康转向印度越南的举措会更激进，一向以稳定、执行力强的大陆园区都出篓子了，还不积极分拆供应链。

哎，制造业不容易啊，富士康的工人更不容易，为这5000薪水拼死拼活！

02苹果最新公开专利在研究啥

聊完业务动态，聊专利。

下面苹果关于AI方面的最新八个公开专利，多数围绕姿态识别、视频音频AI检测还原、影像数据合成等领域。

最近，知情郎很关注AI技术，所以就找各大科技公司这方面的专利！看看人家工程师忙着处理哪些AI技术难点！

序号标题标题（英文）解决的技术问题公开号

使用多个传感器的基于机器学习的姿势识别

MACHINE－LEARNING BASED GESTURE RECOGNITION USING MULTIPLE SENSORS

针对现有基于惯性传感器的人体运动姿态识别中涉及特征较多、常用姿态识别方法不全面、识别精度不足等问题，专利提供了手势姿态识别及修正算法研究，通过特征提取与建库、特征筛选、姿态识别与修正等过程进行手势轨迹、姿态判定，提高识别准确率。

US20220351086A1

基于AI检测或分类结果的变化的视听压缩

VARYING AUDIO VISUAL COMPRESSION BASED ON AI DETECTION OR CLASSIFICATION RESULTS

图像压缩是数据压缩（Data Compression）的一种，因为图像压缩减少了编码图像所需的数据位，但同时又保留了图像细节。基于深度学习的图像压缩算法的先进技术，包括多层感知器、卷积神经网络和生成对抗网络已发展多年，该专利提供一种AI模型算法，可帮助构建并精细化处理图像和压缩模型，也方便迅速锁定目标图像。

US20220353458A1

用于空间音频再现的时域神经网络

Time domain neural networks for spatial audio reproduction

语音增强涉及将目标语音信号与干扰性背景区分开来。尽管近年来使用变异自动编码器或生成对抗网络（GANs）的生成方法已被越来越多地使用，但弊端也不少。该专利提供了一种新的技术方案来强化捕捉麦克风声音并强化了多音道信号，让过去的音频效果还原度更高！

US11490218B1

利用反向网生成更真实的合成数据

Generating more realistic synthetic data with adversarial nets

为了修改合成数据使得鉴别网络不能可靠地辨别细化的合成数据和真实数据之间的差别，可以在对抗设置中学习生成网络。生成网络和判别网络可以一起工作，以学习如何以降低的计算成本产生更真实的合成数据。该专利提供了一种技术而方案，让合成数据更加逼近真实，难以被鉴别。

US11475276B1

使用基于图像捕获条件选择的先验概率分布的计算机视觉

Computer vision

using a prior probability distribution selected based on an image capture condition

训练机器学习（ML）模型并将其用于产生与计算机视觉任务相关联的概率分布。ML模型使用与基于传感器数据确定的特定图像捕获条件相关联的先验概率分布。因此，机器学习模型被给予图像作为输入以及特定图像捕获设备条件的先验概率分布。使用先验概率分布可以提高用于计算机视觉任务的ML学习模型的准确性，效率或有效性。

US11468275B1

在部分潮湿条件下检测显示器上的触摸用户界面

Detecting touch user interface on a display under partial wet conditions

当液体存在于显示器上时，会导致接触不灵。触摸屏或带有触摸输入组件的显示器通常使用电容技术，通过测量由触摸输入引起的静电场的变化来检测触摸输入或用户输入到触摸屏的位置。在某些情况下，无论是否检测到触摸输入，液体都会引起静电场的变化。结果，液体降低了触摸输入组件准确检测触摸输入位置的能力，并且在某些情况下，触摸输入组件根本无法检测触摸输入。然而，本专利提供的技术方案可克服这些问题。

US11422689B1

用于图像创建的分类

Classification for image creation

各种技术被用于生成图像内容。例如，一些技术使用生成性对抗性神经网络（GAN）来生成图像内容，以提供看起来像可信场景的内容。但是，基于回归的技术所生成的内容还可能遭受边缘处不希望的锐度缺乏、结构中缺乏锐度或清晰度、或者以其他方式呈现模糊，从而降低内容的真实性。专利提供了使用基于分类的机器学习来为图像的缺失部分（例如，一些或全部）生成感知上可信的内容的系统和方法。

US11423308B1

自主车辆运动控制的决策

Decision making for autonomous vehicle motion control

一种用于车辆的行为规划器使用树搜索算法和从一个或多个机器学习模型获得的试探法来生成车辆的多个条件动作序列。每个序列对应于车辆的预期状态序列。至少一些动作序列被提供给车辆的运动选择器。运动选择器基于接收到的条件动作序列和从车辆的一个或多个传感器接收到的数据来生成运动控制指令，并将指令发送到车辆的控制子系统。

US11403526B2

03检测眨眼提高视觉舒适度方案

上面的专利其实具体解读起来都较复杂，涉及AI算法，大量的数据公式。

给大家解读一个相对简单易懂、实用性强的专利。

专利名：具有基于眼睛活动的显示器操作的电子设备（CN115167664A），该专利提供了一种用于头显的眼睛监测系统，专门检测用户的眼睛扫视（saccade）和眨眼。

专利摘要：在扫视和眨眼期间，用户的视觉灵敏度被暂时抑制。电子设备中的控制电路可利用对用户的视觉灵敏度的暂时抑制来对显示器的操作进行调节。例如，控制电路可协调显示器的操作与扫视和眨眼所关联的视觉灵敏度抑制时间段，以降低功率消耗和／或进行可能突兀的图像变化。通过在视觉灵敏度抑制时间段内进行调节，可向电子设备的用户隐藏这些调节。

简单说，这个技术方案就是检测用户眼部状态，用算法解析视觉灵敏抑制时间线变化，让头显等设备调节画面亮度时，尽量配合用户眼部状态。

即，尽量不要在用户眨眼、闭眼时，变化显示器亮度或者可能突兀的图像变化。强光、强画面变化会加剧用户眼部的不适度。所以要避免！

亮点在哪？

这个专利最大的亮点是如何确定用户眼睛处于视觉敏度抑制状态。

人类眨眼闭合是可以被机器捕捉并观察的，最后能用数据曲线体现。