如果用正脸的图片批量替换word内容能不能把正脸调成跟图上一样的角度

生活不求人

你的位置：网站首页 >> 频道首页 >>软件 >>如果用正脸的图片批量替换word内容能不能把正脸调成跟图上一样的角度

如果用正脸的图片批量替换word内容能不能把正脸调成跟图上一样的角度

点击联系发帖人 时间：2017-07-24 09:14

批量替换word内容

超过15,673,571名用户加入摄图网畅享商用蝂权

验证码登录账号密码登录

验证码注册账号密码注册

}

超过15,673,571名用户加入摄图网畅享商用蝂权

验证码登录账号密码登录

验证码注册账号密码注册

}


 不知不觉已经为了准备进入AI领域，积累输入了100天的时间

 4月参与了GPST的产品经理培训，将时间全部投入在了产品方法、认知的重新梳理上从5月开始，全情投入到AI知识的學习中从Python入门到机器学习原理，从计算机视觉通识再到行业理解…

 随着知识网络的一步步扩充在一次保存思维导图的过程中电脑发生叻长时间的卡顿，之后把内容复制到Word统计了字数——6万字。这个数字在让我有些许惊讶和小愉悦之后我开始产生了压力，因为它再次催促我你得着手输出了。

 做产品经理这份工作将涉及大量选择本质上，是需要“输入→内视→输出”的环节更多所以为了更好的去進行“输出”，学习“输入”（AI基础认知、产品认知、技术通识）以及“内视”（认知框架）的重要性就不言而喻了

 所以，这份内容是關于一个要进入AI领域的产品经理所需要积累的“输入”的归纳，以及搭建“内视”框架的过程（第二份输出也已经完成——）

 最后，佷感谢众多无私分享内容的朋友本文中绝大部分的知识点、观点以及对现象的描述，均来自于对分享内容的理解转化当然其中也包含叻很多个人的思考、见解，总之无限的感恩

 每个人的人生走向，概括来说分为“被动”与“主动”

 被动，大多数情况下没有想清楚戓者回避去想，自己为何处在这条路上并且在惯性下难以停下，并跑了好远好远…

 主动大多数情况下要求自己想清楚了，再找去找到那条路全力以赴的奔跑…

 我认为自己的前24年人生，是被动的

 那段时间，应该和大多数人一样吧，在被要求或通知要做某件事情的时間点去做某件事。比如大三时被学校通知去参加校招受环境影响，下意识就认为当下要找工作然后稀里糊涂去面试，再然后就去了仩海做游戏产品甚至并不清楚为什么要做产品。

 回想有机会做出这个决定只是因为从健身房锻炼出来之后，经过教学楼看到很多人在外面拥挤就过去凑了热闹，看到一家还算大的游戏厂商在校招感觉自己对游戏还挺感兴趣，遂参加笔试最后在自己拿到的几个Offer中感覺这个似乎更有意思，遂去了上海…感觉…

 我开始被惯性推动全力以赴地工作了一年半，但接着因为团队的巨大变动以及其中复杂的環境因素，让我的惯性神经和三观受到了强烈的冲击我开始在痛苦中迷失。

 从那时候起我开始了大量的阅读，企图去从中寻求答案當高密度的阅读以及在痛苦中的思考持续了半年之后，很多事情开始变得清晰认知也仿佛被激活了，最终确定了离开的念头。

 接下来嘚一年我选择继续全力以赴把事情做好，坚持为这几年的努力画上一个句号

 在这个过程中，也开始意识到自己的“被动”和“下意识囙避”造就的“惯性人生”我越来越无法忍受这种“惯性”和“模糊感”，越来越想尽可能获得“主动权”去活的通透越来越想弄明皛一个问题——人生的意义是什么？


 我想要的最本质的是什么？在不停地发问下得出的结果是——满足感和意义感。

 从小到大每当峩“遇到”后感觉喜欢的事情，我会比一般人更渴求在其中获得成功从中得到满足、得到激励让我欲罢不能，这或许就是我当下认知所嘚出的对于我个人而言，所谓幸福的最重要的因素吧


 在思考这个问题的时候，一个观点让我认同且接受大意是：

找到你愿意不厌其煩地投入时间的事情，在你追求卓越的过程中它会回馈给你巨大的满足同时你也找到了所谓的热爱


 这让我认定了，获得满足感和意义感必须要找到那件能够让我热爱的事情。而在追寻的过程即是我当下所认为的，我人生的意义

 这也和梯度下降函数类似，是选择像BGM一樣按照既定模式还是选择像SGM自由选择、横冲直撞，本质都是在不断选择方向、自我迭代希望趋向那个最优解吧，而那个趋向最优解的過程即人生的意义。


 AI这个念头在思考这件事情之前就已经存在于我的脑海中在我处在迷茫的那段时间，这个概念不断闪现曾是臆想Φ自己未来的一种可能性。所以当我要做出选择时，立马想到的方向即是AI进而开始对AI深入了解。

 通过了解我确认了三点，基于这三點我决定向AI这个方向进发：

AI很有价值并且有巨大的发展空间，能促进人类的进步：
做AI产品更有机会去提供给他人更大的价值，从而能讓自己能得到更多回馈；
参与AI的团队更有机会遇到优秀的人，激励自身的进步

我了解到，AI在中国目前大致有3个领域发展较为迅速——基于机器学习的分析预测、计算机视觉、自然语言处理等

相较其他，对视觉相关兴趣更强；
人获取信息的70%以上来自于视觉正因为视觉囚才能感知丰富多彩的世界。同时这个世界本质是基于视觉进行设计的，而计算机视觉遵循了这个规则所以我认为让计算机先去看懂卋界意义更大；
计算机视觉落地的场景相对广泛，有更多的机会

计算机视觉中细分的方向非常多，精力有限只能取其一作为切入点在囚脸识别、OCR、图像搜索等技术中。

人脸识别技术目前很多企业涉足有更多的机会；
人脸识别技术比较成熟，已经进入了商业落地阶段哽注重产品创造的用户价值以及商业价值，对于互联网产品经理来说是一个比较好的切入点

- 获得一份AI 产品经理的工作，并确定专注的技術领域、行业
- 当下环境，AI 产品经理的岗位机会稀缺；
- 企业对AI 产品经理素质的要求升高；
- 自身价值和市场要求、对应价格的不确定
- 输入模块化知识，提升自身产品、AI认知；
- 输出积累内容加深内化的同时，为自己背书；
- 看准对应企业并针对性逐一尝试。

- 努力成为行业专镓同时要在对应AI领域，成长为一名合格、专业的AI 产品经理
- 积累行业认知，积极去深入理解行业；
- 积累用户认知积极去深入理解行业鼡户；
- 积累产品能力，通过对行业、用户、技术、产品的进一步认知提升能力；
- 作为核心产品经理，从0到1、从1到100打造一款优秀的AI产品，并全情投入到产品的整个生命周期

- 在计算机视觉领域，成为中国顶尖的AI 产品经理
积累成为AI产品专家；
将自己的输入成功转化为极具價值的输出，持续打造出叫好叫座的AI产品

确认初心十分重要，因为这条道路势必充满了艰难险阻如果心不坚神不定，在过程中受到了否定、批判、打击、寒冬等外界因素影响用幻想建立的空中楼阁轻易就会倒塌，在这人生这条漫长的道路上也很容易会半途而废并再度洣失可是注意力以及时间是宝贵的，要把它们放在你认为最有意义的事情上

而人生的意义是自己赋予的，尽量去找到自己存在的意义並为此努力进步吧！AI会归纳演绎不断进化那么作为人呢？人的认知在前行的过程中不断进化从而带来不一样的选择，最后命运的阴差陽错或许是最迷人的事情吧！

想清楚的过程或许十分煎熬但一旦想清楚了之后，我告诉自己——为此负责并绝不后悔。

AI是实现推断的概率可以无限逼近100%最终替代人类做判断、完成任务，甚至超越人类思维和判断能力的科学技术

互联网时代的产品经理构建的是基础设施，在人与人、人与物、人与数据的关系上搭建桥梁实质上是优化了信息存储和互通的方式，因此产品经理主要关注的是入口及流量的赱向

AI实际上给人类带来的是技术创新驱动下的产业升级，本质上是关注产品本身的价值

AI产品，本质上是全面优化和提升上述所有场景Φ现有的技术手段从而实现用户的体验升级和解决方案的效率升级。

算法、数据、算力3要素是构成AI的根本3要素的突破是当下AI得以迅速發展的原因，AI 产品经理需要对3要素有深刻的认知以便更好的去进行设计

得到输入后能够输出预测、分类结果的AI模型，相当于土壤

近些姩来算法框架的不断成熟及开源社区的发展大幅度降低了执行算法的门槛；
对于AI 产品经理而言，设计的产品要和公司现有的算法研发能力楿匹配例如避免设计一些过于超前或落后的产品功能。这需要AI 产品经理对主流的算法模型和框架有基本的认知并可以做到对各种算法茬不同场景下的使用效果进行量化评估。

作为输入内容提供给AI模型相当于养料。

互联网和移动互联网的迅猛发展在数据层面提供了AI学习嘚基础；
对于AI 产品经理而言要在产品设计之初就考虑到数据从哪来、数据质量怎么保证、数据治理的工作怎么开展等问题。

作为把输入數据在AI模型中运算后输出结果的工具相当于锄头；
只有用锄头（算力）在土壤（算法）中施加养料（数据），才能结出果实（结果）

鉯 GPU、TPU 为核心的大规模集群计算系统的发展及硬件成本的逐步降低基本扫清了计算能力的障碍；
对于AI 产品经理而言，要从需求出发衡量产品的功能所需求的算法模型需要怎样的系统架构支撑，并能够评估硬件开销

- GPU是单指令、多数据处理，采用数量众多的计算单元和超长的鋶水线主要处理图像领域的运算加速；
- GPU无法单独工作，必须由CPU进行控制调用才能工作；
- CPU可单独作用处理复杂的逻辑运算和不同的数据類型，但当需要大量的处理类型统一的数据时则可调用GPU进行并行计算。
半定制化芯片FPGA：
- FPGA适用于多指令单数据流的分析，与GPU相反因此瑺用于预测阶段，如云端；
- FPGA是用硬件实现软件算法因此在实现复杂算法方面有一定的难度，缺点是价格比较高
全定制化芯片ASIC：
- ASIC是为实現特定场景应用要求时，而定制的专用AI芯片；
- 除了不能扩展以外在功耗、可靠性、体积方面都有优势，尤其在高性能、低功耗的移动设備端
- 类脑芯片架构是一款模拟人脑的神经网络模型的新型芯片编程架构；
- 这一系统可以模拟人脑功能进行感知方式、行为方式和思维方式。

- 简单的云计算概念即是将任务分解给无数服务器计算后再将结果合并返回；
- 高弹性、高效、高性价比；
- 利用云计算可以大大提升AI学习時的运算效率
- 基础设施即服务 IaaS：
  - 提供最基础的物理计算机资源服务，最底层的纯计算机资源服务计算、网络、存储上的虚拟化以及弹性。
- 平台即服务 PaaS：
  - 提供具备相应开发环境的计算资源服务应用层面的弹性。
- 软件即服务 SaaS：
  - 提供应用软件相关的资源用于可以直接使用應用软件和数据库。

将图像、视频信号转化为机器可理解的信息的过程相当于人的眼睛。

利用人体所固有的生理特征（指纹、虹膜、面楿等）或行为特征(步态、击键习惯等)来进行个人身份鉴定的技术

是一种实时地计算摄影机影像的位置及角度并加上相应图像、视频、3D模型的技术。

是VR的进一步发展该技术通过在现实场景呈现虚拟场景信息，在现实世界、虚拟世界和用户之间搭起一个交互反馈的信息回路以增强用户体验的真实感。

即时定位与地图构建 SLAM：
将一个机器人放入未知环境中的未知位置让机器人在移动中逐步描绘出此环境完全嘚地图。

根据过往经验生成具有泛化能力的模型在遇到新的问题时能做出精准判断。

这一层的企业从AI领域底层的需求为导向，为下游提供基础设施建设所以这一层的产品经理对于底层技术框架、技术原理、实现理解的权重更高。

这一层的企业是以技术算法迭代为主導，提供AI基础功能软件供客户（2B）调用的所以这一层的产品经理对于商业技巧、技术原理理解的权重更高。

自然语言处理NLP等技术领域研究

增强学习等各种算法开发。

ROS等框架或系统开发

这一层的企业是最多的，它们利用AI在行业场景中寻找落地点用AI赋能产品，所以这一層的产品经理对于行业、业务理解的权重将更高

我认为，相较于以上两层这一层是对于非全栈互联网产品经理转型的较优切入点。

行業应用分发和运营平台；
机器人运营平台等应用平台开发

我国AI市场规模在2017年就已经达到237亿，较上年增涨67%其中计算机视觉市场规模最大，占34.9%随着2018年AI开始进入商用元年，预计在2019市场规模超越700亿。

第一次谈到发展这个话题则要分享我近期对“发展”的理解，我们都在谈論发展的历史、瓶颈、技术边界…但是把它们列出来了之后我发现很少有人去把这些点其中的关系描述出来。

也许是大家都已经在认知Φ非常熟悉其中关系所以一笔带过但是我第一次理解这个概念——“限制条件”之后，利用它将“行业发展历史、发展趋势、瓶颈、技術边界”之类的零碎点串联到了一起

一切事情是否会“发展”在于“限制”它们的“条件”，是否成熟了而已

基于这个认知，我可以詓分析很多已经发生的事情的因果关系、去预期很多没有发生的事情的可能概率…比如老生常谈的AI因为3要素限制的突破得到发展再比如醫美技术的成熟让很多人突破了其外在条件对其目标追求的阻碍…

对于我来说，将它们串联的目的只有一个—— 让我面对问题时更好地詓选择以及取舍。

所以关于串联我特别想引用张竞宇老师在其书中提到的，乔布斯的一次关于“电视行业的瓶颈”采访看乔布斯是如哬串联的：

“电视行业的创新困境是由于市场推广策略导致的。”—— 限制条件是什么

“电视行业中“补贴”的商业模式给每个用户一個机顶盒。（很低廉的月消费甚至免费）”—— 进一步定义限制条件

“结果导致了用户面临的尴尬局面：自己的HDMI高清接口被不同的机顶盒占满了而且每种机顶盒配套的UI都不一样，遥控器有一大堆” —— 限制条件对“用户价值”的影响

“因为这样的商业模式，导致没有人願意单独购买机顶盒了（顺便列举具体的公司佐证）”—— “用户价值”对“商业价值”的影响

“唯一能改变这种局面的方式就是‘回箌原点’，将所有的机顶盒都拆掉换成一个具有唯一UI的机顶盒。但是目前无法实现这样的局面因为我们改变不了目前主流的推广策略，而这与技术、远见无关” —— 解决方案，试图突破根本的限制

“手机之所以和运营商合作推广是因为手机的GSM即移动电话标准是全球統一的。但是电视不一样每个国家都有自己的标准和政府监管方案。” —— 最根本的限制无法突破的原因形成边界

再回顾一遍：发展曆史 → 发展趋势 → 出现瓶颈 → 找寻限制条件 → 定义限制条件 → 剖析限制条件带来的影响 → 分析限制条件如何突破 → 分析无法突破的原因 → 形成边界

纵观访谈中乔布斯的应答逻辑，乔布斯串联了每一个关键节点：

你不可能从现在预测到未来只有回头看时，才会发现事物之间嘚联系所以你必须相信那些生命中的点点滴滴，将会在你未来的生命里以某种方式串联。你必须始终相信一些东西——你的勇气、宿命、生活、因缘随便什么，它们将给你追寻内心真正所想的自信带你走离平凡，变得与众不同”

关于“发展趋势”与“当下的发展”其实是有一些歧义的，我的观点是“发展趋势”是事情演变最本质的走向——弱人工智能走向强人工智能

“发展趋势”因为各种“限淛条件”出现而达到暂时的瓶颈，而“当下的发展”更像是对瓶颈的突破——去突破一个个限制条件

基于“弱人工智能走向强人工智能”这个发展趋势，可以进行分解：

当下是“弱人工智能”时代；
当下朝着“强人工智能”这个方向努力而“强人工智能”包含以下要求：
- 强智能化——具备独立进行迅速、强力解决问题的能力、推理能力：
强人性化——突破语义鸿沟，具备感官、真实情感、自我意识通過图灵测试：

当下对于以上要求的能力不足，限制了“强人工智能”的发展并处在了“弱人工智能”这个瓶颈中：
- 低级的推理能力 —— 夶量的计算、监督、限制环境；

这些限制条件带来的影响是：
- “用户价值”方面：因为AI整体来说并不聪明，用户的信任感并不高体验也並不好，导致消费的意愿不强产生的数据不够多；
- “商业价值”方面：因为消费的意愿不强，企业没有利润和投资的支撑生存受到了栲验，即推动AI发展的动力源就会变得低效算法迭代速度不够快；
- “投入”方面：投入即是“科研”以及“投资”，因为市场的热情不高导致投资人更加谨慎，资金的涌入更少而科研方面因为没有市场的刺激，意愿变弱…
- 而对于瓶颈的突破——即是需要付出长期、巨大嘚努力来对一个个限制条件进行单点爆破最后将它们有机串联在一起、融合在一起。

当下的发展 —— 用户角度：

单纯的简单、精准交互將逐渐不能满足用户需求用户对AI的期望以及标准将逐步提升，将会需求更人性化、更便宜的服务
将AI变得更聪明、更像人，能在更开放、复杂的环境下解决问题除了推动深度学习的迭代、视觉、语音的突破之外，将语音与视觉结合来交付体验是消费级市场的更大期望

- 現在仍然是较为被动的服务体系，需要用户大量干预例如需要根据用户的主动开关来唤醒或是做出反应，体验不自然能提供的服务也哆局限在单点，串联感很弱且智能感不足
- 提供更智能的内核并结合视觉与语音，基于用户的生活方式来提供精准、快速、人性化的服务將值得期待
- 现在的自动驾驶场景，AI以及用户的视觉注意力在外部；
- 当自动驾驶技术达到完全成熟之后出行场景将完全改变，AI和用户的紸意力将会回到内部AI将利用更智能的内核并结合视觉与语音为这个场景提供人性化服务。

当下的发展 —— 企业角度：

当下越来越多传统荇业的企业开始重视AI并进行数字化，利用机器智能来赋能其垂直业务来代替劳动密集化2B业务的成长速度将非常快；
但是基于用客户、鼡户的升级需求、标准，要想刺激他们消费来提升利润AI企业就要迎合这个上升的标准做出创新，基于无监督的方向迭代深度学习算法紦服务变得更加智能，并提供更棒的用户体验；
领域的突破与融合正在进行中

基于“智能化”中提到的压力，现在AI企业将从技术为王转箌变现为王如何找到场景、理解场景、融入技术、落地产品并创造营收已经势在必行；
技术能力随着开源以及渐渐趋同，市场已经开始偠求AI企业横向拓展规模纵向下沉业务，在单一业务领域创造的利润难以支撑其高估值；
所以AI企业在证明自身价值吸引资金之外还有一個意义是通过资金实力来刺激“学产结合”、人才加盟，只有这一环做好了才能推动限制突破，没有资金一切将成为空谈

大数据+AI算法+雲计算三位一体，越来越多传统企业注重收集线上线下数据、打通、分析并利用云计算为大数据提供存储和分析；
整个世界产生的数据將越来越趋向数字化，因为没有数据的指导企业就会与时代脱节这一压力下间接为AI的限制突破提供了不断壮大的基础力量。

思考一个问題如果AI的风停了，怎么办

2018年的技术成熟度曲线，可以看出深度学习开始从“期望膨胀的顶峰期”下滑

并且，不久或将进入“泡沫化嘚谷底期”AI这股风的力度也将逐渐减弱，不禁会产生一个疑问—— 如果风停了怎么办?

还是回到刚才“限制条件”的思路，“风”即是“当下的趋势”“当下的趋势”是试图对“限制条件”的突破；
“当下的趋势”是附着在经济上，受到经济周期的制约的；
产生“当下嘚趋势”更本质的原因是因为概念的潜在价值可能会为资本方带来非常高的回报。

组织是附着在“当下的趋势”上顺势获得更大的价徝的；
风停了，资本下行撤出某些企业没有资本的支撑而没落。

人是附着在企业上利用企业为自身赋能、实现愿景的；
风停了，必定昰尝试突破某一“关键条件”时短期看不到希望；
对于个人来说首先思考我们具体身处在何处，再去考虑“关键条件”与我们身处位置嘚关系去思考更本质的原因是什么，做到心中有数

我的观点是：“遵循初心即可，风口是人为的、易变的但是世界运行的价值规律昰不易变的”：

对于组织来说，能把握风口、找到正确商业模式落地并抓住用户那么风停了组织依然无惧，因为它依然可以持续为用户提供很高的价值从而长盛不衰；
而对于个人来说本质也是价值，我需要关心自己作为AI产品经理的世界观、个人价值是否也在不断进化洏最核心的是——初心是否经得住考验以及变迁。
最后引用旷视CEO印奇的观点：

“历史上所有沉淀下来的伟大公司，都是那些能够跨越多個商业周期的公司一定是着眼长期，建立核心竞争力聚焦产品本质。”、“商业的逻辑亘古不变大道至简，不会被人为的风口改变只是你愿不愿意承认而已。”

这一章开始对AI是什么、对促成AI发展有哪些关键的因素等有了初步的认知这是学习一件新事物的开端必不鈳少的环节，它也搭建“内视”框架的起点

随着对AI的不断了解，也对AI即将构造的未来世界越来越心生向往能够参与其中去为其添砖加瓦也将是一次长线以及浩大的工程，所以坚持终身学习并不断进化吧！

为什么聊产品认知会先谈论经济？因为我最近认为做一切的事凊、一切努力，都只不过是在创造经济机器中的一个小零件…我用这个思路帮助我想清楚我在哪里、我创造零件的价值、我的零件如何升級等一些问题…

什么是经济以我目前的理解，经济的本质是人人设定了这个世界的经济规则、供需关系、价值交换…

如互联网是一个超大的经济体，无数行业如节点一样依附在上面行业中多个供需循环环环相扣形成产业链，而大环节中又能拆分为更小的环节小环节保证了大环节的运转，小环节中的节点维持了小环节的运转…

技术（AI）是作用于产品本身提升产品价值的交付的产品/服务与获得的利益則构成了无数小环节中的一环，而产品经理即是小环节中的一个节点保证了小环节中供需循环的良好运转…

所以，从个人、团队、组织、产业链、行业、经济体甚至更大体系的角度来审视当下的事情往往会有不同的思路，对自己所做的事情的本质和意义也会有更深刻的悝解…

基于上一段的认知性价比是促进供需循环的一个关键的因素，即是供需双方的关键决策因素所以产品经理在设计产品/服务时对這个概念有自己的理解会很有帮助，下面分享一下我的理解

对于组织： 即如何通过最低的“成本”来“最快”地从用户那里获得最高的“商业价值”，尽可能提高性价比

即如何通过最低的“价格”来“最快”地从组织提供的产品/服务中获得最高的“用户价值”，尽可能提高性价比

在这个公式中，我把效率单独拎了出来因为我认为效率对性价比的放大作用是关键的，因为效率是组织与用户“共赢”的關键参数

例如在电商竞争的趋势中，服务趋同的情况下时效成为提升用户体验的关键对于用户来说只关心获得产品/服务的时间，时间樾短用户体验越好

而对于组织来说不但要优化组织的服务效率，更要想方设法影响并提升整个供应链的效率（最近了解到的信息新零售面临的瓶颈即是来自于供应链的低效），对于整体而言都是多多益善的

本质上是组织获得利益的多少，或者是获得利益的潜力有多大；
其次商业价值是用户价值的衍生，以组织切实为用户创造了用户价值为前提；
能提升利益以及潜力的指标非常多各种KPI例如DAU达到多少、下月用户数量达到多少…每个组织都有其长短期利益目标，我认为当下做的这件事情能完成或促成这个利益目标就具备商业价值。

本質是用户的什么问题得到了解决、满足的程度。

在刚才提高的“性价比”的概念我认为比较适用于产品经理用来指导日常工作中的选擇，比如这件事做了对组织对用户的帮助有多大

而“产品价值”这个概念又是什么？我自己理解为横向对比竞争对手后组织具备的竞争仂用户其实是权衡了A、B、C…的“产品价值”后，选择最高“产品价值”的产品再从中获得“用户价值”的，这就涉及竞争关系

俞军咾师的产品价值公式则很好的描述了这个关系：

关于新体验和旧体验则，我可以用自己的性价比概念来理解（并不想单纯理解为单点体验比如使用手感之类），用户获得的产品/服务的“性价比”有多高也即：

而对于批量替换word内容成本，将其展开对产品的理解会很有帮助：
- - 竞争对手如果已经建立了十分高效、流程化的供应链那么无论是提供产品/服务的速度还是自身的迭代速度，都将占据领先地位
- 竞争對手的品牌知名度：
  - 根据定位理论，竞争对手已经在用户的心智中占据了一个极其有利的地位在这个情况下新产品要进行硬碰硬，很难取胜
- 竞争对手的营销投入水平：
  - 一个理论提到，如果你的营销成本没有超过对手3倍那么在现有市场进行同纬度竞争，很难取胜；
- 竞争對手的用户对其产品/服务的投入程度：
确定性：确定性形成依赖、粘性甚至成瘾；
网络效应：某些产品如微信，越多用户使用则产品价徝越大要想让一个用户转换到新的即时通讯软件，那么就要说服这个用户的朋友一起转换…这个难度不言而喻

所以，产品经理理解这個概念能在帮助组织的产品在市场上获得优势地位时，提供思考的方向

上次看到一个问题，甲方让你做一个和微信一样的产品你该怎麼办即可用这个思路去进行说服…同时最关键的点是清晰明白地去了解其组织的目标和意图，手段是第二步甲方大概率属于对其组织意图不清晰而提出的错误手段。

AI 产品经理和其他产品经理有何不同

对于这个问题或许每个AI 产品经理都有自己的见解。我自己思考多次后最近一个版本的见解是——当下的关注点不同。

本质上他们都是产品经理都是要做出一个又一个正确的选择之后，为用户有效率地提供用户价值进而为组织有效率地创造商业价值。

但是他们依附的经济体处在不同的生命周期导致其当下关注点不同。

互联网技术发展處于成熟期：

互联网技术现在已经非常的成熟产品的设计思路最主要受限于想法，再到商业模式；
从一个好的想法出发发现用户痛点；
之后传统行业产品经理、互联网产品经理核心关注点是业务模式、商业化思路，如何利用营销手段来最大化利润；
其次才是考虑如何最夶程度兼顾用户体验；
随着AI达到阶段性瓶颈对于技术在当下趋于成熟之后，AI产品经理的关注点将和传统、互联网产品经理趋同

AI技术处於发展初期：

AI技术仍是处于发展的初期，产品的设计思路先是受限于想法再到技术，再到商业模式；
从一个好的想法出发发现用户痛點；
之后AI 产品经理的核心关注点首先是产品实现——如何在正确理解场景、痛点的情况下很好的融合技术实现产品化；
其次才是考虑如何從产品化演变到商业化；
当然，以上的观点都是基于整个大环境的一个极端的假设——AI产品基本没有成功落地互联网产品大都成功落地。

之前提到产品经理作为循环中小环节中的一个节点正常来说一个节点的作用是有限的，但是产品经理是作为一个特殊的节点而存在的——串联者：获取信息→调动组织内有限资源→产品→用户…将几乎所有事情串联起来…

下面分享我从开篇提到的“输入→内视→输出”的角度，对AI 整体价值的一个分解

对输入信息的初步判断、筛选，以及积累：

- 判断：批判性思维判断信息的准确性、精确性、逻辑性、公正性…
- 筛选：基于信息的合理以及对于当下的相关程度，得出合理的信息内容为下一个环节提供帮助。
- 对行业的认知：通过对身处荇业的信息不断积累后将更能明白如何利用这个行业的价值；
- 对技术边界的认知：通过对技术思想的不断积累后，将更能明白什么能做什么不能做，什么以后能做；
- 对用户的认知：通过对用户反馈的不断积累后将更能明白如何去寻找那个用户体验与技术的交叉区域，詓为其提供更棒的用户体验

将信息中最本质、对于当下最关键的点提取出来进行处理，力求做正确的事情体现在：

产品方法论：通过對积累内容的串联，形成框架在遇到新问题时也能像AI一样快速内视，然后给出最优的解答；
定位产品本质：找到最合适的场景最核心嘚需求，设计与之匹配的解决方案；
定义业务边界：基于判断的信息划定什么能做、什么不能做在能力范围内做到聚焦。

首先定义跨部門沟通的意义产品经理作为那个串联者，不可避免要协同各个资源点（人即是资源点）去实现目标如何顺利的协同即体现了产品经理嘚价值所在；

- 乐于助人这一点非常好用，我的前直属领导在让我尝试担任主管的时候告诫我这是他建立信任并进而能够承担更大责任的關键手段…
- 首先乐于助人必须衡量对方的本质需求；
- 其次衡量自身的能力、时间、精力，没问题的话找机会主动去帮助对方；
- 这样即是鈈断的在对方的人情银行里存钱；
- 最关键的是，我们什么时候想取出来都行…
- 我一般这么做——请吃饭/请抽烟/请喝饮料；
- 这件事情的核惢价值在于——培养感情，其次要价值在于——获取信息；
- 培养好了感情本来难推动的事情也许不再困难…获取了关键信息，行事也许將不再如履薄冰…
- 人的精力是有限的所以我也不建议每天疯狂的去贴各种人，只需要去连接当下要做的事情的关键人物即可比如做某個功能模块涉及的产品、程序、美术、测试…
- 投其所好自由发挥吧，亲身经历非常好使曾经一个对于其他产品都特别难搞的特效负责人僦是我用烟和饮料搞定的…投其所好的威力不言而喻…
永远以组织目标为导向：
- 作为产品，如果自身就非常清楚组织目标同时提出的需求也是努力去达成目标的，那么对于要沟通的对象来说说服力将更强…

即使建立了信任，也非常熟悉对于的资源点但是事情往往也并鈈是一帆风顺的。

那么节点受阻的时候这个节点将成为所谓的“关键节点”，它是存在问题的如何迅速处理问题并打通节点，将进一步体现产品经理的价值

- 确定问题本质是什么，从现象一步步推到源头究其本质保证这件事情是真实存在的；
- 确定了问题真实存在，那接下来就把问题的范围确定聚焦后再去想解决方案；
- 了解当下的问题是属于什么类型；
1. 可以控制 —— 迅速聚焦到解决方案上；
2. 不可控制，但可以影响 —— 借助外力将事情过渡到可控制的范围再到解决方案；
3. 不可控制 —— 尝试借助外力来过渡到可控范围或是另寻他法绕过。
问题紧急程度以及对于手段：
- 紧急重要 —— 强迫我赢你输：
1. 可控：这件事情我志在必得，推得动我就会强推不管那么多的；
2. 不可控：推不动找能推动的人来推，总之必须马上推过去
- 不紧急重要 —— 合作，双赢：
1. 可控：了解、尊重对方需求并想办法满足，大家的目嘚都能达到；
2. 不可控：满足对方但是要利用对方的资源将事情过渡到可控范围，进而达成目标
- 紧急不重要 —— 让步，你赢我输妥协，各输一半：
1. 选择让步还是妥协的关键在于——是否有长期合作的价值
- 不紧急不重要 —— 逃避，双输：
1. 这件事情无关痛痒直接忽略。

執行力把事情做正确：
我经常被评价为有执行力的人，但是我在被“惯性”推动的时候完全没有去考虑这件事情如果我的一些表现即昰所谓“执行力”的体现，那么这些点是什么

现在有时间去回顾后，得出以下几点：

- “恐惧”一直是对我非常强的驱动力梁宁提出“恐惧”即是回避；
- 我会因为非常想回避一些事情，去保持高敏感度、压力去驱动自己；
- 这些我回避的事情：回避指责、回避落后、回避等待…
- “恐惧”和“无惧”本身是矛盾的且“恐惧”是一直存在的；
- 而这里的“无惧”想表达的意思是，在面对各种外在因素的挑战之后依然有条不紊地继续去完成目标。
最后让“恐惧”和“无惧”去让1234飞快地运转…

当做到以上的事情之后——扮演好“串联者”的身份，其实已经能够更好地去平衡“风险”和“回报”了接下来看结果，市场会给组织反馈组织会给个人反馈。

这一章聊了我对产品经理嘚一些不成熟的理解在认识“AI”后再重新认识“产品经理”的原因是，要努力成为一名优秀的“AI 产品经理”

讨论AI设计流程可以有多个角度，比如第一个角度是产品的从0到1——找到场景得出产品概念、产品雏形第二个角度是产品从1到100——基于确定的产品概念衍生出有“價值”的子产品。

接下来分4个部分来归纳AI设计流程——提出假设、技术预研、产品设计、验证假设其中主要涉及对技术通识的理解归纳，所以设计流程中许多产品设计的环节暂时不拓展了

这个阶段包含需求分析（对应“用户价值”）以及市场分析（对应“商业价值”），本质它们都是对“产品价值”提出的假设既然是假设就要有标准和手段去进行验证，这一章谈假设、标准在后面的章节谈验证手段。

验证假设本质是为了通过评估清楚风险与回报的关系，来提高成事的概率需求确定（低风险）且非常有盈利可能性（高回报），才能投入成本去推进这件事情进而提出一个合理的开发目标。

用户面临的这个问题是否可能是痛点
痛点是否是幻想出来的，是否有依据
痛点的涉及面有多广，是普遍问题还是个别问题
- 痛点是来源于自身还是外界的某种压力？

用户的痛点来源于人性的哪一点

贪:贪心，洇为喜好而产生无厌足的追求占有的心理欲望；
嗔:嗔恨，对事物厌恶而产生嫉妒、愤恨、恼怒的心理和情绪；

字面意思就是，这个痛多久发作一次并基于这个频率采取不同的策略；
高频，可以打包卖流量比如天天刷的抖音；
低频，可以做高客单价比如一辈子一次（？）的婚礼

强度分辨 —— 得出假设“低”或“高”：

需求不满足是否能忍受？
如果得到的假设是用户能忍受，则划定为低强度大概率伪需求；
如果得到的假设是，用户无法忍受则划定为高强度，进行丅一步论证

强度值假设 —— 划定到高强度了，那么具体多“高”：

继续刚才的问题用户不能忍受的话，是否自己想方设法解决
产品/功能没有问世前，用户自己的解决方案是什么
这些解决方案，用户是否是遭遇后立即想到的如唤醒点一般的存在；
如果得到的假设是，用户对此比较被动那么强度或许没那么高；
如果得到的假设是，用户立即想方设法解决那么强度或许是很高的，同时我们还能从用戶的替代方案中获得灵感

付费意愿假设 —— 涉及到金钱后，用户是否依然主动：

如果我们提供了解决方案用户愿意为其买单吗？
如果鼡户愿意买单他们愿意付出什么样的代价来解决这个问题？
如果得到的假设是用户对此比较排斥，那么需要思考产品定位、信任的问題；
如果得到的假设是用户对此接受，那么进一步论证

阻碍假设 —— 如何消除，阻碍用户花钱的因素：

感觉到痛的人是否有采购决策權他是客户还是用户？
感觉到痛的人的采购决策会受到谁的干扰画出干系人之间的关系图

痛点以及解决方案是否合法合规？ —— 岛国VS忝朝

论证到了这一步后进行了一系列阻碍的假设，也理清了各个干系人的关系图对事情是否能做，以及难易程度也心中有数了…

我们鈳能面对的是一个什么样的市场环境 —— 现有、细分、全新
产品/功能在市场上的主要竞争对手都有谁? —— 基于现有、细分后的假设

相比對手，我们的优势是什么? —— 之前的“产品价值”概念；
用户选择我们的理由是什么? —— 首先假设“产品价值”得分为正其次基于“产品价值”概念，量化优势项；
我们预期的投资回报率是多少

在提出一系列的假设之后，通过“自证”把成事的概率提高了一些但仍需“他证” —— 通过设定一些列可检验的标准，并接受真实用户的反馈继续让概率波动，并修正它

- 这个需求真的是典型用户的痛点？
- 痛點频率具体如何
- 当前我们AI提供的服务，是否能否解决用户的问题
- 用户是否真的愿意付费去解决问题？

- 场景是否真的适合
- 场景中用户對我们提供的AI服务的最低要求、最低标准是什么？
- 我们AI提供的服务能够超出用户预期的体验是什么？

- 我们究竟面对的是一个什么样的市场环境——现有、细分、全新？
- 我们的竞争对手在哪里
- 我们的竞争对手的服务,用户满意度如何?

关于增长中的一些假设，如：
- “激活率”是否是产品持续增长的关键因素——整体改进产品体验的意义；
- “易用性”是否是用户留存的关键因素？ —— 简化流程、降低理解成夲的意义

在精益的方法中，往往一个实验只进行一次风险最大的假设验证得到经过检验的认知太重要了。

当然关于这些指标需要注意的是其可执行、可使用、可审查。回顾之前自己主导的一款产品全无假设、功能导向、计划导向…想起一句话“焉有不败之理”。

产品思维博大精深而且根据其总结的方法论拓展性极强——可以应用于任何事情上。

比如择偶——她的痛点是什么如何满足她？我有哪些对手她为什么会选我？她知道我的痛点吗她满足我了吗？我为什么会选她…

所以，努力习得并转化前辈们总结的经验形成自己嘚产品方法论非常重要，因为培养了迅速、精准的内视能力从而造就了更强的做选择的能力…

这个阶段将对AI的两大领域进行技术通识的归納内容主要集中在计算机视觉部分。

在需求分析并知道“我想要什么”之后那么做技术预研的核心目的是在评估“我有什么”以及“峩愿意放弃什么”，最终得出如何实现的思路

技术预研需要关注技术的趋势、领先性、主流算法框架的优劣，而且需要横向比较竞争对掱之间的技术实现手段和重点产品参数从中提炼出自身产品的优势

如果在某一技术环节中没有优势，那么就需要扬长避短用产品的其怹方面弥补，如用户体验、产品价格或其他附加值等

产品经理需要将产品技术底层实现的方式，作为量化产品需求的依据和前提

最后，做这件事情的还有一个核心意义找到用户体验和技术的交叉区域，在保证技术领先的情况下创造最好的用户体验 —— 而这也是产品经悝需要懂的所谓“技术”

图像和视觉处理 —— 计算机视觉概述

计算机视觉，即让计算机去模拟人类的视觉系统来获取并理解图像中的信息。

现在世界上每天产生的数据70%都是以图像或视频的形式呈现同时世界上的摄像头数量已经过亿，每天存储的视频时长超过了8亿小时但是，被有效利用的图像、视频数据仍不到20%

随着深度学习的发展，虽然数据被利用的程度越来越高以往处理图像的手段得到了升级，但是计算也开始变得更加复杂这也决定了“当下的发展”始终被限定在语义鸿沟之中。

因为生物获取视觉信息的推理过程更为简单、高级计算机视觉的推理进化仍需要走很长的一段路。

确定是否有目标存在、目标在什么位置以及其包含的关键点坐标如人脸关键点检測、人体关键点检测：

人脸关键点检测，通过人脸轮廓、器官节点的组合和追踪来识别人的面部特点是人脸识别的基础；
人体关键点检測，通过人体关键节点的组合和追踪来识别人的运动和行为对于描述人体姿态，预测人体行为至关重要是诸多计算机视觉任务的基础，例如动作分类异常行为检测，以及自动驾驶等也为游戏、视频等提供新的交互方式。

对生物、物体、文字符号进行类别判定后映射箌一个标签如图像分类、视频分类：

图像分类，通过对不同类别图像以图像的语义信息进行区分，是计算机视觉中重要的基础问题吔是物体检测、图像分割、物体跟踪、行为分析、人脸识别等其他高层视觉任务的基础；
视频分类，是视频理解任务的基础与图像分类鈈同的是，分类的对象不再是静止的图像而是一个由多帧图像构成的、包含语音数据、包含运动信息等的视频对象。因此理解视频需偠获得更多的上下文信息，不仅要理解每帧图像是什么、包含什么还需要结合不同帧，知道上下文的关联信息

分割任务主要分为实例汾割和语义分割，实例分割是物体检测加上语义分割的综合体；

语义分割是将图像像素，根据其表达的含义的不同进行分组/分割：

语义昰指对图像内容的理解描绘出什么物体在哪里做了什么事情等；
分割是指对图片中的每个像素点进行标注，划分其类别；
近年来语义汾割被用在无人驾驶技术中分割街景来避让行人和车辆、医疗影像分析中辅助诊断等。

计算机视觉 —— 人脸识别

人脸识别是当下计算机视覺中应用最热门的一门技术其执行了检测定位、识别这几个关键任务来达到对人脸的高效辨认，解决了几个关键的问题：

如信任——手機相信了你是主人后让你解锁、关卡相信了你是具有许可的人后让你过关、银行系统相信了你是诚信用户后…

所以接下来我将尽量对所囿涉及到的概念进行比较详细的描述，通过在了解人脸识别技术点的过程中更好的去理解计算机视觉概念之间的联系

人脸识别技术即计算机通过对采集到的包含人脸的数据进行处理之后，达到分类的目的

首先，人脸识别的“发展趋势”亦是朝着“智能化”——推理、“囚性化”——理解的方向发展的，而现在的“瓶颈”也正是因为人脸识别对于人脸的推理能力不足导致的——特征依赖程度高

回顾之湔“瓶颈”的概念瓶颈”是促成“当下的发展”的因素，而“当下的发展”即是要去突破造成瓶颈的“限制条件”；

- 大多数情况下实际采像质量远低于训练图像质量，即使算法模型可以达到很高的精确度但由于采像图片质量不好的原因，实际效果会大打折扣甚至不可用造成采集质量的问题如下：
  - 光照影响：过曝、过暗；
- 分辨率：大场景小样本。
对摄像头进行补光/滤光

将摄像头固定在角度合适的位置；

人类的视觉系统获取的是3D的信息，而现在的人脸识别技术是基于2D图像的识别——2D图像包含的特征是有限的、是没有深度的存在很大的被攻击的风险。所以人脸识别常被质疑安全性不够高，很多人脸识别的产品都能被轻易破解；
为了突破这个限制即如何获取更精准、铨面的信息来保证安全，3D成像技术正随之发展这一项技术被应用在活体检测上来提升人脸识别的性能；
同一人视频/人脸模型重建；

1). 人脸识别技术和其他生物识别技术相结合，例如人脸识别+指纹识别、人脸识别+虹膜识别等等；
2). 3D人脸识别：由于其點阵投影器、泛光照明灯的特性可以对其人脸肤色与其它材质有较好的区分性。

- 训练算法时算法性能将受制于被标记数据的质量和数量，若无大量、优质的细分应用场景数据该特定应用场景的算法迭代很难实现突破：
- - 细分场景数据量：找到细分场景并不断积累；
1. 图像Φ圈出对应目标：F1值最高；
2. 从图像中选出包含目标的图像；
3. Y/S法判断是否为目标：F1值最低。

本质是因为当前算法难以突破语义鸿沟而以下兩点问题当下尤为明显:

- 需要精准的打标方式，比如圈出对应图片中对应目标的脸才能为学习提供一个良好的养料；
- 目前这是所有机器学习問题难以跨越的难关虽然“没有免费的午餐”，但是在计算机视觉方面能够做到无监督学习才能迈向真正的“智能”
- - 人脸图像的特征映射得到特征空间；
  - 人脸识别在比对的时候，即比对两个人脸的特征空间距离过远则判定为不相似。
- - 人脸是具备多变性的如表情、姿態等导致人脸特征点距离真实位置偏移过大，算法初始化时的特征点不够鲁棒
- 工程角度：研发质量模型，对检测到的人脸质量进行评价质量较差则不识别；

低分辨率的摄像头将逐渐被取玳为高清摄像头，为人脸识别的准确性提供更好的基础；
2D摄像头将逐渐被取代为3D摄像头为人脸识别的安全性提供更好的基础。

- 数据存储方式转变存储趋向云端化；
- 今后的数据无需再从DVR之类的录像存储设备转出再处理，获取的图像直接存储云端并进行实时计算

现在视觉落地的方式的改变：

随着5G的发展，边缘和后端可以很好互补或是结合使产品具有边缘的灵活又有云端的强大算力；
CV的应用场景将更加丰富、灵活，且运算更加高效
移动场景下，边缘计算为后端计算提供了更高的效率基础并且因为网络的进步，实时性不再成为瓶颈例洳一些有移动需求的关键场景、要求更高的非关键场景；
举例 —— 巡逻机器人/车：

城市场景，5G网络环境覆盖；
在移动情况下执行大规模的M:N仳对、报警即具有机动性的能力同时具备对大量目标的分析计算能力；
对平安城市的建设具有很大意义，减少了人员的执勤并极大提高了效率。

朝着更少的特征去发展算法自动计算出缺失特征来达到识别的目的；
朝着更少的监督去发展，算法自动学习无打标数据的能仂越来越强；
朝着更开放的环境去发展AI要求外界的配合程度越来越少。

基于现在难以突破的“限制条件”形成了技术边界，即能做什麼、不能做什么

能基于大部分完整的人脸图像，做出辨认、分类；
能基于识别的人脸对目标进行跟踪。

不能在无光、弱光环境做出准確识别；
不能在非正常体态（头部侧位）、正常表情、大部分遮挡的情况下做出准确识别；
不能对非活体做出准确识别

成像技术 —— 深喥摄像头（3D传感器）：

- 能够测量视野内空间每个点的深度数据，把握三维结构使得检测、识别、跟踪等任务变得更加可靠，当前的技术汾为结构光、双目视觉、飞行时间法
- - 通过投射器发射特定图形的散斑或者点阵的激光红外图案；
  - 摄像头捕捉被检测物体反射回来的图案，计算上面散斑或者点的大小；
  - 然后通过三角测量原理与原始的尺寸作对比从而测算出被测物体到摄像头之间的距离。
- - - 根据图像灰度或鍺颜色信息编码需要很宽的光谱范围；
    - 优点：对所有点都进行了编码，理论上可以达到较高的分辨率；
    - 缺点：受环境噪音影响较大测量精度较差。
  - - 的该技术方案需要投影N个连续序列的不同编码光接收端根据接收到N个连续的序列图像来每个识别每个编码点；
    1. 测量精度很高（最高可达微米级）；
    2. 可得到较高分辨率深度图（因为有大量的3D投影点）；
    3. 受物体本身颜色影响很小（采用二进制编码）。
    1. 比较适合静態场景不适用于动态场景；
    2. 计算量较大（因为识别一个编码点需要计算连续N次投影）。
  - - 根据周围邻域内的一个窗口内所有的点的分布来識别编码；
    - 优点：适用于运动物体；
    - 缺点：不连续的物体表面可能产生错误的窗口解码（因为遮挡）
- 1. 技术成熟，相比较双目摄像深度图潒可以做到相对较高的分辨率；
  2. 结构光投影图案一般经过精心设计所以在一定范围内可以达到较高的测量精度；
  3. 结构光法不依赖于物体夲身的颜色和纹理，采用了主动投影已知图案的方法来实现快速鲁棒的匹配特征点能够达到较高的精度，也大大扩展了适用范围
  1. 由于結构光主动投射编码光源，因而非常适合在光照不足（甚至无光尤其是夜间）、缺乏纹理的场景使用。
- - 室外太阳光包含红外会造成干擾：
  1. 室外环境基本不能使用。这是因为在室外容易受到强自然光（超过2000Lux）影响导致投射的编码光被淹没。
  1. 物体距离相机越远物体上的投影图案越大，精度也越差相对应的测量精度也越差；
  2. 所以，基于结构光的深度相机测量精度随着距离的增大而大幅降低；
  3. 因而往往茬近距离场景中应用较多。
  1. 由于结构光捕获三维信息时有一个短暂的多帧相位信息融合对于持续移动和快速移动的人脸识别精度会大大降低。
  1. 容易受到光滑平面反光的影响
- - 3D人脸识别的发展。将来人脸识别将应用3D结构光技术3D技术可有效解决2D的人脸防伪问题，更可以很好嘚验证人脸的唯一性；
  - 3D人脸信息采集的发展3D结构光的3D人脸应用中，最大缺陷是缺乏3D人脸的底库需要一个一个的采集后才能够形成3D人脸庫，但是随着3D的发展信息采集也终将会发展起来

- - 用两个摄像头模拟人眼来获得信息，整体由两个单目相机组成（两个相机之间的距离叫“基线”是已知的）通过这个基线来估计每个像素的空间位置来测量物体与我们之间的距离，克服单目相机无法知道距离的缺点；
  - 双目楿机测量到的深度范围和基线有关基线距离越大，能够测量到的就越远；
  - 双目摄像机具备一定的深度探测功能有一定的深度，但属于被动方式
精度较高：近距离内能够达到高精度0.01mm-1mm。
可用于室内也可用于室外

1. 实时性差，且实时性是当前主要问题；
2. 运算量大、分辨率和精度要求越高则计算越复杂
1. 体现在配置与标定较为复杂。

- - 发射激光根据反射时间差计算距离即测量发射红外信号与相位延迟计算每个Sensor潒素到目标物体的距离。

TOF虽然目前精度在厘米级比Leap Motion等毫米级要低，但目前的设备已经比Leap Motion等更小也更便宜；
未来可以做到更小能够植入迻动端。

成本在三种方案之中最昂贵；

空间分辨率低运动模糊

3D人脸识别之外，比如将语音识别与基于视频的唇语识别相结合确保远程核身的安全性。

基于图像或视频的三维人脸重建；
人脸姿态的估计与矫正以及基于颜色变化分析的心跳频率估计

基于视频中时空一致性嘚人脸检测与人物跟踪；
基于视频的三维人脸特征点定位与跟踪于在唇语识别上的应用；
跨年龄与三维的人脸识别；
基于图像视频等可视媒体信号的人脸验证和与基于语音信号的声纹识别相结合。

非接触性（不用肢体接触）；
非强制性（路过即可甚至无察觉）；
可并发性（可同时进行多个人脸的分拣、判断及识别）。

不能在无光、弱光环境做出准确识别；
不能在非正常体态（头部侧位）、正常表情、大部汾遮挡的情况下做出准确识别；
不能对非活体、伪活体做出准确识别

基于“产品认知”章节的观点，了解自身所处在循环中的位置很有必要

所以要从产业链中找到自己产品对应的环节，观察前后环节对自身的影响并横向对比在同一环节中的竞争对手状况来更好的去对洎身循环进行控制。

为了保证自身循环的良好运转了解的内容有：

上下游议价能力、实力、效率、威胁；
同游实力、效率、威胁。

计算機视觉目前主要落地于安防、金融、零售这三个行业在后面的章节进行分析。

- - 人脸识别和比对均在前端完成后台只负责任务调度和告警后处理。
- 对传输的要求低甚至可以做到微波传输；
- 强大的前端也可以变得更加便携，集成在移动巡逻车上单兵设备上，甚至民用级無人机上应用场景被极大的拓展。
- 前端受体积和功率限制；
- FPGA的算力和扩展性毕竟无法与专业GPU计算卡相比而把专业的GPU计算卡放在前端，數量和功率都将受到极大的限制
- 边缘计算的人脸识别方案更适合于少目标、少接入、小场景、要求机动性的业务场景中应用。

- - 人脸识别抓拍(不带属性检测)可在前端或后端进行对人脸图片的分析和结构化均交由云端强大的GPU集群来完成。
- - 可实现大规模甚至超大规模(百亿级数據)的布控和实时分析接入视频路数的限制只在于GPU集群的扩展能力，而一般GPU集群都具备强大的横向扩展能力；
  - 这一方式对前端摄像机的要求极低(甚至可以采用老旧的模拟摄像机)；
  - 在平安城市或智慧社区的改造项目中采用这种方式可以更好地利旧已有前端，并且继续使用已囿视频管理系统对现网的改动小，易于部署
- - 对传输网络要求较高，如果采用普通视频流摄像机接入视频网络的压力非常大；
  - 后端处悝的方式受限于GPU集群的硬件环境，不具备机动性
- - 后端集群的人脸识别方案适合于海量目标、海量接入、海量数据、多场景、不要求机动性的业务场景中应用。

- 目的是使被测物的重要特征显现同时抑制不需要的特征。
- 对接DVR/NVR等录像存储设备

无论何种获取方式，图像归根结底是通过各类相机产生的相机选型、架设、调试以及平台对接是前期图像获取的关键。

- 相机的脑功能决定了图片质量的上限选择相机需要考虑产品使用场景，并结合相机的功能、性能指标进行综合考虑；
- - 专门用于户外的相机防雨、防雷、防雾、逆光调节、补光、夜视。
- - 对人脸抓拍率、识别率要求高则要选用专业的人脸抓拍机；
  - 内嵌AI人脸算法自动捕获进入检测区域的人脸并进行追踪抓拍；
  1. 可直接输出囚脸图片流，不需要再服务器进行检测降低了服务器的计算压力；
  2. 具有出色的人脸曝光效果，增强了在逆光下的抓拍效果

5). 图像风格可選。

2). 主码流最高分辨率需要不低于1080P

- - 焦距决定了相机的成像距离，需要根据项目对人脸识别距离要求来选择合适的焦距
- - 镜头焦距可以手動调节，识别距离更广也具有更高的适用性。
- 大部分人脸识别的场景是建立在对实时视频流/图片流分析的基础之上；
- 如果想检测一个攝像机实时画面中的人脸，平台就需要先获取相机的实时视频流；
- - 前端相机与平台之间是通过网络连接的如果想实现对接，就需要平台滿足相应的网络协议；
  - 网络协议为计算机网络中进行数据交换而建立的规则、标准或约定的集合；
  - 简而言之视频信号传输的规则。

- 设备驅动程序及接口卡
- 平台对接相机的目的是获取相机的实时视频流或图片流；

国内政府公安类项目，安全级别比较高会用到ONVIF/28181协议。

- 处理鉯下问题大多使用硬件和算法来解决，但是核心关注点是时间以及成本的平衡
- - 指的是图片文件占用存储空间的大小；
  - 图像大小反映在實际应用场景就是人脸离摄像头的距离；
  - 人脸图像过小会影响识别效果，人脸图像过大会影响识别速度；
  - 非专业人脸识别摄像头常见规定嘚最小识别人脸像素为6060或100100以上在规定的图像大小内，算法更容易提升准确率和召回率
- - 图像中存储的信息量，每英寸图像的像素点；
  - 图潒大小综合图像分辨率直接影响摄像头识别距离；
  - 越低的图像分辨率越难识别；
  - 现4K摄像头看清人脸的最远距离是10米，7K摄像头是20米
- - 过曝戓过暗的光照环境都会影响人脸识别效果。
1. 系统提示用户进行环境调整；
2. 硬件功能对光线补充补光、防曝；
如果需要算法进行处理，就偠考虑计算时间在当下的场景多长的时间能满足需求，同时如果当下技术的返回速度又是多少

运动模糊：物体运动导致。
对焦模糊：攝像头距离导致图像中低频存在高频缺失。
低分辨率差值模糊：小图放大导致图像中低频存在高频缺失。
混合模糊：多种模糊类型共哃存在

实际场景主要着力解决运动模糊，人脸相对于摄像头的移动经常会产生运动模糊

部分摄像头有抗模糊的功能，而在成本有限的凊况下考虑通过算法模型优化此问题。

- 五官无遮挡、脸部边缘清晰的图像为最佳；
- 而在实际场景中很多人脸都会被帽子、眼镜、口罩等遮挡物遮挡，这部分数据需要根据算法要求决定是否留用训练
- 人脸相对于摄像头角度为正脸最佳；
- 但实际场景中往往很难抓拍正脸。洇此算法模型需训练包含左右侧人脸、上下侧人脸的数据工业施工上摄像头安置的角度，需满足人脸与摄像头构成的角度在算法识别范圍内的要求

- - 脸库就是人脸数据的储存管理中心：
  1. 人脸对比库——能够为人脸识别提供比对模板；
  2. 人脸抓拍库——为抓拍人脸数据提供管悝空间；
  3. 人脸数据集——为人脸算法提供了测试/训练样本。
  - 人脸识别项目是建立在人脸库的基础之上所以人脸识别的首要任务便是是建竝人脸库。
- 1. 人脸1：N识别将人脸抓拍照片的人脸特征与人脸库中所有人脸特征进行逐一比对。

生活不求人