再聊聊手机摄像头的AI
夏昆冈 于 2018.06.16 18:46:22 | 源自:www.soomal.com | 版权:原创 | 平均/总评分:09.65/164

我们之前聊过人工智能对手机摄影的影响,但没预料到,AI“普及”之快,令人惊讶。AI是个热门大锅,啥都能装,AI这个AI那个,到了2018年,大陆手机厂商开始给手机摄像头帖AI标签了,AI智慧拍照、 AI 人像、AI美颜、AI摄影大湿、AI梦境虚化、AI场景纷纷登场了。

这其中的部分AI 叉叉我们已经体验过,说实话,不怎么样。它们大部分都是新品装旧酒,基于场景识别调用不同的拍摄参数,基本上是按套路办事,这些工作模式在相机上很早就有,但相机厂商不管这些叫AI。

AI是个好东西,但我们理解的AI不是AI叉叉这样。AI应该是一个极为重要的辅助功能,而不应该喧宾夺主擅作主张。有的所谓AI,蓝天白云草地的场景,一会儿识别成蓝天、一会识别成绿地,然后调用不同的色彩参数,这种AI让人觉得结果不可控,是来添乱的。操控是摄影的乐趣之一,不应该被干扰和打乱,AI应该在悄无声息的起作用,我们认为AI可以在几个方面有所体现。所以,我们再聊聊手机摄像头的AI。

学习和适应用户的拍摄习惯

每个人都有自己的拍摄习惯,例如构图,假设我们喜欢将被摄物体放置于画面的1/3处,而手机通常的默认对焦区域会是中央,如果上手就构图,而不去调整焦点,就会出现对焦到最远处。AI应该记住用户的惯用设置,结合对动体、对用户意图的猜测,去改变焦点的默认位置,而不是中央点优先,或者简单的人脸优先[很多人脸识别算法会在杂草丛中识别出人脸,导致对焦失误]。特色场景下的测光习惯也是可以AI一下的,例如,我们拍佛像时习惯稍欠一点的曝光,AI应该记住,到类似场景时,调出我们喜欢的设置。这些动作不会干扰用户使用,或者干扰用户对结果的判断。

基于神经网络学习的进行深程度的场景识别

在我们体验的某款手机里的AI叉叉时,发现该AI功能只要遇到大片绿色就会识别“绿叶”,遇到放射状的物体可能就识别为“烟花”,错误的识别必将导致调用错误的参数池。

  • 基于神经网络学习的算法,已经可以实现不同程度的读图。例如上图,可以解读成

    • 花卉
      花卉和蜜蜂
      蜜蜂在花朵旁边飞翔
      蜜蜂在珍珠梅旁边飞翔
      蜜蜂在白色的珍珠梅旁边飞翔
      蜜蜂在正在开放的白色珍珠梅旁边飞翔
      阳光下,蜜蜂在正在开放的白色珍珠梅旁边飞翔
      阳光下的珍珠梅花丛,蜜蜂在正在开放的白色珍珠梅旁边飞翔
      阳光下的珍珠梅花丛,蜜蜂在正在开放的白色珍珠梅右侧飞翔,微距场景
      ……

    而现有大部分手机遇到这种场景只会识别到“花卉”这一层的程度。这种程度的读图,即便是读取正确,对于调用策略其实意义有限。有些手机自称能够识别数百个典型场景,但对于混合类型的场景依然识别乏力,例如上图,是判断为“花卉”还是“昆虫”呢?是“晴天”还是“阴天”呢?是不是该启动HDR?

    通过基于神经网络学习的算法提升画质

  • 关于使用神经网络学习的算法来对图像进行降噪的研究,已经有10多年的历史,而这些算法也日渐成熟,引入到手机已经不再遥远。新的降噪算法会建立信号模型,然后“修复”,就像照片修复师那样工作,它的重点是“修复”和重建,修复破损的地方,或者重建细节。而传统的非盲降噪算法,是根据噪声采样去抹除噪声,传统算法的关键动作是“抹除”。手机可以共享庞大的学习库,使用自学习算法来提升画质是可行的。

    新型的降噪算法并非全部,基于神经网络学习,还发展出了抗锯齿、色彩校正等等一系列有关于图像处理的算法。谁优先掌握了这些算法,谁就优先拿到了通向未来的钥匙。这些都可以用于手机的机内处理当中。但现在的不少所谓AI,对画质的影响其实是负面的。现在手机处理器的热点不只是高性能,配备AI处理单元已成为非常时髦的事情,而这些处理单元在会在图像处理时起到大作用,但目前实际上有多少用,不得而知。

    基于云提升交互

    关于这个想法,我们在至少三年前就提出来过。很多人拍照,并不是不热爱,而是不知道如何下手。基于地理信息、气象信息、大数据,我们认为可以改善友好度,提升用户体验,例如走到某景点,会提示该景点的相近时间、天气条件下的优秀摄影作品,以供参考。再例如,在特定的时间点或者气候条件下,进行技巧提示。给菜鸟用户提供指导,而老鸟可以将作品有偿的提供到厂商的公共云。

    以人为本

    暂且不说市面上的AI有多少是真正意义上的AI,但现在已经出现了某些“AI”自我定位模糊的情况。AI是辅助,辅助,辅助,AI要做的是去迎合用户的意图,而不是去取代用户的意图。大部分手机用户,并不太懂得拍照,所以特别适合强行AI一下?给他们用重口的参数,误导他们鲜艳到甚至溢出就是好?我们认为这是不尊重。奔放的加料导致用户预期落空的的AI都是人工智障。这其中涉及到人与机器的关系,机器即便更聪明,但人始终是人,不要无形剥夺人的乐趣权利,激发使用者乐趣才是正确之选。

    请评分
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    119.084.153.***
    119.084.153.***
    发表于2019.08.01 11:03:28
    37
    115.156.142.***
    115.156.142.***
    发表于2019.02.28 19:53:38
    36
    112.096.179.***
    112.096.179.***
    发表于2018.07.10 08:32:15
    35
    180.169.221.***
    180.169.221.***
    发表于2018.07.02 16:23:22
    34
    180.169.***.***
    180.169.***.***
    并不是说鲜艳或者溢出就是好,但绝大多数用户在摄影时都会直观感受到便利程度和画质这两个问题。人不是天生会摄影也不是天生会后期,但要让用户感受到比如全幅的画质、真实的美丽,也必定是在感受过过度的艳丽之后。要让用户放弃手机的便携,去选择沉重的单反;让用户放弃简单AI后期、美图秀秀的一键P图,去花大量的时间学习PS LR,都是有一个长期过程的。从我的角度来看,无论现在的AI发展到什么程度,至少这种AI站在广大用户的角度在做出改变,而现在的单反呢?还守着自己的一亩三分地不愿意改变?自己算一下从按下快门、拔储存卡、导入别的系统(特别IOS多复杂)、打开软件、后期、导出、发帖发朋友圈,要几步?现在的单反厂商,连做个APP,节约导入导出的步骤都不愿意,按下快门就直接显示在手机上,用蓝牙用WIFI传输,这么难吗?
    此帖使用Win10提交
    发表于2018.07.02 16:22:42
    33
    223.073.060.***
    223.073.060.***
    发表于2018.06.24 07:45:31
    31
    03
    30
    042.123.***.***
    042.123.***.***
    没摸过传统相机的估计有95%,如果是单反的话估计一百个里面不到半个人有摸过,真正会玩传统单反的人更应该只有千分之一不到。
    此帖使用MI 5提交
    发表于2018.06.19 20:30:05
    29
    218.089.136.***
    218.089.136.***
    发表于2018.06.19 20:02:07
    28
    03
    27
    211.143.230.***
    211.143.230.***
    发表于2018.06.19 12:03:57
    26
    220.163.112.***
    220.163.112.***
    发表于2018.06.19 10:58:08
    25
    说实话,现在见到的什么这样AI那样AI,都是些20多年前我还上初中的时候就有的过时东西,民用领域目前我压根连带点AI影子或者皮毛的应用都没发现。那么明明看数码多的评论上骂AI的那么多,商家还是乐此不疲的推什么AI呢?这些骂AI的,你们玩抖音吗?玩王者荣耀吗?你们不玩你们,你们都喷,人家怎么用户数量还是那么多还是赚那么多钱呢?
    因为人家本来就不是卖给你们看的。这样举个例子说吧,对于中国70%的人口来说,他们可能从来连一台传统意义上的相机都没摸过,也没碰过电脑,可能第一台能把满足帮他们把照片拍下来的设备就是,手机,而且这个小小的手机居然还可以拍出活动的视频!我靠,居然还可以加上腮红和把脸变瘦!啊,还把照片的背景换成了天安门广场!!这太神奇了!简直不可思议!还有啊,我哼一句歌的调子就可以把歌曲名字给我搜出来!这些都是美国进口的技术吧?这下明白了吗?多先进的AI啊!你们在这扯什么神经网络?类脑计算?别扯了,我的抖音又有新粉丝了。
    发表于2018.06.18 20:56:16
    24
    03
    发表于2018.06.18 08:08:55
    23
    03

    此帖使用Lumia 950提交
    发表于2018.06.17 21:24:53
    22
    123.147.246.***
    123.147.246.***
    发表于2018.06.17 20:11:11
    21
    114.088.056.***
    114.088.056.***
    发表于2018.06.17 14:00:54
    20
    042.123.***.***
    042.123.***.***
    现在厂商不是只吹拍照有人工智能吗!!!真正的智能应该是你看到想拍的,脑袋动一下,手机自动从口袋飞出来,对准景物拍一张!又自动飞回口袋!这特么才叫拍照人工智能!!!别说,这简单玩意钢铁侠斯塔克就研究成功了😁
    此帖使用MI 4LTE提交
    发表于2018.06.17 13:57:38
    19
    042.123.***.***
    042.123.***.***
    人工智能的皮毛都没沾到,就有脸吹人工智能,真想给他手机安两只脚,来!没病走两步试试,智障都会走,连走路都不会还智能!?干脆叫人工智障算了😥
    此帖使用MI 4LTE提交
    发表于2018.06.17 13:50:37
    18
    提示
    本贴不可匿名回复,回复等级为:1 ,您现在正处在潜水状态
    回复
    验证码
    2294 为防止广告机贴垃圾,不得已而为之
    表情
    正文