网易手机讯 7月8日消息,Facebook似乎具有先见之明,几年前就要研究视频捕捉技术。日前,这项专利获得批准,有望让Instagram从中获益,使其视频“能看会听”。
根据Facebook最近申请的专利获悉,通过用户手机的麦克风进行的面部识别、地标检测,甚至声音提示,可以让智能的Instagram为用户提供迷你电影的封面,甚至是视频的标签。这项高科技技术已经可以为每个人播放适应其需求的视频,并且,悄无声息地向前迈了一步,从而在几乎饱和的照片应用海洋中脱颖而出。
在一个月前我第一次注意到这些专利,但却很难想象它们将派什么用场。此前,Facebook没有太关注在自己的应用程序中录制视频。专利中描述了为用户拍摄的视频选择封面的技术——这是Facebook的摄像头不具备的功能——以及如何尽可能地利用每一种感应功能帮助用户做出上述选择。专利的整体内容看上去有些模糊不清。
但新近推出的Instagram视频却使专利描述清晰了许多。
封面的重要性
在Instagram拍摄视频之后,用户可以用手指在时间轴上滚动,为视频选择缩略图。在发布过程中,这个过程耗时很长,使得Instagram的视频运行速度看上去比Vine要缓慢得多。
虽然为视频选择封面的动作似乎平凡无奇或相当令人烦恼,但却非常重要。相对照片而言,制作视频是一项更大的投资。用户既可以像以往以往在Instagram上快速浏览,也可以慢慢饱享眼福。制作视频,能够让你过一把导演瘾。观看视频则是一项时间投资,但在手机上,如果视频内容枯燥无聊的话,即使只有15秒,也会令人难以忍受。
如何保证观众的时间物有所值,唯一的线索是作者的声誉、视频描述和封面。
并非所有视频都可以在播放中途暂停、退出,因为在Facebook上,每一段视频都被设定为观看15帧之后,才能取消播放,转到下一段视频。而且,没有任何信息告诉你哪一段视频是最好的,第一帧图片被自动设定为视频封面。
但是,有了这些专利,Facebook和Instagram就可以将用户视频中最有趣的时刻检选出来,根据其中的人物和事件,向用户推荐视频标签,或者可以作为封面的视频图片。
Instagram可以看到你的微笑,听到你的笑声
这项专利是在2011年10月由Facebook及其雇员安德鲁“博兹”·博斯沃思(Andrew “Boz” Bosworth)、大卫·加西亚(David Garcia)和索里奥·奎尔沃(Soleio Cuervo)提交、2013年4月获批的。专利的名称是“基于社交元素和身份识别的自动图片捕捉技术”,首选图像是从捕捉到的视频序列中获取的,图像选择是在社交元素基础上捕捉的视频序列图像。
从本质上讲,该专利所描述的技术是将视频的每一帧视作一张照片。检测算法可以通过对面部和模式的识别,对人、文字、品牌和标志性建筑加以识别。
“图像捕获过程能够分析视频序列的每一帧图像,识别出……地点(例如艾菲尔铁塔、金门大桥、优胜美地国家公园、好莱坞)、企业或组织(例如一间咖啡厅、旧金山巨人队),或一个品牌或产品(例如可口可乐、路易·威登)。”
这可以让Facebook在一段视频中向用户提供人物、地点和品牌的正规标签建议,或只是静静地记录这些信息,然后将它们添加到观看者的视频新闻提要中。例如,视频可以显示周围的人所喜欢的地点或品牌,或者在视频中出现的朋友是谁。虽然Instagram使用的是过滤过的信息,但它最近增加了一个标签系统,可以对这种检测结果加以利用。
同样的信息也可以被用于封面推荐,用户很可能将一些最有特点的人物或著名地点作为视频的封面。该专利也勾勒出通过良好的照明或对比度检测、甚至探测用户的面部表情来挑选最佳图像的方法。如果此时此刻你正与一群朋友坐在沙发上,Instagram很可能会推荐一张集体聚会照片作为视频封面。该专利还描述了使用手机的加速度传感器抓取一张静止、稳定的图像,而非模糊的图片,作成视频封面。
不过,最让我兴奋的,是麦克风在确定视频最有趣时刻中的潜在用途:
“图像的选择过程可以分析声音元素内容,可通过使用语音识别算法(例如,“说奶酪!”,“奶酪!”,“太美了!”,“好神奇啊!”)确定视频片段的重要性。
这意味着当你的相机镜头悬停在美丽的夕阳、天际或微笑之上时,Instagram可能“听到”你喜悦的喊声,然后可以很容易地选择这部分视频作为封面。
随着社交视频应用程序Instagram、Vine和其他对手之间的竞争愈演愈烈,类似的重大技术将成为一个决胜的重要因素。在发布之前,这些应用程序需要尽可能保持低调,因为额外的功能和编辑工具虽然可能吸引用户的注意,也会招致开发商的跟风,最终可能扭转战局。
对Instagram来说,幸运的是其母公司Facebook已经花了几年时间用于构思如何顺利地进行媒体捕捉和分享经验。博兹、加西亚和索里奥似乎有先见之明,意识到录制视频终将像拍摄照片一样轻而易举。如果这项专利确实能够应用于Instagram,那么,耗时的视频制作将变得更加容易,我们将会实实在在地捕捉到朋友们欢聚的时刻。(斯眉)