搜索视频的"内心"
Sent to you by forcode via Google Reader:
搜索视频的"内心"
找到被忽略的"猫"
即使是一段时长仅为五分钟的视频,也可能包含着诸多内容,比如,山水场景、人物对话,甚至还有一只卧在角落里的猫。如果这段视频的主题跟这只猫毫无相干,那么它肯定不会被人工编辑在这个视频文件的名称及说明当中。也就是说,在以文字为索引的视频搜索引擎中,是不可能搜到这只猫的。当然,很多类似的细节信息也都被"遗忘"了。
与文字和图片相比,视频作为一个图文、声音集合的时间序列,对搜索技术的要求更高。在目前的市场上,大部分视频搜索引擎所采用的几乎都是文本索引方式。那么,有没有更好的方法,让我们能够搜索到更多的细节呢?微软亚洲研究院研究员华先胜介绍了一种能够真正"搜索到视频里面去"的索引方式。
这种基于"内容"的索引方式,会首先教搜索引擎"认识"一只猫的形象,并把其"翻译"为文本,以此建立索引。这样,当某个视频文件内出现猫时,它便能够自动识别。与此类似的,想要搜索一场体育比赛中的某个环节,也可以轻松实现。比如,如果要搜索棒球比赛中的"投球"(pitch view)动作,即把"球从投球区投给击球手"的一幕,通常视频的文字不会细致到描述这一动作,而通过这种内容索引的方式则可以准确查到。
内容索引作为文字索引的有效补充,可以使搜索引擎实现更为精确的查询。而上述这些操作有个前提,即需要人为地设定一些训练数据,让搜索引擎进行"学习",也就是说,要让其"知道"什么场景才是"投球"。据微软的专家介绍,未来将可能完全脱离训练数据,让搜索引擎直接通过网络进行智能学习。
剪辑式呈现
当你得到搜索引擎列出的一大堆杂乱无章的结果后,另一个问题出现了:"究竟哪个才是我想要的?"在实现了精确的查找后,未来的视频搜索引擎要做的另一件事情就是良好的呈现----要让用户快速地了解一段视频完整的内容。
现实中,你在使用视频搜索时往往会碰到这样的情况,明明搜索的是"足球(Soccer)",但除了你想要的一些精彩比赛片段外,系统可能还列出了有周星驰的《少林足球》,甚至是"小贝"的娱乐视频新闻。针对这种情况,微软亚洲研究院在搜索结果中实现了类别细分的功能,可以按照时长(duration)、类型(genre)、格式(format)等分类标准进行过滤。每个标准下包含几个细分的类别,比如,选择"类型"后,可以按照"体育"、"电影"、"新闻"等类别细分。这样一来,杂乱的结果就变得清晰了。
由于网上的很多视频是基于HTTP协议的,这意味着每播放一次视频,都要重新下载、从头播放,即只能顺序播放,无法实现跳转。
而微软亚洲研究院目前有一项技术可以实现HTTP下的自由跳转。据华先胜研究员介绍,视频呈现中的关键点是视频摘要技术,目前微软亚洲研究院共研究出了5种视频搜索结果呈现方式,不仅能够动态定位到关键字所在的那一关键帧,而且能让你在该页面下进行10至30秒的播放预览。其中,有一种列表呈现方式,除了提供一个"动态略缩图"外,还像DVD的播前浏览功能那样,把每个视频分为可独立播放的五个章节。这样一来,用户就可以大致了解这个视频文件的内容了。而使用该技术所提供的可伸缩呈现方式,则可以实现个性化的片断细分,比如,当你选择按"×4"方式呈现时,原视频即被分为32个剪辑片断呈现出来。
这并不是全部。这种未来的搜索引擎还加入了Web2.0元素--用户可以对一段视频中的某(几)段剪辑,建立个性化注释标签(Tag),并可收藏及分享。这种功能将大幅改善现有视频共享社区的用户体验、增加用户粘性。
改良版视频广告
"锵锵三人行,广告之后见。"观众们总是很想知道,说完这句话后,窦文涛和嘉宾们到底聊了些什么----电视台是严格按照时间来插播广告的,即当节目播到一个固定的时间点,就要插播广告,而且其内容是面向所有用户的,不一定与节目直接相关。
互联网为视频广告提供了更为灵活、个性化的条件。作为最主要的盈利手段,它将直接影响在线视频的发展。但由于受到技术发展的限制,目前市场上的产品还只能做到在一段视频的头、尾位置插入广告,无法做到与视频内容相匹配、智能插入。
为此,微软亚洲研究院正在研发一种结合搜索的视频广告平台,可以突破现有的按时间插入的广告模式,从用户体验和广告主利益两个角度出发,实时地在一段视频内容中合适的位置处插播合适的广告。此外,视频广告在环绕文字及场景替换方面也有待进一步的研究。
Things you can do from here:
- Visit the original item on 微软亚洲研究院
- Subscribe to 微软亚洲研究院 using Google Reader
- Get started using Google Reader to easily keep up with all your favorite sites
标签: 新技术
0 条评论:
发表评论
订阅 博文评论 [Atom]
<< 主页
============================================================
格兰仕微波炉报价单 英语六级历年真题听力下载 大陆身份证生成器
東方神起的所有反轉劇!!.[含东方剧场](會繼續更新以後的)(已可覲看)
电视剧《靠近你温暖我》全集下载(BT/迅雷/电驴/剧照)
精彩的洞庭湖人鼠大战(4视频+forcode点评)
一百多个电影字幕下载网站,精心收集整理!
(视频)(CCTV10“走进科学”-科幻之旅专题-克隆人 8.14)
国外BT站点和BT种子搜索站(国外完整bt搜索列表)
============================================================
forcode科幻小说《抽水马桶的秘密》正在起点中文网连载
《抽水马桶的秘密》读者评论:
(1)你的书很好看,比大刘,王晋康的创意好太多了,努力吧将来出实体书我一定会买的。(2)很有想象力的作者啊!!估计是看了不少科幻小说的人,希望不要浪费你非凡的想象力。 (3) 读者在自己博客或论坛对《抽水马桶的秘密》的评论。(4)点击此处查看全部的读者评论(18页,1000条以上)。
《抽水马桶的秘密》相关帖子:
《远程面包机》提纲|| 《进化论危机》提纲大家一起来设计
抽水马桶是外星人的试管|| 读者推荐超一万票
《抽水马桶的秘密》内容简介:
地球哺乳界正在发生的一次大规模跨物种升级,DNA机制并非人们所想像的那样是决定生命的最终遗传载体,而是类似浏览器这样的转译机制,真正的遗传物质存储在弥漫整个宇宙的光子数据库中,DNA机制实际上是一种设定了进化路径的文明压缩包的解压机制,数十亿年前灭绝的三栖人发明了光子数据库和DNA机制,目的是为了让这个机制最终复活三栖人文明,而人类(裸猿)这一物种在三栖人社会里其实是一种宠物,但是DNA机制似乎出现了点问题,或者说不知道什么原因裸猿突然变得太过聪明了,在播撒了始祖菌(DNA种子)的所有星球,进化路径发展到裸猿阶段,并没有继续演化出最后一步:三栖人,而强大的光子数据库一旦意识到DNA进化机制的这个漏洞,立刻关闭了这些星球对光子数据库的访问权限,这样,这些星球的生态系统都面临着灭绝的危险,因为他们脱离了光子数据库的遗传支持再也无法自然繁殖,只能靠遗传工程来复制现有的基因,或者做些小打小闹的修改,整个宇宙各星球上的基于DNA机制的生态系统都面临崩溃的危险。最终在13世纪,裸猿一族在银河边缘一个不起眼的小星系发现了地球这个由于某种原因至今还刚进化到裸猿初级阶段的星球,为了催熟地球的进化速度,外星裸猿文明开始介入地球的发展,为了防止光子数据库察觉到非地球文明的介入并关闭地球的权限,这种介入始终是暗中进行,因为介入方式的分歧,银河系裸猿文明分裂为两大集团,这两大集团的争斗伴随着人类近现代的发展,于是,文艺复兴开始了、三次科技革命出现了、两次世界大战也来了,直到今天,地球人类为自己的技术进步而沾沾自喜,丝毫不知道技术迅速发展的真正原因以及潜藏的危机。
============================================================
forcode2003年以前的习作:未来的婚姻、远程面包机
forcode朗诵《蜀道难》||forcode的一百多个科幻构思
奇想录:最新奇有趣的新技术和新闻点评|| 订阅“奇想录”