未来愿景的:
微软研究院可以算是微软黑科技技术和原型的主要产出部门,当初Office Labs的几部未来愿景概念视频似乎吸引了一批人开始关注微软的黑科技。
先从微软近几年发布的多部瞄准未来10年的愿景视频开始:
2009年微软未来愿景2019
当时的微软商业部门总裁Stephen Elop当时在WBT 09会议上的展示,演示到的技术和概念:
· 实时语言翻译(后来的演示和Skype Translator)、语音识别、机器学习、文化翻译
· X-WAND手势输入交互设备,Sphere球体交互设备,Lucid Touch背面触摸交互技术,PICO PROJECTION投影交互设备(后来还有Mobile Surface)
· 概念:云计算、大数据、物联网、远程协作、跨设备交互、智能环境、可穿戴设备、多屏
2011年微软未来愿景
· 智能眼镜、实时翻译、卡片式移动设备,跨屏幕交互,屏幕手势交互
· 智能办公室、智能酒店、智能家居(智能厨房、智能冰箱)
2013年微软未来愿景
出自微软Envisioning Center之手的新未来愿景视频,展示了Surface使用场景、巨屏沉浸式体验、自然用户界面(NUI)、机器学习技术。
附1999年智能家庭愿景
微软1999年智能家居概念视频,当时微软已经在思考家居互联、联网汽车、在线家庭管理服务、智能门禁、个人语音助理、勿扰模式这些现在才被炒的火热的技术。
微软喜欢展示的:
大屏幕设备
在这几部微软愿景视频中,也包括在微软平时的宣传中,微软始终对巨屏设备和跨屏幕的交互充满兴趣:
• 最早Microsoft Surface是微软2007年宣布的桌面计算设备。推出过Surface 2.0改名为Samsung SUR40 with Microsoft PixelSense,40英寸多点触控屏幕,支持超过50点的同时触控,带简单的对象识别技术。
• Project Gustav:数字绘画板原型项目,给予使用者最接近真实绘画体验,其包含当时世界最先进的自然绘图、混色、笔触算法。
• 2009年,微软展示过“下一代办公交互墙”:互动墙、语音识别技术、虚拟个人助理、远程协作。
• 2012年,微软收购Perceptive Pixel巨屏硬件生产商,有最大82英寸多点触控屏幕销售,“全球最大的真正多点触控配触控笔的显示器,支持同时数百点触控”,他们的技术广泛用于政府、电视台、能源探索、工程及高等教育等领域。
• SmartGlass:俗称“第二屏技术”,通过移动设备来控制Xbox电视屏幕的技术,也可以在移动设备上显示大屏幕的辅助信息。
现实和虚拟混合
现实和虚拟混合的场景中,如果你已经玩腻Kinect游戏,那Kinect相关技术可以感受一下:
• IllumiRoom:将整个房间打造为沉浸式游戏体验(视频),“改变房间的外观,包括可视运动、扩大视野、开启全新的游戏体验”。原理是利用Kinect扫描房间的外观和3D结构,实时渲染新的游戏图像通过投影仪投影出来。
• RoomAlive:IllumiRoom第二代,现在整个房间都是可以交互的空间。
• SurroundWeb:类似于IllumiRoom,可以在任何房间的墙壁和对象表面投影出画面。
• OmniTouch:(视频)通过深度传感器来捕捉用户的操作,配合激光投影来将图形界面投射于物体表面,从而将任何表面变为“可触控”的界面,甚至支持多点触控和多种手势操作。
• MonoFusion通过普通手机或平板电脑摄像头拍摄3D深度图像,比如实现手机上的手势功能,微软还有相似的Depth4Free技术。
• Beamatron渲染不同表面投影图像的技术(IllumiRoom用到)。
• 悬浮图像显示:在空气介质中显示图像,可以用于非接触的手势交互界面,悬浮对象也可以在原表面产生阴影(类似全息投影)。
• Digits佩戴于手腕处的3D空间交互技术。
• Kinect手语翻译。
• 远距离虚拟拥抱:通过将物理交互带至远距离沟通。这里的物理反馈不仅仅是振动或简单物理,微软称还将有“摩擦、触觉、电反馈、电刺激、三维反馈、振动、抖动、物理阻力、温度改变、运动、噪音、压力、表面材质、触控复制等,或者多项结合”。
离我们较近的:Cortana
Cortana背后极大地依赖Bing信息平台的服务和数据,以及微软研究院的技术研究,上述的任务都由一系列不同技术组合完成。Cortana的设计理念是基于“最顶尖的机器学习和数据挖掘算法”,自然语言处理、语义分析、语音技术、Bing Satori知识库和自学习系统等都是其中的核心技术。
具体请阅读此文了解Cortana技术详情。微软的愿景是将Cortana扩展到更多平台、更多领域的信息,更多人机交互方式–在现有的语音、文本之外,还有手势、体感等。对了,微软研究院Project Adam已经可以让Cortana识别狗狗的类型。
Skype Translator
Skype Translator将于今年年底前推出技术预览版。是Skype和微软机器翻译团队联合开发,整合了微软Skype语音和聊天技术、机器翻译技术、神经网络语音识别。其实在2010年相关技术原型已经在内部展示。
Translator Hub平台
微软机器翻译Microsoft Translator已经可以像人类那样习得新的语言或术语,Translator Hub能够构建、训练独特的机器翻译系统,甚至是保护濒临灭绝的语种,比如从11年底开始的苗族语言项目。
Photosynth
Photosynth是微软在2007年宣布的图像3D全景缝合技术,由Blaise Agüera y Arcas负责团队开发。目前已经推出Photosynth 2.0预览版,预览版包括了4种图像缝合模式:旋转、全景、步行、墙面,其中前两者是之前Photosynth支持的图像缝合模式,后两者是新增的模式。
参与过Photosynth项目的成员最近又搞出了将普通视频转换为稳定延时视频的技术:Hyperlapse。
WorldWide Telescope
WorldWide TeleScope是微软研究院在08年推出的宇宙探索项目,包含了TB级的星云、星座、行星等天体的照片数据,宇宙全景照片等图像数据,并且你也可以通过Layerscape在WWT中可视化你的地理相关的大数据,也支持圆顶投影。
Layerscape发展出来的Holograph技术,是一项3D大数据可视化技术,可以将静态或动态的数据3D化后投影到屏幕上,整个界面可交互。
Live Mesh
……
值得一提的是,微软针对Google X实验室开设了微软研究院特别项目组,这个特别项目组的任务是研发“能够让公司和社会受益的颠覆性技术”,涉及的领域有系统、网络、分布式计算、UX设计、设备、云、移动、机器学习/人工智能、大数据和数据中心技术。