边策 乾明 李根 发自 凹非寺
量子位 报道 | 公众号 QbitAI
不忘初心,AI前行。技术愈精,情怀越高。
刚刚,Google I/O 2019大会开幕。
2小时主题演讲,全球AI第一大厂秀出最新黑科技进展,并且情怀依然满分,Google用行动诠释科技向善。
今年大会演讲主题:Keep making magic.
究竟Google的最新黑科技魔法有哪些?量子位带你一文打尽。
开场:不忘初心
大会开始,Google CEO桑达·皮猜在一片欢呼中微笑登场。
劈柴哥说今年Google I/O,视觉能力与众不同,比如观看方式加入了AR体验,通过手机,利用一个App就能身临其境、解答一切。
而且别看事情小,背后驱动是Google的初心和使命:整合全球信息,使人人都能访问并从中受益。
Our mission is to organize the world’s information and make it universally accessible and useful.
劈柴哥强调,正是这样的使命,让代代Google人推出更好的产品,帮用户更高效,让用户更快乐,要做更有用的Google.
一切自然离不开AI。
AI视觉成新入口
Google CEO先从去年推出的谷歌信息流说起,虽然这还遭到李彦宏感慨——谷歌学师百度,但劈柴哥解释,希望能在准确搜索之后,进一步让用户更完整了解世界。
背后都是机器学习、AR和AI等前沿黑科技。
比如你Google一下搜索黑洞,Google AI就能给你推荐相关新闻,包括给出一条完整的信息流时间线,展示黑洞是如何被发现的。
这其中,Google还解锁了越来越多视觉能力,让用户想要的信息更直观准确呈现。
比如利用AR视觉能力,搜索不仅准确提供结果,还能360°全面了解。
你想买一双鞋:
或者小朋友想了解大白鲨:
那有没有可能是看到一张图片,也想知道更多相关信息?
谷歌说Google Lens——智能拍照\图搜应用,为此而生。而且不是拍照识别那么简单。
现在Google Lens还能做更多。
拍菜单,自动显示大众点评高赞菜,拍小票,自动计算金额和小费。
Google Lens只是入口,还结合了诸多其他Google App的能力。
比如地图、翻译、大众点评……一个入口背后,集齐谷歌全家桶能力。
那如果大字不识一个,能不能享受到AI福祉?
Google拿出第一个情怀大满足案例。
用Google Go就可以了。
现场举例,在印度,文盲大姐姐通过Google Go,即便大字不识一个,还只能说印地语,也能手机拍照,然后让手机自动朗读出来,用智能手机了解想要了解的一切——无论线上还是线下。
目前,Google Go已经包含印地语、中文在内的10多种语言。
谷歌团队将Google Go整个大小控制在100kb以下,35美元价位(200元)的手机,有摄像头就能使用。
真正做到用得起、用得好,一款Google Go在手,世界说走就走。
毫无疑问,现场掌声和欢呼声一片。
AI语音助手更全能
视觉之外,就是AI在语音语言方面的能力。
劈柴哥先从Duplex说起。
去年,Google推出了震惊四方的打电话AI系统Duplex,并在一年内实现了全美40多个州商用。
今年Google会把这项功能扩展到网络上,叫做Duplex on the web,帮你租车、预订电影票和餐厅座位。
比如你想租车,用Duplex打开租车公司的网站,这个AI就能代替你填写所有必要信息。在提交订单之前,人类只需要核对一下信息点击即可。
Duplex还可以理解日历行程信息、Gmail邮件内容,自动在填写订单时补全信息。
怎么说呢,虽已过当红阶段,但Duplex变得更强更务实。
而Duplex之源——Google AI助理Google Assistant也有大进展。
Google宣布升级AI语音助手,并把语音交互能力完全放入手机。
优秀到什么程度?
整个过程完全不用上手,也不需要反复用唤醒词,语音交互就能实现对手机的全过程操控。
更厉害的是语音识别速度保持在1秒以内,比用手更快。
现场小姐姐的演示,搞得人心激动。
Google解释,之所以如此流畅,是因为他们谷歌数据中心的语音识别模型“塞进了口袋”,原本100GB模型被压缩到0.5GB,使得集成到手机中成为可能。
而且,更小的模型还降低了网络延迟,交互速度提升10倍。
值得一提的是,Google的语音助手,还能跨App操作、完成任务,比Siri不知高到哪去了。
现场举例,如果你正在和朋友聊天,突然想发送一张过去旅游的照片,你只需要告诉它你照片是在哪拍的、里面有什么内容,AI助手就能把照片直接发送过去。
只可惜,Google的AI语音助手,Google的这个福音技术,只能在Google“亲儿子”——Pixel手机上使用。
当然,依然是AI语音语言能力,还有技术牛X,情怀满分的新能力。
Google AI可以给任何视频加字幕。
之前,YouTube视频即使上传者没有给字幕,也能通过自动识别添加实时字幕。
现在Google把这个能力带到了任何视频中——需要强调的是手机终端,没联网也OK.
无论是相册中自己拍的视频、网页中的视频、聊天视频,统统能加上字幕,以后再也不怕地铁上看剧听不清对话了。
但如果只把技术用到这一步,Google就不会是那个人类希望了。
Google这次展示了Live Relay的技术,用语音识别和TTS,帮助聋哑人士接电话。
比如打进来的声音,转化成文字,然后让聋哑人可以像回复短信一样接电话,输入的文字会实时转写、自动变成语音发出去。
更贴心的是,Live Relay还利用了Google智能预测和回复功能。对打字内容做出预测。
不要担心打字速度跟不上语音,一切实时甚至“提前”进行,转写质量也很高,打字速度能跟上语音通话的速度。
现场都被Google的情怀填满了。
这项技术也被叫作:不开口就能打电话。
聋哑人群体能更好享受智能手机和AI的便利了。
安卓10:离线实时转写速记
接下来是最新安卓版本:Android Q.
Google先披露了最新成绩单,目前安卓设备已经突破25亿——全球60亿人,每4个就有1个使用安卓设备。
然后开始谈安卓往何处去。
首先是大热的折叠屏带来的影响。
折叠屏带来不一样的内容展示方式,也带来了更便捷的多任务处理。
所以Google认定折叠屏是趋势,对于折叠屏的准备,今年就会在安卓系统中体现。
其次是5G。
可以明确的是,今年就会有5G的安卓手机商用。
5G能带来什么?带来更快的网速。
也让更多AI能力可以实时发挥作用。
比如刚才说到的视频实时字幕,背后核心是AI语音识别转写。
但!是!Google放出大招,即便不联网,现在也能在最新安卓系统中实现实时语音转写。
因为Google团队把AI模型训练到了最小最高效,手机算力,手机数据,就能在手机本身实现这项AI能力。
接下来就是越来越受用户关注的隐私数据。
这次 Google 将会对系统的安全策略做进一步的调整:比如在文档管理中加入加密功能、控制 App调取系统摄像头 / 麦克风的访问权限,以及防止App在后台随意获取用户位置等等。
在新系统中,用户可针对每个App所获得的权限进行调整,从而不让软件供应商通过App获取用户隐私信息。
除此以外,跟此前Android Q的测试版体验差不多,系统的设计和交互也有新变化:
比如,加入全局“黑暗模式”、新增 WiFi 分享功能、新增支持录屏及“桌面模式”、优化Pixel的线性马达效果,优化系统手势交互……
虽然是安卓系统首次加入,但不得不说,中国手机厂商在此之前,就已经基于老安卓版本,实现了很多类似功能。
中国手机厂商的微创新,不得不服。
Pixel手机:单摄AI吊打苹果
新系统,但没有新旗舰手机,推出小迭代版本:Pixel 3a和Pixel 3a XL.
开门见山,Google大方承认,Pixel手机价格太贵,所以需要两款中端手机——Pixel 3a和Pixel 3a XL来帮谷歌提升销量。
Pixel 3a提供三种颜色:黑色、白色、有点紫(比灭霸的紫色稍淡),保留了3.5mm耳机接口。
Pixel 3a依旧是天生骄傲,用AI和算法硬件劣势,依然保持祖传前后单摄像头,都可以提供背景虚化的人像模式。
现场展示照片,单摄的Google手机,夜景成像吊打双摄的iPhone X。
Pixel 3a定位中端旗舰,依然传承谷歌“买软件送硬件”传统,承诺连续3年的软件和安全更新。
更炫酷的AI能力也别放到手机里。
Pixel 3a现在能过滤骚扰电话,地图AR结合街景导航,比看地图箭头更直观。
Google还把智能手机做到了AI智能和功能机功能的完美结合。
Pixel 3a一次充电,可以使用30小时,充电15分钟,可以用7个小时。
但是Pixel 3a的价格可是一点不中端,起售价399美元(约2700元),搭载骁龙670处理器、4GB内存、3000mAh电池。
2700元?能买2台同样配置的国产手机了。
难怪谷歌不好意思在发布会上公布参数详情,不去官网查看是不知道滴。
更好笑的是,刚才说好的Pixel 3a XL,直接被跳过了。
Google官网显示,Pixel 3a XL售价479美元起,除了屏幕大一点,没有其他区别。
智能音箱炫出手势识别
手机之后,来到智能家居环节,智能音箱为核心。
现在,Google把智能音箱划入了Alphabet旗下智能家居和物联网公司——Nest.
Google先祭出新时代的AI硬件产品打造理念:
AI 软件 硬件。
其次,带来新发布:
带屏智能音箱。
之前叫Google Hub,现在改叫Nest Hub。
一个背后加了音箱的平板电脑。
大小也都能选,全家桶系列。
当然,带屏带摄像头,还加入了AI刷脸的能力。
一个带屏智能音箱全家用,但刷你脸的时候,就只提醒你的信息,比如你的行程、提醒等。千人千面。
另外,Google软件的能力也被集成其中。
打电话、谷歌相册,以及YouTube节目。
也有黑科技,比如手势识别:
一个手势,就能在你想要的时候达到目的。
具体售价:
Nest Hub售价129美元——866元。
Nest Hub Max售价229美元——1537元。
怎么说呢?幸好不在中国卖,不然能被中国智造的价格战杀得片甲不留。(手动狗头)
Jeff Dean压轴介绍AI向善
最后,Google AI大总管Jeff Dean压轴登场。
他先回顾了今年来Google在NLP领域取得的最亮眼成就——BERT模型。
然后自然是姐夫的亲儿子TensorFlow,并且强调运用TensorFlow取得的新成就。
依然情怀满满,向善优先。
比如最新在医疗AI推进方面,现在可以筛查早期肺癌,初步取得的准确率,可以给40%的早期患者提高生存率。
另外还有AI预测洪水。
Jeff Dean说在印度,洪水依然是威胁民众生命和财产安全的主要灾害,但通过TensorFlow,就能实现洪水的预测,还能更好规划排水渠道,最大限度降低洪水危害。
这也是Google一直以来提倡AI for social Good的理念成果。
Jeff公布了谷歌半年前围绕“AI向善”展开的2500万美元公益投资成果。这项名为“Impact Challenge”的挑战赛,吸引了全世界各行各业的人才,这次姐夫专门提到了印度和乌干达等地区的团队。
Jeff总结,挑战赛自去年10月份上线以来,一共吸引了全球119个国家的公司、组织参与其中,已收到2,600多份申请,希望这会是一个好的开始。
希望Google能从整合全球信息的初心使命出发,借助AI,对用户更有用有益,做一个更有用的Google.
进而,Jeff Dean在此处宣布Google I/O 2019大会主题演讲结束。
场内场外,都觉得这一结束来得过于仓促。
但,可能也有个不成熟的外界猜测——Google高管也忙着看欧冠半决赛。
其实劈柴哥刚登场,就提到了今天有利物浦和巴塞罗那的欧冠比赛,希望不要耽搁大家。
结果,Google I/O大会演讲在开赛前掐表结束。
于是换台看球的球迷最新反馈:见证了一场奇迹般的绝地逆转。利物浦落后3球情况下完成4球反击,淘汰了梅西坐镇的宇宙巴萨。
所以是不是Google的AI提前预测到了?
— 完 —
诚挚招聘
量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技术和产品新动态
google同步方法(一文看尽GoogleIO)
2024-11-21 05:13:34 作者:球颓道 网址:https://m.xinb2b.cn/know/vfs426528.html
- 退火车票要身份证吗(来了解一下)
- 2024-11-22来了解一下旅客本人办理退票手续时,须凭购票时提供的有效身份证原件办理退票,对于身份证原件丢失的,可到车站公安制证处开具临时有效身份证明后办理退票旅客为他人办理退票手续时,须凭乘车人的有效身份证原件,如果没有乘车。
- 口袋妖怪3d游戏(虚幻引擎重制口袋妖怪3D的小镇显得栩栩如生)
- 2024-11-22虚幻引擎重制口袋妖怪3D的小镇显得栩栩如生YouTube用户“FireDragon04”近日与我们分享了一段有趣的视频:他用虚幻引擎重制了《口袋妖怪》中的Pallet小镇“FireDragon04”重制内容的灵感来自于《口袋妖怪火红/叶绿》,。
- 减肥早上可以吃蛋黄么(减肥期间早上能不能吃蛋黄)
- 2024-11-22减肥期间早上能不能吃蛋黄蛋黄完全可以吃,也建议吃蛋黄,因为蛋黄中的营养比蛋清更加丰富,虽然脂肪和胆固醇比较高,被大家所抗拒,但是每天1-2个蛋黄是没问题的,如果蛋白质摄入不足,可以格外增加蛋清的量,比如很多健身的人就会吃大量。
- 湖州市附近的旅游景点推荐(天堂湖州5大景点美不胜收)
- 2024-11-22天堂湖州5大景点美不胜收“天堂”湖州,5大景点美不胜收,第一个就想出发浙江这个城市有山有水有古镇有竹海美若仙境天堂城市!标准:中国浙江旅游、城市旅游地理、浙江湖州、莫干山南浔太湖安吉竹海、旅游景点推荐介绍最近的天气越来越晴朗。
- 杭州机场t4航站楼登机流程(在杭州机场T4航站楼如何托行李)
- 2024-11-22在杭州机场T4航站楼如何托行李钱江晚报·小时新闻记者孙燕“零高差”行李托运,智慧安检,智慧登机……杭州机场T4航站楼9月8日开启试运营,众多智慧设施令人耳目一新,具体有哪些?一起来了解一下吧!位置:自助值机设备这是自助值机设备,旅。
- 小学汉语拼音发音(最全小学拼音发音法)
- 2024-11-22最全小学拼音发音法汉语拼音字母表汉语拼音发音方法01ɑ、o、e发音方法发ɑ时,嘴张大,舌位最低,舌面中部微微隆起,声带颤动发o时,舌头略向后缩,舌面后部隆起,口微开,嘴唇拢圆发e时的口腔大小、舌位高低与o大体相同,只是。
- 红色安全帽的历史意义(红色安全帽是什么职位)
- 2024-11-22红色安全帽是什么职位红色安全帽:一般是由施工单位项目部的管理人员佩戴,比如说技术员、施工员、安全员、项目技术负责人、项目经理等,甲方或来访嘉宾偶尔也会佩戴因此,戴红色安全帽的人员相对比较复杂,不过一般可以分为两类:技术人。
- 怎么养玉树才能开花(养了3年的玉树开花了)
- 2024-11-22养了3年的玉树开花了有很多植物不爱开花,可能你养个十年、二十年也不见得有花,比如玉树,一直都听说玉树不太容易开花,结果三年前买的玉树,养到今年过年,居然开花了,运气很不错呢~有很多人都不知道玉树也可以开花,它的花朵小小的。
- 美国签证商务签证是什么样的(申请美国商务签证的流程是什么)
- 2024-11-22申请美国商务签证的流程是什么伴随着全球经济化,各国之间联系愈发紧密,合资企业纷纷冒头,力求合作共赢近年来虽然中美之间贸易关系紧张,但这不妨碍中美企业或是中方企业赴美参加各种商业交流,商务上的往来可以促进更好的经济发展,这也是两国。
- 印度电影和美国电影(印度电影与印度少年)
- 2024-11-22印度电影与印度少年一路向西——前往印度项目现场服务见闻(六)来印度之前,我对印度的印象是停留在少年时期看《大篷车》、《奴里》、《流浪者》、《哑女》这些电影里的画面当时这些电影让我感觉印度人,不管男的还是女的,都会唱歌跳。
- jbl5.1声音调试(RedmiK40游戏增强版)
- 2024-11-22RedmiK40游戏增强版IT之家5月3日消息RedmiK40游戏增强版手机于4月27日正式发布这款产品搭载联发科天玑1200处理器,配备120HzOLED屏幕、X轴线性马达,为游戏设计了两个弹出式肩键此款手机搭载与JBL合作。
- 手机恢复出厂设置哪些数据会删除(旧手机恢复出厂设置就彻底删除信息了)
- 2024-11-22旧手机恢复出厂设置就彻底删除信息了淘汰旧手机要如何安全处理?网络兼职存在哪些陷阱?快递单如何正确处理……为提升广大群众的网络安全防范意识和技能,引导群众遵守国家网络安全法律法规,共同营造安全、健康、文明的网络环境,9月20日,成都市总。