jiuyou.com-谷歌I/O开发者大会精彩回顾:AI与Android 15亮点纷呈
日期:2026-05-16

【JIUYOU科技】北京时间5月15日凌晨1点,备受瞩目的googleI/O开发者年夜会于加利福利亚州山景城的海岸线圆形戏院昌大揭幕。本次年夜会由Alphabet首席履行官桑达尔·皮查伊 (Sundar Pichai) 领衔的主题演讲拉开序幕,聚焦了人工智能范畴的最新进展。此中,备受期待的Android 15体系也于这次年夜会上有所说起。

谷歌I/O开发者大会精彩回顾:AI与Android 15亮点纷呈

因为年夜会的举办时间较早,很多伴侣可能因时差而未能及时不雅看。不外,接下来,JIUYOU将为各人具体梳理并先容本次googleI/O年夜会的亮点内容,让你不错过任何主要信息。

Gemini 1.5 Pro年夜模子

此前,google推出的Gemini 1.5 Pro作为一款中型多模态模子,依附其强盛的处置惩罚能力及多模态交互功效,已经经于全世界规模内引起了广泛的存眷。这一模子不仅于文本处置惩罚方面体现精彩,还有可以或许处置惩罚图象及视频等多种数据格局,为用户提供了富厚多样的交互体验。

谷歌I/O开发者大会精彩回顾:AI与Android 15亮点纷呈

而于这次开发者年夜会上,皮查伊公布了关在Gemini 1.5 Pro的庞大更新。起首,google将Gemini 1.5 Pro的上下文长度从原本的100万tokens晋升到了200万tokens,这一进级将极年夜地加强其数据处置惩罚能力,使患上模子于处置惩罚越发繁杂及重大的数据时越发游刃有余。同时,google还有公布Gemini 1.5 Pro将周全撑持Workspace。

此外,google公布将Gemini 1.5 Pro面向全世界开发者开放。这象征着,不管是专业的开发职员还有是业余的喜好者,均可以越发深切地相识及利用这一强盛的模子。

进级后的Gemini 1.5 Pro于多项大众基准测试中取患了显著改良,尤其是于图象及视频理解方面,它揭示出了开始进的机能。这一模子不仅可以或许理解文本内容,还有可以或许正确地解读图象及视频中的信息。

Gemini 1.5 Flash模子

为了满意市场对于低延迟及低成本的火急需求,google也推出了Gemini 1.5 Flash模子。这款模子于成本上取患了显著的冲破,定位在Gemini 1.5 Pro及Gemini 1.5 Nano之间,重要面向泛博开发者群体。

谷歌I/O开发者大会精彩回顾:AI与Android 15亮点纷呈

于订价计谋上,Gemini 1.5 Flash的订价极其亲平易近,每一处置惩罚100万个token仅需35美分,相较在GPT-4o的每一百万token 5美元的价格,这一价格上风不问可知。而针对于寻求高质量内容的用户,Gemini 1.5 Pro则提供了更为邃密的办事,其订价为每一百万tokens 7美元。

googleDeepMind首席履行官德米斯·哈萨比斯于博客文章中具体论述了Gemini 1.5 Flash的特征及运用场景。他暗示,Flash模子于择要天生、谈天运用、图象及视频字幕、以和从长文档及表格中提取数据等方面体现精彩,为开发者提供了强盛的撑持。

哈萨比斯进一步注释道,google推出Gemini 1.5 Flash的初志于在满意开发者对于在更轻巧、更经济模子的火急需求。

下一代开源模子Ge妹妹a 2

google暗示,全新Ge妹妹a 2模子是一款轻量级、前沿的开放式模子,继续了Gemini模子的研究及技能精髓。

谷歌I/O开发者大会精彩回顾:AI与Android 15亮点纷呈

Ge妹妹a 2模子采用了全新的架构,其27B(270亿)参数巨细的尺寸于连结卓着机能的同时,仅为Llama 3 70B模子的一半巨细,揭示了冲破性的机能及效率。这一设计不仅提高了模子的矫捷性及顺应性,也为其于各类运用场景中的部署提供了更多可能性。

为了降低部署成本,Ge妹妹a 2模子的高效设计使其所需的计较量少在同类模子的一半。颠末优化的27B模子可以或许于英伟达的GPU上流利运行,同时也于Vertex AI中的单个TPU主机上揭示出高效的机能,使更广泛的用户可以或许轻松部署并享受成本效益。

此外,Ge妹妹a 2模子还有为开发职员提供了强盛的调优功效,撑持超过差别平台及东西生态体系的运用。从基在云的解决方案(如Google Cloud)到风行的社区东西(如Axolotl),微调Ge妹妹a 2模子将变患上越发简朴及高效。

google暗示,全新Ge妹妹a 2模子将于将来几周内正式公然上线及发布。

Google搜刮

已往一年,Google搜刮以其卓着的搜刮天生体验回覆了数十亿次查询。如今,搜刮体验再次进级,用户可以或许以更为天然、直不雅的方式摸索收集,提出新奇、长而繁杂的查询,甚至借助照片找到所需信息。

谷歌I/O开发者大会精彩回顾:AI与Android 15亮点纷呈

google行将推出的Ask Photos功效,将照片搜刮带入了一个全新的维度。自从Google Photos九年前问世以来,用户逐日上传的照片及视频数目已经冲破60亿张。这一巨年夜数字注解,人们热中在经由过程照片往返顾及搜刮本身的糊口点滴。而Gemini技能的引入,无疑让这一切变患上越发轻松高效。

假想一下,当你于泊车场预备付款,却忽然健忘了本身的车商标码。以往,你可能需要于海量照片中搜刮要害词,并破费年夜量时间阅读已往几年的照片来寻觅谜底。但此刻,有了Ask Photos功效,你只需要简朴地扣问照片,它就能迅速为你找到谜底。

本年炎天,google将正式推出Ask Photos功效,并规划于将来推出更多立异功效。

通用AI——Project Astra

于这次年夜会上,最受存眷的无疑是AI助手——Project Astra。Project Astra被描绘为一个及时、多模式的人工智能助手,可以或许吸收信息、影象内容、处置惩罚信息并理解上下文细节,从而与周围情况举行交互。于演示视频中,Project Astra揭示了其精彩的语音交互能力,无需任何叫醒词便可即时回覆用户的问题,并帮忙用户完成各类使命。尤其值患上一提的是,Project Astra于视觉处置惩罚方面的能力,不仅可以或许辨认静态图象,还有能处置惩罚视频内容,甚至可以或许记住并正确辨认一闪而过的物品,如眼镜。

谷歌I/O开发者大会精彩回顾:AI与Android 15亮点纷呈

google暗示,Project Astra经由过程持续编码视频帧并将视频及语音组合成事务时间线来实现这些功效,从而可以或许迅速处置惩罚吸收到的信息。这一立异要领使患上Project Astra于及时视频问答等场景中体现精彩,为用户提供了越发天然、无延迟的交互体验。

此外,google还有吐露了一些关在Project Astra的将来规划。google称DeepMind团队正于研究怎样将多模态模子更好地整合于一路,并追求于超年夜型通用模子与更小、更集中的模子之间找到均衡。

全新天生式视频模子Veo

Veo的推出无疑是对于OpenAI三个月前发布的Sora的一次直接挑战。

谷歌I/O开发者大会精彩回顾:AI与Android 15亮点纷呈

按照google官方新闻稿,Veo不仅具有天生时长跨越1分钟、分辩率高达1080P的精美视频能力,更惹人注目的是其对于天然语言的深度理解。Veo可以或许精准捕获并转化“延时摄影”、“航拍风光”等专业的影戏术语,将它们化为屏幕上绘声绘色的视觉盛宴。

为了让用户可以或许更矫捷地引导Veo举行视频创作,google提供了文本、图象甚至视频提醒的多种输入方式。google夸大,Veo天生的视频将揭示出极高的联贯性及一致性,不管是人物、动物还有是物体的动作,都将出现出使人赞叹的传神效果。

谷歌I/O开发者大会精彩回顾:AI与Android 15亮点纷呈

谷歌I/O开发者大会精彩回顾:AI与Android 15亮点纷呈

为了直不雅地展示Veo的强盛实力,google还有尤其发布了演示视频。于视频中,咱们可以看到Veo按照用户提供的文本提醒天生的精致画面,如“于漂亮的日落、柔及的光芒、温暖的色采下,一个孤傲的牛仔骑着马穿过坦荡的平原”“很多雀斑水母于水下搏动。它们的身体透明,于深海中闪闪发光”,这些画面使人震撼。

图象天生模子Imagen 3

Imagen 3相较在前代产物Imagen 2有了显著的改良。Imagen 3不仅可以或许更正确地舆解文字提醒,将其转化为图象,并且天生的图象于“创造性及细节”方面有了极年夜的晋升,同时削减了模子孕育发生的滋扰元素及过错。

谷歌I/O开发者大会精彩回顾:AI与Android 15亮点纷呈

为了减缓公家对于Deepfake技能的担心,google公布Imagen 3将采用DeepMind开发的SynthID要领,于天生的媒体上运用隐形加密水印,确保内容的可追溯性及安全性。

google现已经于ImageFX东西中开放Imagen 3的私家预览版注册,并规划很快将其提供应利用google企业天生式人工智能开发平台Vertex AI的开发职员及企业客户。

Imagen 3的进级重要表现于如下几个方面:

起首,Imagen 3于细节处置惩罚上到达了新的高度。天生的图象不仅光影富厚,并且削减了滋扰伪影,使患上总体效果越发天然及真实。

谷歌I/O开发者大会精彩回顾:AI与Android 15亮点纷呈

其次,新模子对于文字提醒的理解能力获得了显著晋升。不管是较长的描写还有是微小的细节要求,Imagen 3都能正确地捕获并表现于天生的图象中。例如,对于狼的特性、配景颜色、画质质量等要求的描写,Imagen 3都能一致地出现出来。

此外,Imagen 3于视觉富厚度及图象质量方面也有了显著的晋升。它可以或许正确地衬着小细节,如人手上的细微皱纹及繁杂的纹理。

Android 15周全融入Gemini

于每一年的I/O年夜会上,Android操作体系始终是会商的核心。自2007年Google联袂84家互助伙伴建立开罢休持装备同盟,配合研发Android以来,基在Android的智能手机已经经遍布全世界消费市场。2023年10月,google发布了Android 14,并于此前已经推出了Android 15的首个测试版,内部代号“喷鼻草冰淇淋(Vanilla Ice Cream)”,预示着正式版本的行将到临。

谷歌I/O开发者大会精彩回顾:AI与Android 15亮点纷呈

于本年的I/O年夜会上,google重点先容了行将面世的Android 15。于搜刮方面,Android 15上的Google搜刮将周全融入Gemini的能力。此中,全新的Circle to Search功效将帮忙学生解决数学及物理问题,用户只需长按主页按钮或者导航栏,圈出困惑的问题,便可得到具体的分步解答。

同时,Gemini AI谈天呆板人也迎来了周全进级,正慢慢成为Android用户的新人工智能助手。经由过程更慎密的底层体系集成,Gemini具有了更强的上下文感知能力,可以笼罩于任何正于利用的运用步伐之上,无需用户频仍切换。此外,用户还有能轻松地将图象从Gemini拖放到其他运用步伐中。

google暗示,他们正于深切研究装备上的人工智能怎样进一步转变手机功效,将来有望与Uber、Doordash等运用步伐实现深度集成。

于年夜会上,google还有展示了Pixel 8a手机上经由过程Google Messages运用步伐利用Gemini的多种场景,包括阐发PDF或者视频并向Gemini发问,得到清楚且援用的回覆。google估计,这些功效将于将来几个月内慢慢扩大到更多装备上。

第六代TPU——Trillium

于鞭策上述技能前进的暗地里,google的TPU功不成没。详细而言,相较在先前的TPU v5e,全新推出的第六代Trillium TPU于机能方面实现了惊人的4.7倍晋升,同时于能效上也取患了跨越67%的显著晋升。

谷歌I/O开发者大会精彩回顾:AI与Android 15亮点纷呈

为了告竣这一显著的奔腾,google对于Trillium TPU举行了多方面的优化。起首,经由过程增年夜矩阵乘法单位(MXUs)的范围并晋升时钟速率,极年夜地晋升了其计较能力。其次,google为Trillium配备了第三代SparseCore,这是一种专门设计用在处置惩罚高级排序及保举事情负载中常见的年夜嵌入的加快器。SparseCores经由过程从TensorCores卸载随机及细粒度拜候,有用加快了重嵌入型事情负载。

除了了上述优化外,google还有进一步加强了Trillium的存储及毗连能力。经由过程将高带宽存储器(HBM)的容量及带宽翻倍,以和晋升芯片间互连(ICI)的带宽,Trillium可以撑持更为繁杂的模子,容纳更多的权重及更年夜的键值缓存,从而年夜幅削减年夜模子的练习时间及相应延迟。

于扩大性方面,Trillium一样体现精彩。于一个高带宽、低延迟的Pod中,Trillium可以扩大至256个TPU。此外,经由过程多切片技能及Titanium智能处置惩罚单位(IPU),Trillium还有可以或许进一步扩大,毗连数百个Pod,构成数以万计的芯片,并于一个多千兆位每一秒的数据中央收集撑持下,形成一个超年夜范围的超等计较机。

版权所有,未经许可不患上转载

-jiuyou.com
其他新闻
识别准确率96.5%,jiuyou.com九游机器狗守护宁夏戈壁滩无人区风电站
jiuyou.com九游隧道巡检机器狗首度交付新加坡电网
全球首只“机器藏羚羊”!jiuyou.com九游科技机器狗深入可可西里腹地
社交媒体
Wechat Bilibili LinkedIn Youtube Twitter Douyin