谷歌I/O大会创办人布林意外现身 赞AI模型Gemini比想像厉害

谷歌共同创办人布林去年重返谷歌,为人工智能(AI)技术操盘,他今天意外现身在美国加州山景城举办的谷歌 I/O年度开发者大会,向媒体分享对谷歌Gemini的看法,大赞比想像更厉害。

谷歌I/O大会创办人布林意外现身 赞Gemini比想像厉害

  布林原本已经淡出谷歌营运,鲜少涉足公司业务,去年7月外媒发现布林常出现在谷歌总部,与AI研究员一起工作,开发Gemini模型,以因应OpenAI公司旗下聊天机器人ChatGPT崛起所带来的挑战。

  外媒记者受邀前往I/O大会现场,参加一场禁止拍摄、介绍Gemini 1.5模型功能的闭门小型展演时,一名工作人员开门走进来,定睛一看竟是谷歌创办人布林,引起现场一阵惊呼。原本议程并没有安排布林参与,事前也没有任何布林会出席I/O大会的消息。

  他向现场记者一一握手打招呼,展现十足亲和力,与在场所有人一起合影留念。

  布林表示,自己推动Gemini发展时,发现Gemini比想像中更厉害,于是陆续应用到各种领域,进一步拓展Gemini的能力,包括今天展示的视觉识别与记忆能力。

  在Gemini 1.5模型的展演中,工作人员把长颈鹿、鸭子、小狗造型的布偶逐一放在摄像机下方,帮每个布偶取名,然后询问Gemini每个名字的布偶是谁;Gemini回答时除了能分辨每个布偶是什么动物,也能准确把名字连结在一起。

  在接下来的展演中,工作人员在触控屏幕上用手指绘图,Gemini可以分辨是小圆圈或人形,还能根据工作人员加上的外星人图案,联想到手绘图可能与电视系列剧“X档案”有关。

  Gemini 1.5 Pro是谷歌最先进的,可包含100万个词元的脉络长度,是目前全球其他一般消费者使用的聊天机器人所拥有最高的脉络长度,因此Gemini Advanced服务能理解内容更庞大的文件,像是长达1500页的文件档案,或处理约100封电子邮件的摘要。

  不久后,Gemini Advanced还可以处理长达1小时的影片内容,或超过3万行的程序码。

  谷歌同时宣布,在接下来几周内,将为订阅Gemini Advanced服务的使用者推出Gemini Live功能,通过语音技术,使用者能够以直觉自然的方式与Gemini互动,除了跟Gemini互动时可以用自己习惯的语速交谈,也能中途打断Gemini的回应来询问额外问题,进一步厘清资讯,就像任何日常对话一样。






最近更新

热点聚焦

赞助商广告