测试ChatGPT高级语音模式的视觉功能

科技作者 / 花爷 / 2025-08-27 15:44
"
    经过几个月的测试,OpenAI在9月份为ChatGPT推出了“高级语音”模式。这个功能可以让你和ChatGPT进行实时对话:你可以打

  

  经过几个月的测试,OpenAI在9月份为ChatGPT推出了“高级语音”模式。这个功能可以让你和ChatGPT进行实时对话:你可以打断机器人的“说话”,然后问另一个问题,它会理解你的语气,并以此来告知它的回答,以及它使用的语调变化。(它笑起来的时候很吓人。)

  然而,自推出以来,高级语音模式一直缺少一个功能。今年5月,OpenAI首次宣布这项功能时,它展示了ChatGPT将如何访问你的摄像头,并“看到”你周围的世界。当你和机器人聊天时,你可以把相机对准某样东西,问一个问题,ChatGPT会尽其所能地回答。七个月后,这种能力就出现了,而且令人印象深刻。

  为了使用它,你需要付费订阅chatgpt - Plus(每月20美元)或Pro(每月200美元)。ChatGPT Team订阅者也有资格。即使你支付了费用,这个功能也可能不会马上在你的终端上可用,因为OpenAI会随着时间的推移而推出它。

  进入摄像头是非常简单的,一旦它推出到你的帐户。你像往常一样启动高级语音模式,使用聊天窗口右下角的波形图标。从这里,你会看到一个新的摄像头图标,当然,它会启动实时摄像头馈送。这不会中断聊天:您可以在与ChatGPT的对话中打开摄像头,然后继续聊天,只是现在将摄像头作为对话的一部分。

  我第一次使用它的时候,我把相机对准附近的任天堂(Nintendo) Switch盒子,上面放着一根iPhone线和我的Magic Trackpad,然后问:“这是什么?”ChatGPT表示:“它看起来像一个任天堂Switch OLED盒子,上面有一些电缆和一台笔记本电脑。你打算安排吗?”三分之二是正确的,因为它把我的触控板错当成了笔记本电脑,不过,嘿,差不多了。接下来,我把它指着我的水瓶,让它认出我在强调什么:“那看起来像一个黑色的水烧瓶。这是保持饮料冷或热的好方法!你经常带着它吗?”

  我接着问:“你知道这是什么型号的Hydro Flask吗?”ChatGPT:“我不能确定确切的型号,但看起来像他们的宽口瓶,大约32盎司。它的设计绝对是为了让你的饮料在几个小时内保持合适的温度。”那。基本上是对的。我对ChatGPT正确猜测大小也不是很满意。

  我转向我的键盘,ChatGPT准确地说明了这是一个苹果魔法键盘。我问它能看到哪些键,然后说出了我在画框里的一些键,但不是全部。所以,我问它能看到多少个键,它说“大约30个”,其实有26个。所以,还是很接近。

  它能够识别出我MacBook上的MagSafe接口,以及它右边的两个USB接口和耳机接口。它认出了我天花板上的通风口,以及我门前的靴子的特定型号。总而言之,除了触控板,它基本上能识别我测试过的所有东西。

  但除了面目全非之外,我想最让我吃惊的是这些反应的速度。您要求ChatGPT识别某些内容,它确实可以做到,有时比您要求真人做的更快。有时,机器人会把一个词保留一会儿(例如:“我认为这是一个……”),这可能是一个技巧,让ChatGPT处理它想说的其余内容。我还发现它的第一反应不太确定:我把它指向我的魔术鼠标(Magic Mouse),它的第一反应是猜什么是电脑鼠标。但当我问它是什么品牌时,它不仅没有指明是苹果,还说这是一款以“时尚设计”和“触敏表面”著称的苹果魔法鼠标。

  然而,考虑到所有的因素,这些反应往往是近乎即时的,这说明了OpenAI的模型现在是多么强大。我在很大程度上仍然是一个人工智能怀疑论者,但这是一段时间以来第一个给我留下深刻印象的发展——我对自己的感受很纠结。

  一方面,我可以看到这项技术被用于做好事。想象一下,对于盲人或视力受损的用户来说,这样的东西会有多大的帮助,尤其是在智能眼镜这样的方便设备上。人们可以问他们的人工智能助手他们面对的方向,阅读餐馆的菜单,或者过马路是否安全。像这样的技术可能会让搜索变得更好,并且通过将智能手机相机对准一个主题,让我们更容易了解世界上的新事物。

  另一方面,我的想法变得消极,特别是因为人工智能仍然容易产生幻觉。随着越来越多的人使用这项技术,他们将不可避免地经历人工智能可能犯的错误,如果他们依靠机器人来帮助他们完成任务——尤其是涉及到他们安全的事情——幻觉可能是危险的。我没有遇到任何大的错误;只是触控板弄错了。Anderson Cooper发现机器人在一个几何问题上犯了一个错误(同样,不是一个大问题)。但这是一个很好的提醒,随着这项技术的迅速发展,其固有的缺陷增加了失败的风险。

  也许这就是为什么每次现场拍摄都会警告你不要使用这个功能,因为它涉及到安全问题。

分享到
声明:本文为用户投稿或编译自英文资料,不代表本站观点和立场,转载时请务必注明文章作者和来源,不尊重原创的行为将受到本站的追责;转载稿件或作者投稿可能会经编辑修改或者补充,有异议可投诉至本站。

热文导读