你对他们感兴趣吗 OFFERED？使用我们的优惠券节省 WHATSAPP o 电报!

ChatGPT 现在是一个能看、能听、能说的助手

Gianluca Cobucci

25 2023月

0

chatgpt接受语音和图像输入

ChatGPT由 OpenAI 开发的 ChatGPT 正在引入新功能，让您可以通过语音和图像进行交互，提供直观的界面以及更多将 ChatGPT 集成到您的日常生活中的方式。 OpenAI 最近在其网站上发布公告，决定提前透露这些新功能。同样，他还强调了它们带来的好处以及它们在不断增长的人工智能市场中带来的挑战。

本文主题：

ChatGPT：语音交互

借助新的语音功能，用户可以 与 ChatGPT 进行互动对话。这使您即使在移动中也可以使用助手，从而增加了聊天机器人的潜力。例如，用户可以要求 ChatGPT 在旅途中讲述儿童故事，使其变得更加有趣。

chatgpt 语音命令

聊天机器人创建的故事

或者，在与朋友共进晚餐时，可能会就某个特定话题进行辩论；在这种情况下，用户可以使用机器人来获取准确的信息并建设性地解决争论。

ChatGPT 的语音技术采用 高级文本转语音模型。通过与专业配音演员合作，该模型能够从文本和短语音样本生成人形音频，使与 ChatGPT 的交互更加自然和直观。另外，感谢耳语，OpenAI开发的开源语音识别系统，口语是 非常精确地转录成文本，使聊天机器人能够理解并有效响应用户请求。

ChatGPT：视觉交互

如上所述，AI模型现在可以 分析一张或多张图像，允许用户解决问题、计划膳食或分析复杂的图表。例如，用户可以提交冰箱内物品的照片。因此应该使用聊天机器人 分析现有的食物并根据这些成分建议食谱， 还提供了准备的分步说明。

chatgpt 图像命令

另见： GPT-4：Gemini将成为谷歌的竞争对手。这是差异

此外，如果用户需要关注图像中的特定元素， ChatGPT 的移动应用程序包含绘图工具 它允许您突出显示图像的特定区域，使沟通和分析更加精确和个性化。

图像理解由 GPT-3.5 和 GPT-4 多模态模型提供支持。这些先进型号 他们将语言技能应用于各种图像，例如照片、屏幕截图和文档 包含文本和图像，使 ChatGPT 能够准确、详细地理解和解释视觉上下文。

值得一提的是，从 poco OpenAI 集成的不仅如此 canva 也 ChatGPT 中的 DALL-E 3，或生成图像模型。

何时以及为谁提供

未来两周OpenAI将为用户在ChatGPT中实现语音和图像 拥有 Plus 和 Enterprise 订阅的用户。

语音交互功能将上线 在 iOS 和 Android 上 但大多数人使用的网页版则不然。

允许视觉交互的功能将改为可用 在所有平台上，因此 Android、iOS 和 Web。

来源| OpenAI

ChatGPT 现在是一个能看、能听、能说的助手

上一页

GGOBEST GM26 电动自行车售价 1010 欧元，含欧洲运费

ChatGPT 现在是一个能看、能听、能说的助手

下一页

DJI Mini 4 Pro意大利官方：关于轻量级无人机的一切

标签：聊天工具 openai

Gianluca Cobucci

对代码、语言和语言、人机界面充满热情。我对所有技术进化都很感兴趣。我尝试以最清晰的方式表达我的热情，依靠可靠的来源，而不是“一开始”。

您可能感兴趣的其他项目

小米平板6S Pro 小米平板7 Pro

小米平板 7 系列将于今年晚些时候上市：我们所知道的一切

vivo Y100 4G vivo Y38 5G vivo V30e

Vivo Y100 4G、Y38 5G 和 V30e 在多个国际市场推出

小米 MIX 翻盖

小米MIX Flip在中国获得认证：这将是该公司首款垂直折叠屏

一系列以意大利国旗为中心的建筑以及代表人工智能的图标

密涅瓦 (Minerva) 登场：全意大利人工智能的承诺

Sottoscrivi

0 评论

内联反馈

查看所有评论