日前OpenAI方面宣布,已开始测试GPT-4o的长输出版本(GPT-4o Long Output)。目前其仅限于参与Alpha测试的用户使用,其可通过“gpt-4o-64k-output-alpha”这一模型名称来访问。
根据官方公布的信息显示,GPT-4o Long Output支持最高64k tokens的长文本输出,较GPT-4o提升16倍,但其最大上下文窗口仍保持与其相同的128k tokens。对此OpenAI方面表示,推出更长输出模型这一决策是基于用户的反馈。
基于长输出能力,GPT-4o Long Output适用于长篇内容创作、学术论文撰写、技术文档编写、市场分析报告,以及教育材料开发等应用场景。其中以技术文档编写为例,该模型可帮助软件开发者或工程师编写技术手册、API文档、软件指南等。
在价格方面,GPT-4o Long Output每百万输入tokens为6美元、较GPT-4o上涨1美元,每百万输出tokens为18美元、较GPT-4o上涨3美元。
据OpenAI公司发言人透露,“我们正在与少量可信任的合作伙伴进行几周的Alpha测试,以便了解更长的输出是否有助于他们的用例”。根据这一阶段的测试成果,OpenAI方面将会决定后续是否向多的客户开放这一功能。
不久前在当地时间7月30日,OpenAI还向部分ChatGPT Plus订阅用户开放了基于GPT-4o的高级语音模式(Advanced Voice Mode)。
据了解,GPT-4o的高级语音模式不仅能够提供更自然的实时对话、允许用户随时打断,还可以感知或响应用户的悲伤、兴奋等情绪语调。其中在实时对话方面,GPT-4o能够以平均320毫秒的速度回应音频输入,与人类在典型对话中的反应时间相似。
对此OpenAI首席技术官Muri Murati曾表示,“在GPT-4o中我们训练了跨文本、视觉和音频的端到端全新统一模型,这意味着所有输入和输出都由同一个神经网络处理”。
【本文图片来自网络】
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.