微软GPT-4发布,还是多模态的
微软GPT-4发布,还是多模态的
作者:admin
来源:转载 Microsoft资讯
近日,微软德国CTO Andreas Braun在一场名为「AI in Focus - Digital Kickoff」的活动中表示,GPT-4将提供多模态模型。 果然,OpenAI的效率不会令人失望。尽管许多技术消息还在保密,但一个关键细节已经被透露:GPT-4将是多模态的。 一个多模态的语言模型,这意味着什么? 微软德国公司的技术总监Andreas Braun表示,「有了GPT-4,AI就有可能生成文本、图像甚至视频。」而以前版本的ChatGPT只能够生成文本。」 GPT-4作为多模态语言的另一个强大功能在于,它可以管理不同语言的数据输入和输出。 比方说,你可以用西班牙语对ChatGPT提出要求,而得到的生成文本是英语。显然,这种新奇的东西对翻译工具也会有很大的帮助。 微软德国公司的技术总监Andreas Braun表示,「有了GPT-4,AI就有可能生成文本、图像甚至视频。」而以前版本的ChatGPT只能够生成文本。」 毫无疑问,微软要搞个大的——GPT-4将转向多模态,Kosmos-1也是多模态,微软亚研院3月8日提出的Visual ChatGPT,也把视觉基础模型整合进ChatGPT里。 Braun将GPT-4描述为人工智能领域的游戏规则改变者,它将向着拥有人类的解释能力这一目标更进一步。 显然,网友对GPT-4的发布充满期待。 OpenAI创始人Sam Altman此前曾表示,GPT-4仍然将是纯文本模式,且训练参数不会比GPT-3高出太多,因为研发的重点将放在如何提升利用现有数据的能力上。 纽约时报曾猜测,微软必应所增加的聊天功能很有可能就是由GPT-4驱动的。 一次OpenAI内部采访中,其中提到了OpenAI现在用了微软一半的算力,2.8万张A100。在2022年,就花费了4-5亿美元,今年预期要亏损20多亿美元。 其中还提到了,在有隐私限制及其他不能用OpenAI API的场景,底层算力大型的提升非常重要。 对于新一代GPT能否帮助OpenAI节省算力,也值得我们拭目以待。 而且微软重申,ChatGPT给人们日常生活带来的影响与十多年前的iPhone相似。 由Saya Nadella领导的公司也明确表示,GPT-4不是来抢人饭碗的,而是帮助人类简化工作、提升质量。 |