
文心一言写代码:代码生成力的探索
SenseTime,这家中国领先的人工智能公司,近日在2024年世界人工智能大会及全球AI治理高层会议上推出了其最新进展:SenseNova 5.5。这次发布不仅展示了SenseTime在创新和实际应用方面的承诺,还引领了AI发展的新方向。SenseNova 5.5大模型是一次全面升级,结合了中国首个实时多模态模型SenseNova 5o,具备与GPT-4相媲美的流媒体交互能力。这种多模态特性允许模型实时处理和响应音频、文本、图像和视频数据,为用户提供类似于人类对话的互动体验。尤其对于实时对话和语音识别应用来说,这一特性展示了模型的适应性和上下文响应能力。
SenseNova 5.5的另一个亮点在于其具有成本效益的边缘侧大模型,每台设备的年成本低至人民币9.90元。这种经济性有利于广泛部署,使先进的AI技术能够被不同用户和行业所使用。通过云到边缘的全栈大模型产品矩阵,SenseTime确保了持续更新,为生成应用程序在多个场景和行业中提供创新解决方案。SenseNova大模型已经部署在超过3000家政府和企业客户中,涵盖了技术、医疗保健、金融和编程领域。
SenseTime的董事长兼CEO Dr. Xu Li 强调了此次升级的重要性,他表示,“这是大模型从单模态向多模态演进的关键一年。结合用户需求,SenseTime也专注于增强交互性。随着应用程序推动模型及其能力的发展,再加上多模态流媒体交互的技术进步,我们将见证人机交互的前所未有的变革。”
SenseNova 5.5的技术实力由混合云-边缘协作专家架构支撑,优化了云到边缘的协同,降低了推理成本。模型训练使用了超过10TB的优质训练数据,包括合成生成的推理链数据,增强了其推理能力。与其前身SenseNova 5.0相比,新模型在整体性能上提升了30%,其数学推理、英语水平和指令跟随能力得到了显著增强,与GPT-4的核心指标更加接近。
text = "Hello world!"
processed_text = sensenova.process_text(text)
print(processed_text)
除了大模型的升级,SenseTime还推出了SenseChat Lite-5.5,这是一款具备0.19秒推理时间的边缘侧模型,相比SenseChat Lite-5.0提升了40%。推理速度提升了15%,达到每秒90.2个字,提升了性能和效率。边缘侧模型产品矩阵包括SenseChat迷你写作助手、摘要助手和百科助手等专用模型,每个模型都针对特定业务需求进行了优化。
SenseNova套件的一个重要新成员是Vimi,SenseTime的首个可控AI化身视频生成器。Vimi能够精确控制面部表情和上半身动作生成短视频片段,是娱乐和交互应用中长视频生成的理想工具。此功能彰显了SenseTime在SenseNova大模型系列下扩展生成AI应用的承诺,满足多样化用户需求,助力行业数字化转型。
SenseTime还推出了“项目 $0 Go”计划,为从OpenAI平台迁移的企业用户提供免费和全面的入门包。此举包括5000万令牌包和API迁移咨询服务,为希望利用SenseNova大模型强大能力的企业降低了入门门槛。
在2024年,SenseTime迎来了其10周年,正值大模型发展的重要时期。公司的十年旅程 culminated in a comprehensive full-stack large model product matrix covering cloud-to-edge applications. As SenseTime continues to expand the SenseNova industry ecosystem, it remains dedicated to empowering more businesses and communities in their digital transformation journeys.
问:什么是SenseNova 5.5的主要创新?
问:Vimi的应用是什么?
问:如何参与“项目$0 Go”计划?
通过这些创新,SenseTime不仅展示了其在AI领域的领先地位,还为未来的人机交互和行业转型提供了无限可能。