目录

  • 正式发布
  • 自建算力
  • SenseChat
  • 编程能力
  • 图像生成
  • 后言

上周五,阿里发布大模型通义千问,正式开始邀请内测。本周一,人工智能巨头商汤科技正式发布“日日新”大模型体系,全面丰富的产品体系,多个功能表现超预期,亮点多多。

正式发布

4月10日,商汤科技董事长兼CEO徐立在商汤技术交流日上发布“日日新”大模型体系,取自《礼记·大学》,汤之盘铭:苟日新,日日新,又日新。“日日新”大模型体系包含自然语言生成、照片生成服务、感知模型预标注、模型研发。商汤发布中文语言大模型应用平台“商量”,1800亿参数中文大语言模型支持超长文本知识理解,支持问答、理解与生成等中文语言能力,可实现多轮对话、逻辑推理、语言纠错、内容创作、情感分析等。

实力爆表,日日新成为AI领航者

自建算力

商汤历时五年,建设了业界领先的AI大装置,大装置上总共有27000块的GPU芯片卡,可以输出5.0 exaFLOPS的总算力,是亚洲目前最大的智能计算平台之一。基于大装置的能力,商汤目前已构建了计算机视觉、自然语言处理、AI内容生成、多模态、决策智能等多个领域的大模型,持续演进能力并广泛支持各种应用。

不得不说,27000块GPU芯片,这是一个大手笔。为了创建和维持ChatGPT所需的人工智能分析数据的庞大数据库,OpenAI使用了10000个英伟达的GPU进行相关的训练,而为了支持实际应用,满足服务器的需求,OpenAI已使用了约2.5万个英伟达的GPU,随着需求的增加未来预计还会增加。

单以数量论,商汤已经达到了OpenAI的量级。当然,“日日新”大模型体系所涉及功能目前是多于ChatGPT的,ChatGPT主要功能需求在于语言生成训练,图像生成处于起步阶段,在如此多芯片的支撑下,语言生成所得到的资源支撑比其他ChatGPT类产品多。商汤27000块GPU芯片是供整个大模型体系使用的,功能繁多。自建基础算力,就如同电解铝生产企业自建发电厂,可以有效降低算力成本,并做到算力支持稳定可靠,支持大模型持续迭代优化训练。

SenseChat

“日日新SenseNova”此次推出了语言大模型“商量SenseChat”。作为千亿级参数的自然语言处理模型,“商量SenseChat”使用大量数据训练,并充分考虑了中文语境,能够更好地理解和处理中文文本。

从这个表态我们可以看出,SenseChat与文心一言一样,都是在中文下表现更好,紧密贴合国内市场需求,不约而同的将国内市场作为发展的首要选择,在国际市场已经有ChatGPT和Bard作为行业标杆的情况下,避其锋芒,先内再外的策略有助于企业前期发展。

虽然SenseChat与文心一言是我们认为的最好技术对手,但这次SenseChat明显技高一筹。文心一言缺乏联系上下文的能力,只能单问单答是最被大家诟病的。活动现场,“商量SenseChat”展示了出色的多轮对话和超长文本的理解能力,与ChatGPT一样,SenseChat具有了阅读理解的能力,用户可以通过多轮提问纠正答题方向,知道获得符合心意的答案。

实力爆表,日日新成为AI领航者

此外,商汤还展示健康咨询助手,为用户提供个性化的医疗建议;PDF文件阅读助手,能轻松从复杂文档中提取和概括信息。

编程能力

本次现场演示,SenseChat根据输入的“计算最大公约数”、“求两个数是否互质”等指令写出了简短的代码。同时商汤此次展示了语言大模型下的创新应用————编程助手,可帮助开发者更高效地编写和调试代码。编程核心功能包括代码补全、扩写、翻译、重构、修正,以及注释生成代码、复杂度分析、测试用例生成等。徐立表示,内部实测代码编写效率提升62%,HumanEval测试集一次通过率40.2%。同时预测下一代软件开发范式是AI for AI,代码=80%AI生成+20%人工。

实力爆表,日日新成为AI领航者

按照这个预测,代码80%AI生成,只有20%需要程序员去完成,即使加上项目设计和测试的任务,人工在项目中最多占据50%的工作量就够了,意味着50%的开发人员面临着极大的失业风险,更何况,将来项目设计和测试的一些人工也可以依靠AI来完成。如果从项目需求开始,就让AI进入全程参与,AI将是身手卓尔不凡的项目成员,可以监控项目风险、设计方案初稿、代码生成与跟踪,进行Bug管理等。这个时代正在成为程序员消灭程序员的时代,将寒冬传递给每一个人。

图像生成

商汤此次还展示了“日日新SenseNova”的各种AI文生图创作、2D/3D数字人生成、大场景/小物体生成等一系列生成式AI模型及应用:

实力爆表,日日新成为AI领航者

看到上面这些展示和介绍,我们第一反应就是利好虚拟数字人和元宇宙。借助于日日新大模型,普通企业甚至于个人就能生成虚拟数字人视频,人人皆可制作“柳夜熙”,短视频赛道将风云再起,借助于虚拟数字人来运营积攒流量,依靠流量变现。话说前面谈到代码AI生成导致程序员失业,现在失业的程序员可以考虑考虑利用AI生成实现再就业了。

数字人通常具有三个核心要素——形、动、神。除了拟人外观,还需要具有用语言、表情和肢体等表达的能力,最后拥有比拟人的思想,具有识别外界环境、并能与人交流互动的能力。这次展示体现了在形和动两方面已经做的非常优秀了,这也是现今专业虚拟数字人的普遍阶段,第三阶段大多处于起步发展阶段,通过GPT这一类模型的多轮对话能力,有望加速神这一段的发展。

100平方公里城市级生成,“琼宇”用时2天,具有厘米级重建精度,还原场景的真实细节和光照效果,应用场景涵盖城市及园区数字孪生、建筑设计、影视创作、文旅和电商等。

琼宇造城,格物造物,如影造人,一座充满活力和生机的现代化城市即将展现在我们眼前,元宇宙妥妥的离我们越来越近了。

后言

“坚持原创,让AI引领人类进步”,日日新大模型的发布让大家看到了埋头攻关的商汤体现出的领先技术实力,如同以前的OpenAI一样低调发展实力出众。

从文心一言到通义千问和传闻不断的华为盘古,再到日日新,国产ChatGPT类产品正在奋起直追,日新月异。