12月18日上午,“2024火山引擎FORCE原动力大会·冬”拉开帷幕。会议现场座无虚席,备受关注的豆包大模型将有哪些重要升级等话题,吸引了超千名关注AI进展的听众来到现场。 这次大会的一个重要看点就是,豆包大模型全面升级,同时,继大语言模型价格以厘计算之后,视觉理解模型也宣告进入“厘时代”。 豆包视觉理解模型定价进入“厘时代” 与诸多大厂的大模型大会不同,字节跳动别出心裁,本次大会主持人并非真人,而是虚拟的“豆包”。 火山引擎总裁谭待在大会上介绍,豆包大模型发布以来,在7个月时间里,日均tokens增长超过33倍,日均tokens使用量超过4万亿。 大模型应用加速渗透。豆包调用量上,信息处理场景增长39倍,硬件助手场景增长13倍,AI工具场景增长9倍。 当日,字节跳动豆包大模型家族全面升级。 其中,豆包视觉理解模型,通过视觉识别还可以进一步推理和计算,拥有更强的理解和推理能力。同时还有更细腻的视觉描述能力,比如孩子一幅涂鸦,豆包就可以创作一篇奇思妙想的故事;旅游场景方面,可以识别外文菜单、介绍建筑知识等。 “视觉理解拓展场景边界,模型发展进入新阶段。”谭待表示。 更值得关注的是价格。豆包视觉模型比行业平均价格低85%,单价为0.003元。这使视觉理解模型首次进入“厘时代”。 此前,豆包视觉理解模型已经接入豆包App和PC端产品。豆包战略研究负责人周昊表示:“豆包一直在努力,让用户的输入更快更方便”。为此,豆包产品非常注重多模态的输入和打磨,包括语音、视觉等能力,这些模型都已通过火山引擎开放给企业客户。 会上,豆包3D生成模型也首次亮相。该模型与火山引擎数字孪生平台veOmniverse结合使用,可以高效完成智能训练、数据合成和数字资产制作,成为一套支持 AIGC 创作的物理世界仿真模拟器。 豆包大模型多款产品也迎来重要更新:豆包通用模型pro已全面对齐GPT-4o,使用价格仅为后者的1/8;音乐模型从生成60秒的简单结构,升级到生成3分钟的完整作品;文生图模型2.1版本,更是在业界首次实现精准生成汉字和一句话P图的产品化能力,该模型已接入即梦AI和豆包App。 即梦Dreamina张楠认为,生成式AI技术可以把每个人脑子里的奇思妙想快速视觉化,“像做梦一样”。即梦希望成为“想象力世界”的相机,记录每个人的奇思妙想,帮助每个有想法的人轻松表达、自由创作。 大模型应用加速落地 大会透露,豆包大模型已经与八成主流汽车品牌合作,并接入到多家手机、PC等智能终端,覆盖终端设备约3亿台,来自智能终端的豆包大模型调用量在半年时间内增长100倍。 在公布豆包视觉理解模型超低定价的同时,火山引擎升级了火山方舟、扣子和 HiAgent 三款平台产品,帮助企业构建好自身的 AI 能力中心,高效开发 AI 应用。其中,火山方舟发布了大模型记忆方案,并推出 prefix cache 和 session cache API,降低延迟和成本。火山方舟还带来全域 AI 搜索,具备场景化搜索推荐一体化、企业私域信息整合等服务。 云原生是过去十年最重要的计算范式,大模型时代则推动着云计算的变革。火山引擎认为,下一个十年,计算范式应该从云原生进入到AI云原生的新时代。 基于AI云原生的理念,火山引擎推出了新一代计算、网络、存储和安全产品。在计算层面,火山引擎GPU实例,通过vRDMA网络,支持大规模并行计算和P/D分离推理架构,显著提升训练和推理效率,降低成本;存储上,新推出的EIC弹性极速缓存,能够实现GPU直连,使大模型推理时延降低至1/50、成本降低20%;在安全层面,火山将推出PCC私密云服务,构建大模型的可信应用体系。基于PCC,企业能够实现用户数据在云上推理的端到端加密,而且性能很好,推理时延与明文模式的差异在5%以内。 谭待说:“今年是大模型高速发展的一年。当你看到一列高速行驶的列车,最重要的事就是确保自己要登上这趟列车。通过AI云原生和豆包大模型家族,火山引擎希望帮助企业做好AI创新,驶向更美好的未来。” “真”合作伙伴来了 对于这次发布会,二级市场早已经预期满满。 近期,豆包概念连续活跃多天,不少概念股票走高。由此,豆包概念股也成为继Kimi概念股之后,市场又一“最靓的仔”。 在资本市场中,目前已有多家A股公司在公告及互动平台回应了与豆包的合作情况。 比如,近期,字节跳动发布了首款AI智能体耳机Ola Friend,该款耳机接入字节跳动旗下豆包大模型,中科蓝讯股价一度大幅上涨。12月13日,中科蓝讯在公告中表示,公司讯龙三代BT895x芯片可满足AI耳机端侧对语音处理、高速音频传输等的需求,已被搭载于FIIL GS Links AI高音质开放式耳机,是继早前上市的Ola Friend耳机外,市场上第二款支持豆包大模型AI的耳机产品。 对于公司与字节跳动的合作,中科蓝讯表示,为满足市场对于AI耳机日益增大的需求,公司与字节跳动旗下的云服务平台火山引擎展开了深度合作。公司讯龙三代BT895x芯片完成了与火山方舟MaaS平台的对接,已可向用户提供适配豆包大模型的软、硬件解决方案。 中科蓝讯称,公司与豆包大模型的合作,将分多阶段进行,现阶段已经适配了实时翻译、会议纪要、实时对话等功能,后续双方将会面对不同的使用场景推出更多的AI功能。未来,公司将持续布局AI穿戴产品领域,继续与豆包大模型深度合作,向市场推出用户体验度更好的AI穿戴解决方案。 南凌科技近期的投关活动中,有投资者询问公司与字节跳动火山引擎、豆包AI合作的细节。南凌科技在12月13日披露的公告中提到,公司与火山引擎在多个领域开展了合作,南凌科技是火山引擎全线产品的代理商。 12月13日,有投资者询问德生科技是否与豆包大语言模型有合作,德生科技在互动平台回应称,公司自研的行业大模型在通用知识方面,有使用上述的大语言模型,目前反馈量不大,会随着场景需求来变化。 洲明科技也在互动平台表示,公司在自研UniAvatar数字人系统上,与微软、腾讯、百度、科大讯飞、字节火山和豆包等展开合作。其中2024年5月,洲明数字人接入火山引擎的TTS能力和豆包的大模型问答能力,适用于数字人对话系统等应用场景。 蜂助手表示,公司与字节跳动旗下的豆包就智能设备领域进行初步洽谈,但目前尚未向市场推出相关产品。 抖音豆包概念股公司,也迅速成为机构调研的对象。近期,获得机构密集调研的豆包概念股公司包括中科蓝讯、乐鑫科技、中科创达、海天瑞声等。 不过也有一些市场传言的合作并不真实。 典型的是“豆包”大模型与中兴手机合作。这一消息一度引发中兴通讯股价大涨。不过,很快,豆包相关负责人回应表示,消息不实。“豆包”大模型已经和许多手机有了深度合作,但并没有和中兴通讯探讨过成立新品牌可能性,芯片也没有相关的合作。 雾里看花之间,哪些才是豆包真正的合作伙伴呢? 在大会现场,e记者也看到火山引擎生态与合作伙伴列表。在列表中的企业主体,与字节跳动大模型的合作更有“含真量”和“含金量”。