AI 大模型风口下的鱼龙混杂,谁是真正的王者?

网友 3年前 919 导读

随着 AI 大模型的火爆，越来越多的企业加入到这一领域的竞争中。近期，多家公司相继发布了 AI 大模型相关产品，其中不乏知名企业和新兴科技公司。然而，这一狂热背后也引发了一些担忧。AI 大模型虽然应用范围广泛，但目前落地的场景还相对有限。而且，大模型的技术难度和应用场景距离很远，这也意味着一些入局者并没有真正理解大...

随着 AI 大模型的火爆，越来越多的企业加入到这一领域的竞争中。近期，多家公司相继发布了 AI 大模型相关产品，其中不乏知名企业和新兴科技公司。

然而，这一狂热背后也引发了一些担忧。AI 大模型虽然应用范围广泛，但目前落地的场景还相对有限。而且，大模型的技术难度和应用场景距离很远，这也意味着一些入局者并没有真正理解大模型技术的核心，只是在蹭热点。

AI 大模型风口下的鱼龙混杂，谁是真正的王者？

如何分辨优劣，挑选真正的王者呢？首先，需要明确大模型技术的应用场景，以及企业是否能够真正将其应用到实践中。其次，需要考虑大模型的技术创新和能力，这是企业区分自己和其他竞争者的关键。

除此之外，还需要考虑企业的品牌和信誉度，以及其在相关领域的影响力和市场地位。这些因素综合考虑，才能够真正找到 AI 大模型领域的王者。

鱼龙混杂大模型：谁在蹭热点？谁有真实力？

来源：价值研究所

进入 5 月，国产大模型的风口非但没有熄火，反倒越烧越旺。过去一个星期，就有多家企业发布 AI 大模型相关产品：

5 月 5 日，网易有道发布了基于 “子曰” 大模型开发的 AI 口语老师剧透视频，介绍其基于教育场景的类 ChatGPT 产品布局；5 月 6 日，科大讯飞发布认知大模型 “讯飞星火”，董事长刘庆峰表示有信心超越 ChatGPT；同日，淘云科技发布 “国内首个” 儿童认知大模型 “阿尔法蛋”……

在上述公司之外，还有很多企业宣布进军大模型，类 ChatGPT 产品正在密锣紧鼓研发中，预计不久便会正式上线。企业的热情毋庸置疑，AI 大模型似乎已经不是一条选择题，而是必做题。

然而，狂热背后不乏担忧。大模型技术应用范围虽广，目前落地的场景毕竟有限。而这群入局大模型的企业，分别来自游戏、教育、动漫等诸多行业，和大模型的应用场景离得很远。

当国产大模型变得泛滥，我们该如何分辨优劣？

　没技术不要紧

　　有公司靠 “外援” 捣鼓大模型

要评判一个大模型的优劣，首先看技术，其中最核心的是算法和算力，即训练参数量。因为参数量越大，系统的知识面就会越广，表现也会越稳定。资料显示，openAI 在 2020 年推出的 ChatGPT-3 参数量已经达到 1750 亿，谷歌在一年后发布的 PaLM 则达到 5400 亿，更不用说最新的 ChatGPT-4 了。

参照此技术标准，我们可以精准识别一批蹭热点的企业：它们要么确实拿出了产品，但参数量和 ChatGPT 等有较大差距，功能也较单一；更有甚者，套用别家公司的硬件、数据库来预训练参数，本身缺乏核心技术。

当中的代表，有昆仑万维。

4 月 10 日，昆仑万维宣布联合奇点智源研发 “天工 3.5” 国产大语言模型。根据发布会上的介绍，“天工 3.5” 定位为 “中国第一个真正实现智能涌现” 的大模型产品，具备智能问答、聊天互动、文本生成等多种应用功能以及丰富的科学、技术、文化、艺术和历史知识储备。

根据官方资料，昆仑万维最早在 2020 年布局 AIGC 业务，投入数亿元组建研发团队。去年 12 月，“昆仑天工” 首次亮相，初代产品提供图像、音乐、文本及代码 AI 生成功能。作为对比，大模型领头羊 openAI 在 2019 年发布 ChatGPT-1，每一代产品的研发周期都在一年左右。

乍一看，昆仑万维的 “天工 3.5” 功能全面对标 ChatGPT，比起百度 “文心一言”、阿里 “通义千问” 等国产大模型毫不逊色。在研发速度上，昆仑万维也领先于大多数国内同行。不过昆仑万维的缺点也很突出 ——“天工 3.5” 是和阿里云合作的产物，后者的参数、硬件设备帮了昆仑万维很大忙。

事实上，昆仑万维一直抱紧阿里云的大腿。资料显示，过去几年昆仑万维的海外数据基本都在使用阿里云公有云储存服务，2020 年布局 AIGC 时也是在阿里云的协助下建立算力集群。在 “天工 3.5” 发布后，还有媒体爆出昆仑万维缺乏文本生成、数据处理专利的消息，和百度、阿里形成鲜明对比。

同样遭遇技术质疑的，还有 “AI 四小龙” 之一的商汤科技。

商汤科技在 4 月 10 日发布了自研大模型系统 “日日新 SenseNova”，内含 AI 数字人视频生成平台 “如影”，3D 内容生成平台 “琼宇” 和 “格物”，类 ChatGPT 产品 “SenseChat” 等产品。别人都是发布单个产品，商汤科技一次过拿出一套 “全家桶”，可见其野心之大。

然而，商汤的大模型全家桶在发布那天就有翻车迹象。演示视频公布后，就有媒体和网友发现商汤 “妙画” 生成的图片和 AI 网站 Civitai 的图片撞车，甚至还有来自 Civitai 的文字注释。SenseChat 则在一些基础问题上表达含糊不清，其训练参数量也遭到质疑。

在价值研究所（ID：jiazhiyanjiusuo）看来，缺乏数据源，是昆仑万维和商汤科技共同的命门。

“文心一言” 背后有百度的海量搜索数据和语料库，阿里的 “通义千问” 则有来自电商、云计算等领域的语料库，流量大、用户覆盖面广，能提供足够的参数。缺乏面向 C 端用户的通用产品、没有参数积累，强行上马大模型，昆仑万维和商汤科技的尴尬处境完全可以预料。

　没应用场景又如何？

　　这些企业硬要和 AI 攀关系

除了缺乏核心技术、产品缺陷明显的昆仑万维等企业，另一类企业的行为更让人迷惑：在缺乏应用场景的情况下，硬要给自身产品贴上大模型标签、 “硬蹭” 热点。

这一类企业，以专注 C 端服务的互联网公司为主，尤其是近年来处境不佳的教育、科技金融、游戏公司。

比如专注于智能教育硬件研发的淘云科技，在 5 月 6 日发布了首个儿童认知大模型 “阿尔法儿童认知大模型” 和 GPT 机器人，并宣布把平台的儿童原始语料加入科大讯飞的 “讯飞星火” 大模型中。同样来自教育领域的学而思，也在近日宣布研发数学大模型 MathGPT，目前已取得阶段性成果，预计年内推出。

这类企业最大的问题在于，大模型的应用场景、目标用户和它们的业务有巨大差异。强推大模型，根本无法为它们的用户带来多少帮助。

根据淘云科技董事长刘庆升的说法，“阿尔法儿童认知大模型” 基于儿童场景提供更贴近幼儿理解力的生成式内容，让儿童用户在轻松的氛围下积累新知识。问题在于，类 ChatGPT 应用仍无法保证 100% 准确率，常识性的错误屡见不鲜。对于认知能力有限的儿童来说，并不稳定的大模型反倒可以带来反作用。

当然，上面这些公司蹭热点的目的虽然很明确，但好歹拿出了实打实的产品或规划。还有一些企业，不仅业务场景和大模型相去甚远，甚至还没有拿出实际产品就开始往自己脸上贴金。

比如定位于 “国漫 IP 孵化平台和漫画分享社区” 的快看漫画，就在 4 月 27 日宣布成立 AIGC 事业部。创始人兼 CEO 陈安妮更是在内部信中表示，AI 将会给内容产业带来 “颠覆式” 生态变革。

再比如最近一边捣鼓直播电商、一边忙着进军本地生活的小红书，也没忘记筹备大模型团队。根据 36 氪报道，小红书在今年 3 月开始组建研发团队，主要成员来自广告 NLP 技术部门。4 月，小红书悄悄上线了一款名为 “Trik” 的 AI 创作应用，主打 AI 绘画，但没有大规模宣传，至今没有引发多少关注。

总的来说，这两类企业的大模型布局都经不起推敲。但蹭上大模型风口，确实为其带来了可观的流量，也掀起资本市场的狂欢。前面提到昆仑万维，在发布 “天工 3.5” 次日股价暴涨 16%。或许正因为市场过于狂热，才会反过来迫使这些企业主动迎合热点。

可惜这种热度是无法持续的，而且还会遭到监管机构的重点关照。在 “天工 3.5” 发布次日，昆仑万维就收到了深交所的关注函，要求前者结合项目研发进度、行业政策风险、对公司财务的影响等情况，说明该业务可能面临的风险。

虽然深交所没有把话挑明，但明眼人都看得出这封关注函写满对昆仑万维蹭热点的怀疑。在价值研究所（ID：jiazhiyanjiusuo）看来，蹭热点的行为正在损坏行业生态。给大模型降降火、让市场回归理性，对踏实搞研发的企业来说非常重要。

　追赶 ChatGPT

　　一场艰苦的马拉松竞赛

不可否认，除了上面这些蹭热点的公司外，国内有不少企业在认真打磨大模型产品，也有一定的技术积累和丰富的应用场景。不过从百度、阿里，再到 360，几乎所有头部企业都承认自己的技术不如 openAI 的 ChatGPT。

5 月 7 日，周鸿祎应邀来到东方甄选直播间，和俞敏洪、董宇辉大谈国内的大模型创业热潮。周鸿祎直言，openAI 比国内企业领先至少两年，国产大模型有机会在一年内追上 ChatGPT-3.5，但 openAI 已经开始训练 ChatGPT-5 了。

“上来就说能超越 ChatGPT，那叫吹牛。”

周鸿祎最后这番话，不少媒体认为是在影射 5 月 6 日发布 “讯飞星火” 认知大模型的科大讯飞。科大讯飞董事长刘庆峰在发布会上表示，“讯飞星火” 在文本生成、知识问答、数学能力上已经超过 ChatGPT，目标是到今年 10 月，通用认知能力对标 ChatGPT，并在中文上超越 ChatGPT。

周鸿祎是否意有所指不得而知，可以肯定的是，投资者、用户对国产大模型的耐心正在流失，要求变得更加苛刻，外部的竞争也更加激烈 —— 留给国产大模型的时间已经不多了。

5 月 4 日，微软宣布 Bing 预览版全面开放，该系统此前已接入 openAI 的 ChatGPT-4；一天后，谷歌也宣布向所有拥有 Wordspace 账号的用户开放 Bard AI 工具访问权限。

微软和谷歌先后走向开放，意味着新一轮用户争夺战正式打响。一旦它们渗透进国内市场，面对技术上的差距，国产大模型并没有太多应对方法。比起那群蹭热点的企业，追赶 openAI 的骨干力量更值得我们关注 —— 特别是百度、阿里、腾讯三巨头，周鸿祎治下的 360，疑似被其揶揄的科大讯飞实力也不容小觑。

这几家公司的优势是相似的：雄厚的资金储备；拥有诸多面向用户的产品 / 服务，语料库十分丰富；主营业务贴近大模型应用场景，如百度和 360 的搜索，腾讯的社交媒体，阿里的云计算和电商，科大讯飞的智慧办公等。现阶段，这些企业的产品距离 ChatGPT 当然还有一定差距，但并非没有追赶的机会。

要知道，即便是技术领跑全行的 openAI，也有自己的苦恼。过去一年，随着 ChatGPT 走红 openAI 的估值也是一路走高，成为全球范围内升值最快的独角兽 —— 可惜随之飙升的，还有亏损额。

据外媒报道，openAI 上一财年净亏损达到 5.4 亿美元，同比几乎放大一倍。每一次预训练参数都要耗费巨资，要提升系统稳定性又必须不断加大参数量和预训练频次，亏损自然成为无解难题。国盛证券的研报指出，通过测算，2800 亿参数量的大模型预训练成本约为 200 万美元 / 次，谷歌的 PaLM 号称拥有 5400 亿参数，单次预训练成本将高达 1200 万美元。

今年 2 月推出的付费版 ChatGPT 和其他商业化尝试收效甚微，短时间内不可能覆盖预训练所需成本。CEO Sam Altman 曾暗示，公司未来几年可能需要筹集约 1000 亿美元的资金，才能进一步提升技术，打磨下一代产品。

openAI 的经历表明，AI 大模型研发如同一场漫长且艰难的马拉松 —— 不要总是奢望弯道超车，踏踏实实和参数打交道是成功的基础。

结束语

在当前大模型的火热背景下，需要谨慎对待这一领域，避免盲目跟风，选择真正的优质产品和服务，才能够获得最好的效果。AI大模型是一项前景广阔的技术，可以应用于各种场景和领域。近来，国内大量企业进军这个赛道，希望能够在这个领域中分得一杯羹。但是，我们也应该看到，技术发展是需要时间和沉淀的，只有真正有实力的企业才能够在这个领域中占据一席之地。那些蹭热点的企业，即便短期内能够取得一些成绩，也不可能在这个领域中生存下去。

同时，监管也是非常重要的一环。监管机构应该加大对大模型领域的监管力度，打击那些不良企业和行业乱象，创造一个健康的发展环境。同时，从业者们也应该时刻保持清醒头脑，不要被市场的狂热氛围冲昏了头脑，一定要保持技术的创新和实力的积累，才能够在这个赛道中真正取得成功。

未来，AI大模型的发展前景是非常广阔的，随着技术的不断发展，我们相信它将会在更多的领域中得到广泛应用。但是，我们也需要明确的认识到，技术的发展需要时间和沉淀，需要实力的积累和实践的积累。只有那些真正具备实力的企业，才能够在这个领域中立于不败之地。

本文地址： https://shyhot.com/chigua/7799.html