XK星空体育这家成立不到一年的小公司怎么就成了OpenAI的死敌？

2024-03-01 08:09

　　XK星空体育 XK星空体育就在前两天， Mistral AI （下称 Mistral ）接连曝出了好几个重磅消息，省流版就是：Mistral 抱上了微软的大腿，还发布了类 ChatGPT 的聊天机器人，以及号称能跟GPT-4 媲美的大模型。

　　国内媒体也不忘凑热闹，什么下一个 OpenAI 要来了、 “ 渣男 ” 微软脚踏两只船、 OpenAI 成 “ 备胎 ” 的论调满天飞，大有 Mistral 要把 OpenAI 的风头给抢了去的意思。

　　可能有差友对 Mistral 并不熟悉，世超先给大伙儿介绍介绍这家 AI 独角兽、开源大模型圈新晋王者的故事。

　　事实上去年这时候， Mistral 的三位核心创始人，还在为各自的实验室打工。

　　至于离职的原因， Mensch 的说法是 “ 不想在一个开发不透明（闭源）技术的大型科技公司工作 ” ，而 Lacroix 和 Lample 也因为不想卷入公司内部的算力 “ 斗争 ” ，收拾包袱离开了 Meta 。

　　在机缘巧合下，年龄相仿又曾经是校友的三人，联手在法国创办了 Mistral ，为的就是要搞出个欧洲人自己的、真正 Open 的 “ OpenAI ” 。

　　可能是创始人自带履历光环，也有可能是因为欧洲的 AI“ 独苗苗 ” ， Mistral 在还没有像样模型的时候，就拿到了 1 亿多美元的种子轮融资。

　　“ 4 周， 7 页 PPT ， 1.13 亿美元融资 ” 这几个关键词，也迅速传遍 AI 圈。

　　而他们的推广方式也很简单，不开发布会、不发宣传视频，直接免费甩自家大模型 Mistral 7B 的磁力下载链接。。。

　　结果开发者们一用，发现虽然只有 70 亿参数量，但性能并不比 130 亿参数的 Llama 2 弱多少，而且微调一下，在一张显卡上就能运行，这在当时直接引爆了整个开源社区。

　　这个 Mixtral 8x7B ，相当于有 8 个擅长不同领域的专家，而模型会选出其中最符合的 2 个，帮咱解决问题。这种方法，既能快速准确地完成任务，又能减少模型的推理成本。

　　更重要的是， Mistral 在整个圈子里还带起来了一股 “ 小 ” 模型的风潮。

　　以前都说，参数量越大模型性能就越好，但堆参数量，你算力也得跟上才行。大公司们财大气粗耗得起，但小企业个人开发者可吃不消。

　　而且把大模型塞进手机、汽车这些智能设备里本地运行，也成了目前比较火的方向，这也要求大模型得 “ 小而美 ” 才行。

　　于是乎在 Mistral 7B 之后，微软也整出了 27 亿参数的 Phi-2 ，面壁智能整出了 20 亿参数的 “ 小钢炮 ” MiniCPM ，包括几天前，谷歌也开源了 20 亿和 70 亿参数的 Gemma 模型。

　　不过有人发现，向来坚定开源的 Mistral 这次竟然不公开 Mistral Large 的代码了。

　　这一举一动，不免让人猜测：Mistral 是不是要走 OpenAI 的老路了。

　　为了安抚开发者们的情绪， Mistral 的 CEO 也出来公关了一把：团队未来依然会坚持开源理念，同时也会推出更强大的闭源模型参与商业竞争。

　　这事儿免不了落人话柄，但世超觉得，把 Mistral 闭源的锅全甩给微软，也不太地道。

　　说到底， Mistral 还是家初创公司，微软要算力有算力，要钱有钱，而 Mistral 的模型表现有目共睹，放到微软的 Azure 上，也是笔生意。

　　另外对已经重注了 OpenAI 的微软来说，鸡蛋，总不能只放 OpenAI 这一个篮子里吧XK星空体育。

　　大伙们别忘了， Meta 和微软在 AI 领域的合作也相当密切，当年的 Llama 2 ，就是 Meta 和微软联合发布。

　　而最后，无论是 OpenAI 所代表的闭源大模型占优，还是 LlaMA 为代表的开源阵营获胜，目前全球市值第一的微软，似乎都是最后的赢家。

　　再结合一下这次和 Mistral 的合作，世超只想说，目前的世界的 AI 格局其实很简单，那就是：收手吧 AI 巨头们，外面都是微软。

　　海外独角兽，Mistral AI：开源不是威胁，模型变小才能催生 Agents

　　本文为澎湃号作者或机构在澎湃新闻上传并发布，仅代表该作者或机构观点，不代表澎湃新闻的观点或立场，澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。