
IT之家 12 月 3 日报道,法国人工智能初创公司 Mistral AI 当地时间 2 日宣布推出新一代 Mistral 3 系列车型,包括首款采用稀疏架构的混合动力专业车型 Mistral Large 和三款小型紧凑型车型。 Mistral Large 总参数大小为 675B,活跃参数大小为 41B; Minstral 3“三兄弟”的参数大小分别为14B、8B、3B。这些模型和衍生品是在 Apache 2.0 许可证下开源的。 Mistral AI 表示,Mistral Large 3 使用 3,000 个 NVIDIA H200 GPU 从头开始训练,是世界领先的权重模型之一。经过后期训练,该模型实现了与市场上最好的开放权重模型的一致性,同时在多语言对话中展现了图像理解和行业领先的表现。 Mistral Large 3 在 LMARENA 排名的 OSS 非推理模型类别中排名第二,在 OSS 非推理模型类别中排名第六OSS 总体排名。对于参数较小的 Minstral 3,Mistral AI 声称已经实现了所有 OSS 模型中最佳的性价比。这些模型的教学变体在性能上等于或优于类似模型,而生成的令牌数量通常要低一个数量级。
特别声明:以上内容(如有则包括照片或视频)由自媒体平台“网易号”用户上传发布。本平台仅提供信息存储服务。
注:以上内容(包括图片、视频,如有)由网易HAO用户上传发布,网易HAO为社交媒体平台,仅提供信息存储服务。