2025年7月25日,科大讯飞宣布基于全国产算力训练的深度推理大模型“讯飞星火X1”实现重大升级。升级后的星火X1在多个方面取得显著进展,具体如下:综合能力提升:整体效果对标OpenAI GPT-3等国内外一流大模型最新版本效果,在翻译、推理、文本生成、数学等方面保持领先。今年6月,在国内大模型挑战全国高考数学一卷的评测中,星火X1-0420版本突破了140分,本次升级后数学能力再次精进。幻觉治理进步:幻觉问题是掣肘大模型落地应用的关键问题,升级后的星火X1在幻觉治理方面领先业界主流模型。无论是在确保生成内容本身真实性,还是在忠实引用外部资料方面,模型可靠性均大幅提升,为行业应用奠定了更坚实的基础。多语言能力增强:多语言能力已覆盖130余种语种,为世界提供全栈自主可控大模型底座的“第二种选择”。基于星火X1强大底座的语音同传大模型迎来全面升级,中英同传的首字响应时间缩短至仅需2秒,达到人类高阶同传译员的行业标准线。翻译质量较半年前版本综合提升20%,流畅度接近母语交流。行业应用拓展:得益于星火X1模型的升级,教育、医疗、企业应用、代码、科研等行业大模型和智能体也取得了新的进步,在复杂行业场景任务上进一步解决用户关键刚需。例如,星火医疗大模型在全科辅助诊断、体检报告解读等通用医疗任务上持续保持业界大幅领先;星火代码大模型已深度赋能金融、制造等100余家关键领域客户,在典型应用场景中驱动研发效率提升超过50%。星火X1最新升级的能力可直接在讯飞星火网页版和App进行体验,全新API已同步上线讯飞开放平台。
|
|