By 张伟
2024年8月22日
22
310
顶尖Phi 3.5模型系列:微软小语言模型的全新升级
微软正式发布了Phi小语言模型系列的最新版本——Phi 3.5,一口气连发三款模型。虽说这三款模型规模较小,但在许多第三方基准测试中表现卓越,甚至在某些情况下超越了其他领先的大模型,包括谷歌的Gemini 1.5 Flash、Meta的Llama 3.1,甚至在一些竞技场上击败了OpenAI的GPT-4。
小而美路线
这次发布的三款Phi 3.5模型延续了小而美的路线,适用于多种AI解决方案和AI定制开发需求,特别是在大型语言模型开发和ChatGPT开发中展示了强大的性能和多样的应用场景。
轻量级模型:Phi-3.5-mini-Instruct
Phi-3.5-mini-Instruct是微软Phi 3.5系列中的轻量级AI模型,基于Phi-3的数据集构建,拥有38亿个参数,并支持128k token上下文长度。这款模型在多语言和多轮对话任务中表现出色,支持多达23种语言,包括阿拉伯语、中文、英语、芬兰语、法语、德语等,这使其在教育行业AI解决方案和教培行业AI应用中具有广泛的应用前景。由于支持128k上下文长度,Phi-3.5-mini-Instruct能够执行多种长上下文任务,如长文档/会议摘要、长文档QA以及长文档信息检索,非常适合用于AI企业解决方案和AI定制开发项目。
hi-3.5-mini在多语言和多轮对话任务中表现出了优秀的性能。
“新智元”混合专家架构
Phi-3.5-MoE-instruct是微软Phi模型中的首个MoE(Mixture of Experts)模型,将多种不同类型的模型组合成一个模型,使其能够专门从事不同的任务。该模型采用混合专家架构,在23天内使用512个H100-80G GPU对4.9万亿个token进行了训练。模型拥有420亿个参数,并支持128k token上下文长度,专注处理高质量和推理密集的数据。Phi-3.5-MoE在大规模多任务语言理解(MMLU)测试中表现卓越,击败了GPT-4o mini,涉及STEM、人文科学、社会科学等不同专业领域,这为教育行业售前咨询AI和税务行业知识问答AI提供了强大的技术支持。
多帧图像理解
Phi-3.5-vision则主要用于多帧图像理解和推理,包括详细的图像比较、多图像摘要和视频摘要。这些能力在办公场景中有广泛的应用。经过测试,Phi-3.5-vision在大多数图像基准测试中的性能都有所提升,例如MMMU性能从40.2提升到43.0,MMBench性能从80.5提升到81.9,文档理解基准TextVQA从70.9提升到72.0。这使得Phi-3.5-vision在AI系统开发和AIGC软件服务中成为一个不可或缺的工具。
如有侵权,请联系删除。
Related Articles
-
Tue Jun 09 2026智能体时代CPU回'C位',英特尔至强6+重塑AI底座
随着Agentic AI从实验室走向规模化落地,数据中心对算力的结构性需求发生显著变化。英特尔在北京发布会上提出,CPU正在从训练边缘化后的回归阶段承担更多在线推理、协调与编排任务,成为AI部署的关键
-
Tue Jun 09 2026百奥几何完成新一轮数亿元融资,以'微观世界模型'构筑Bio AI基础设施
百奥几何宣布完成新一轮数亿元战略融资,由上海生物医药创新转化基金与国科投资等联合领投,公司专注于将生成式AI应用于生命科学,打造微观世界模型以实现自主科学发现。
-
Tue Jun 09 2026王慧文,投了一家AI短剧公司
2026年6月,井英科技宣布完成数千万美元的A轮及A+轮融资,投资方包括王慧文家族办公室与蚂蚁集团等。公司定位于AI短剧赛道,致力于将生成式AI与Agent能力融合,打造从创作到分发的端到端闭环。
-
Mon Jun 08 2026【计算机】海外巨头融资提速,AI应用静待续催化——计算机行业6月投资策略展望
本报告从投资策略视角出发,分析了截至2026年6月计算机行业的资金流向与应用进展,强调海外巨头在本轮融资中的加速布局以及对下游应用生态的潜在影响。
-
Mon Jun 08 20262026年1-5月全球AI制药融资全景
本文系统盘点了2026年1至5月期间全球AI制药领域的重要融资事件与市场动向,解析资本如何围绕算法、数据与试验能力重构药物发现生态。
-
Mon Jun 08 2026华为云突放十几款 AI 新品!AI 云入口战,正式开打!
在INSPIRE创想者大会上,华为云发布了十几款围绕Agentic AI的新品,覆盖算力、存储、调度、记忆与运行环境,目标是为企业级智能体提供从开发到部署的全流程支持。
-
Mon Jun 08 2026宇信科技'星睿智调'入选'2026中国AI智能体领航者'榜单
宇信科技自研的'星睿智调'信贷尽调智能体被评为2026中国AI智能体领航者,成为金融行业智能体规模化应用的代表案例之一,展现出在尽职调查环节的高效能力。
-
Sun Jun 07 2026脑机接口、AR眼镜、智能体……,浙商如何抢抓AI风口
第23届浙商(投融资)合作周在杭州举行,聚焦智能体时代的裂变,讨论从具身智能到脑机接口与AR终端的技术与商业路径。
-
Sun Jun 07 2026“AI x开源鸿蒙” 智启新五年:Agent OS从概念走向系统,从系统走向生态,从生态走向真正的产业价值
在上海交通大学的开源鸿蒙城市技术论坛上,项目群技术指导委员会强调智能体时代需要新的操作系统范式,以系统层能力支撑概率性AI的确定性需求。
-
Sun Jun 07 2026脑机接口 、AR 眼镜、智能体……,浙商如何抢抓 AI 风口
第23届浙商(投融资)合作周在杭州召开,以'智能体时代的裂变'为主题,汇聚行业代表与投资人,共同探讨AI在传统产业中的应用与投融资机会。
-
Sat Jun 06 2026踏上AI +绿色发展新征程,中国铁建'铁骥'大模型重磅上线!
中国铁建发布'铁骥'大模型,作为面向全集团的自研智能底座,目标覆盖工程项目从勘察到运维的全流程,支持绿色建设与数字化管理。
-
Sat Jun 06 2026288核,Intel 18A制程,英特尔至强6+加速Agentic AI落地
英特尔在北京发布会上推出新一代至强6/6处理器,面向Agentic AI时代的数据中心需求,强调CPU在整体算力架构中的回归与重要性。
-
Sat Jun 06 2026中国电信研发云CodeFree荣获"2026中国AI智能体领航者"称号
中国电信研发云CodeFree在2026年评选中获得'通用智能体'方向称号,入选《2026中国智能体产业图谱》,其方案面向央国企研发痛点构建国产化芯片到研发工具链的全链路自主可控体系。
-
Sat Jun 06 2026大厂Agent天团已就位!AI智能体时代年度盛会进展公布,同期自进化智能体研讨会嘉宾揭晓
AgenticAICon 2026 将于杭州举办,作为聚焦AI智能体技术与应用的年度盛会,会议旨在连接学术、产业与投资三端,推动智能体技术的可落地发展。
-
Sat Jun 06 2026中国电信研发云CodeFree荣获“2026中国AI智能体领航者”称号
2026年6月,中国电信研发云CodeFree凭借其在通用智能体方向的技术突破与应用实践,被授予“2026中国AI智能体领航者”称号,并入选《2026中国智能体产业图谱》。
-
Fri Jun 05 2026达实召开生态伙伴大会,“AI+平台”实现快速迭代
达实智能在生态伙伴大会上展示AI Agent 2.0的演进速度与应用广度,强调通过AIoT平台和场景化模型快速复制落地,实现从单点到大规模场景覆盖的跨越。
-
Fri Jun 05 2026让AI深入产线!第三期『场景恳谈会』AI+制造业专场干货实录
第三期'场景恳谈会'聚焦 AI 在制造业的实际应用,来自企业与研究机构的案例展示说明 AI 智能体正从试点进入规模化部署阶段。
-
Fri Jun 05 2026智启新程,生态同行:2026高通汽车技术与合作峰会展现AI汽车新图景
2026高通汽车技术与合作峰会在无锡举行,聚焦AI智能体在汽车场景的落地与生态合作,展示了面向车载多模态交互、舱驾一体化和智能体验的解决方案。
