By 张伟
2024年11月14日
24
419
AI解决方案的发展和挑战:从大型语言模型到常识推理
自从2022年ChatGPT开发以来,大型语言模型开发进入了快速发展的阶段。然而,即使在这些先进的AI系统中,实现机器对「常识」的完整理解仍然是个挑战。尽管AI定制开发已经在许多领域展现了巨大潜力,比如提供AI企业解决方案和优化企业效率,但在处理常识推理方面,现有技术仍具有局限性。人类对物理定律的直觉理解和社交互动中的背景信息很自然,而这种「常识」对机器来说却不那么容易量化和实现。
评估测试
当前,用于评估AI常识推理能力的测试,至少有75%是多项选择题。然而,这些测试大多只能提供模棱两可的反馈,因为AI应用定制服务无法通过这种方式完全揭示出模型的实际常识能力。例如,即使向模型提出相似的问题,回答也可能会有很大不同。这表明需要更有效的测试方案来评估AI在不同领域内的常识推理能力,这一点对Langchain框架等AI模型尤为关键。
有效解决复杂问题
为了提升AI的常识推理能力,可以考虑让模型解释其答案背后的推理逻辑。通过模拟人类的直觉推理和逻辑分析,AI系统开发可以更有效地解决现实世界中的复杂问题。这种方法不仅可以提高模型的准确性,还为未来AIGC软件服务提供了新的开发方向。让AI从受训过程中学习如何生成有逻辑的回答,而不仅仅是通过记忆匹配找到答案,这对于提高机器的常识能力至关重要。
LLM非常善于在涉及记忆的测试中取得高分,比如GPT-4最为人称道的成绩之一,就是可以通过美国的医生和律师执业考试,但依旧很容易被简单的谜题搞迷糊。
“智东西”智能解决方案
尽管在评估AI能力方面还有很多工作要做,结合来自认知科学、哲学等领域的知识可能是不错的出路。通过杭州AI定制开发和浙江AI解决方案的努力,正在构建一种能更好理解物理世界和复杂环境中的AI系统。这样的系统不仅能够在教育和税务等行业应用提供智能解决方案,还能在其他领域如自动驾驶中展现出强大的感知与导航能力。
挑战与机遇
总之,虽然构建拥有真正常识的AI系统仍然有许多挑战,但通过多学科的联合探索和AI模型训练的持续改进,我们正朝着这个目标不断迈进。这种努力不仅会推动ChatGPT在企业中的应用成熟,还将促进人们对自己和身边世界的理解,从而在经济和社会的多个领域创造更多价值。
如有侵权,请联系删除。
Related Articles
-
Sun Jun 07 2026脑机接口 、AR 眼镜、智能体……,浙商如何抢抓 AI 风口
第23届浙商(投融资)合作周在杭州召开,以'智能体时代的裂变'为主题,汇聚行业代表与投资人,共同探讨AI在传统产业中的应用与投融资机会。
-
Sat Jun 06 2026288核,Intel 18A制程,英特尔至强6+加速Agentic AI落地
英特尔在北京发布会上推出新一代至强6/6处理器,面向Agentic AI时代的数据中心需求,强调CPU在整体算力架构中的回归与重要性。
-
Sat Jun 06 2026中国电信研发云CodeFree荣获“2026中国AI智能体领航者”称号
2026年6月,中国电信研发云CodeFree凭借其在通用智能体方向的技术突破与应用实践,被授予“2026中国AI智能体领航者”称号,并入选《2026中国智能体产业图谱》。
-
Sat Jun 06 2026中国电信研发云CodeFree荣获'2026中国AI智能体领航者'称号
中国电信的研发云產品CodeFree在2026中国AI智能体领航者评选中获得通用方向智能体称号,体现了其在研发场景中应用智能体的实力与创新能力。
-
Fri Jun 05 2026达实召开生态伙伴大会,“AI+平台”实现快速迭代
达实智能在生态伙伴大会上展示AI Agent 2.0的演进速度与应用广度,强调通过AIoT平台和场景化模型快速复制落地,实现从单点到大规模场景覆盖的跨越。
-
Fri Jun 05 2026智启新程,生态同行:2026高通汽车技术与合作峰会展现AI汽车新图景
2026高通汽车技术与合作峰会在无锡举行,聚焦AI智能体在汽车场景的落地与生态合作,展示了面向车载多模态交互、舱驾一体化和智能体验的解决方案。
-
Fri Jun 05 2026智启新程,生态同行:2026高通汽车技术与合作峰会展现AI汽车新图景
在无锡举行的高通汽车技术与合作峰会上,高通展示了面向汽车的AI能力,强调汽车正演进为重要的移动智能体载体,并提出了舱驾一体的交互愿景。
-
Fri Jun 05 2026Agentic AI风口已至!聚焦Agent最火的九个方向,年度AI智能体大会7月开幕
2026中国AI智能体大会将于7月2-3日在杭州举办,主题为“范式跃迁 重塑世界”,大会聚焦智能体技术的前沿方向与产业应用,邀请了大量来自企业与学界的专家。
-
Fri Jun 05 2026智启新程,生态同行:2026高通汽车技术与合作峰会展现AI汽车新图景
在2026高通汽车技术与合作峰会上,高通中国区领导指出2026年将成为“智能体之年”,并展示了其面向智能体的车载计算、感知与软件平台,强调汽车将成为智能体AI最重要的移动载体。
-
Fri Jun 05 2026汤道生对谈姚顺雨,回答关于腾讯AI的一切
在腾讯云 AI 产业应用大会上,腾讯高层就公司在 AI 下半场的战略与产品做出详细阐述,重点介绍面向企业的效率智能体与办公套件,旨在将智能体能力直接嵌入企业工作流中以提升生产力。
-
Fri Jun 05 2026华为云发布Agentic AI系列新品 打造智能时代“硅基黑土地”
在INSPIRE创想者大会上,华为云正式提出Agentic Infra新范式,并同步发布一系列面向企业级应用的Agentic AI产品,目标是为智能体时代提供从算力到平台的完整基础设施。
-
Fri Jun 05 2026选型、演进、实战:腾讯云AI产业应用大会,16个专场拆解Agent产品底层逻辑
腾讯云组织的AI产业应用大会聚焦Agent技术在产业场景的落地与工程化,安排16个专场从基础设施到应用实践全链路讨论,面向开发者、产品与决策者。
-
Fri Jun 05 2026华为云发布Agentic AI系列新品 打造智能时代"硅基黑土地"
在INSPIRE创想者大会上,华为云正式提出Agentic Infra新范式,展示面向企业的端到云一体化能力,强调通智一体化基础设施对企业智能体落地的重要性。
-
Fri Jun 05 2026中国信通院即将发布2026年首批可信AI智能体评估结果
中国信息通信研究院将于6月9日召开智能体高质量发展研讨会,并发布2026年上半年可信AI智能体评估结果,为行业提供评估结论与改进建议。
-
Fri Jun 05 2026华为云发布Agentic AI系列新品 打造智能时代'硅基黑土地'
在INSPIRE创想者大会上,华为云正式提出Agentic Infra新范式,展示了面向企业的Agentic AI系列新品,旨在通过算力、模型和工程平台的协同,为企业级智能体提供可控且高效的基础设施。
-
Fri Jun 05 2026浪潮海岳智能体荣膺'2026中国AI智能体领航者'
浪潮数字企业旗下的海岳智能体在2026中国AI智能体领航者榜单中获得认可,其面向基建工程的施工方案编制智能体展示了将行业知识与多智能体协同应用于工程场景的能力。
-
Thu Jun 04 2026达实智能召开生态伙伴大会,“AI+平台”实现快速迭代
在生态伙伴大会上,达实智能展示了其AI Agent 2.0的演进成果,强调通过平台化、模块化的方式实现智能体在不同场景中的快速复制与迭代。
-
Thu Jun 04 2026据称推进微信 AI Agent,14 亿用户入口待合规
消息显示,腾讯已在内部测试微信AI Agent的原型,目标是将智能体能力嵌入微信丰富的生态中,不仅限于聊天对话,而是帮助用户在支付、小程序与内容服务间完成复杂任务。
