2024年11月26日

419

LLM集成搜索引擎：OpenScholar带来的科研新突破

随着人工智能技术的迅猛发展，LLM（大型语言模型）的应用已经渗透到多个领域，其中搜索引擎成为了备受关注的热门方向。近年来，各大科技巨头纷纷布局这一赛道——从Perplexity的高调发布，到谷歌的Gemini和OpenAI的SearchGPT相继登场。值得注意的是，就在11月23日，搜索引擎领域的领军人物Darin Fisher加入OpenAI，这进一步表明：OpenAI不仅在探索基于大型语言模型开发的搜索引擎和浏览器，还可能对传统搜索领域带来颠覆性创新。尽管现有的LLM在处理日常问答场景中表现出色，但学术搜索领域仍面临重大挑战，仍需传统工具如谷歌学术来辅助。

随着学术文献数量的迅速增长，传统的人工筛选和阅读方式已然无法满足科研人员获取前沿信息的需求。一款优秀的学术搜索工具不仅要快速检索，还需具备高度精准性和信息溯源能力。然而，现有的ChatGPT开发和通用LLM往往面临幻觉问题以及依赖于过时预训练数据的局限性。例如在实验中，GPT-4在学术搜索任务中伪造参考文献的概率高达78%-90%。在这些背景下，检索增强型语言模型成为破解这一困境的关键，OpenScholar通过外接知识库与迭代生成技术，显著提升了学术搜索的可靠性与深入度。

科研场景需求加速推动AI定制开发

OpenScholar的研发被视为科研领域的重大突破。通过将检索增强融入到开源Langchain框架中，团队优化了模型在引用准确性和学科覆盖面上的表现。在单篇论文搜索任务中，OpenScholar的性能表现始终优于GPT-4和其他专用系统；在多论文任务中，其重新训练过的OS-8B和OS-70B模型展现出绝对领先的性能。例如，在生命科学（PubMedQA）和CS领域（Scholar-CS）的任务中，OpenScholar实现了较行业基准平均高出12%以上的准确率。

就在11月23日，有人发现搜索引擎大佬Darin Fisher正式加入OpenAI，这让人更加确信：SearchGPT只是一个开始，OpenAI也许会正式打造以LLM为基础的搜索引擎和浏览器，和谷歌展开一场正面battle。

“智东西”

OpenScholar：如何为科研赋能

尽管OpenScholar已经在科研领域取得了突破性成果，其未来优化的潜力仍然巨大。目前所使用的ScholarQABench数据集规模较小，且以计算机科学、生物医学、物理学为主，对于社会科学等其他学科覆盖不足。因此，未来的研究可以进一步扩展数据范围，增加高质量数据的自动化标注。此外，对于数据安全和版权合规性的讨论，也需在检索增强AI企业解决方案的开发过程中持续推进。

OpenScholar的推出标志着AI定制开发正在加速向更高端、更专业的场景迈进。从学术搜索引擎到领域特定的检索增强工具，AI已逐渐成为科研工作的推动力。通过结合Langchain框架与检索增强技术，OpenScholar展示了人工智能在未来协助学术研究的巨大潜力。对于教育和科研行业而言，这不仅是知识获取方式的变革，更是推动学术进步的重要驱动力量。将这些技术推广至更广泛的实际应用场景，例如面向教育领域的教育行业AI解决方案，或专注于税务咨询的税务行业知识问答AI，无疑还将进一步扩大AI带来的价值。而对于以杭州AI企业服务为代表的本地化团队而言，这也意味着在区域领域打造全球竞争力的机会。未来，AI技术将继续优化科研体验，让创新触手可及，让知识更便捷地服务于社会的每一个角落。

如有侵权，请联系删除。

体验企业级AI服务

联系产品经理，扫描下方企业微信二维码

LLM集成搜索引擎：OpenScholar带来的科研新突破

科研场景需求加速推动AI定制开发

OpenScholar：如何为科研赋能

体验企业级AI服务

Popular Articles

谷歌最强开源模型Gemma 2发布

字节豆包语音合成成果Seed-TTS技术揭秘

旷视发布开源AI人像视频生成框架MegActor：自然逼真的表情和动作

Related Articles

Meta与SSI上演AI人才争夺战，伊利亚接任CEO聚焦AI智能体开发

Figma如何借助AI推动SaaS创新，成为设计领域的基础设施

马斯克旗下xAI完成50亿美元融资，估值或突破千亿美元

苹果或将引入OpenAI与Anthropic大模型，为Siri注入全新AI功能

云知声成功上市，AI解决方案市场迎来新风口

如何选择AI大模型：实用指南与全新趋势

手机AI芯片大战：推动AI智能手机体验的关键战场

PPIO派欧云递表港交所，开创边缘计算与AI推理新时代

OpenAI首期播客上线：阿尔特曼深入探讨GPT-5与AI行业未来趋势

谷歌重磅发布Gemini 2.5系列模型，AI推理性能再创佳绩

月之暗面发布开源大模型Kimi-Dev-72B，引领AI智能体平台技术新高度

影石创新成功上市科创板，智能影像设备行业迎新发展机遇

AI推动实体经济智能化，百度智能云破局最后一公里

MOVA智能清洁生态大会：引领行业破局的新标杆

AI技术指数级发展，核心聚焦算法革新与开放生态

DeepSeek超越Anthropic和Meta，AI智能体分析指数跻身全球前二

苹果错失大模型版Siri 推理模型研究引争议

智能体研究综述爆火，AI Agents与Agentic AI技术趋势引关注

扣子空间推出一键文本生成播客功能，AI助力内容创作进入高效时代

Salesforce斥资80亿美元收购Informatica 强化AI智能体可信数据基础

AI大模型压缩技术革命：CBQ方案助力国产算力崛起

联想发布企业超级智能体，加速AI大模型商业化落地

美图携手阿里巴巴，达成2.5亿美元AI与电商领域战略合作

智能算力：AI大模型时代的新生产力

中科紫东太初：多模态AI国家队完成数亿元融资，加快AI商业化进程

未来智能推出AI耳机与智能体平台，探索垂直场景AI创新

打造AI软硬件协同：DeepSeek-V3的创新与未来方向

微软全新AI战略调整：裁员优化资源以推动AI业务发展

阶跃星辰的多模态AI探索：AGI时代的关键路径

深耕AI产业生态，北京展示顶级协同优势

华为推出鸿蒙电脑，全面迈入AI智能办公时代

谷歌DeepMind推出Gemini 2.5 ProI/O特别版，强化AI编程工具效能

OpenAI史上最大收购：AI编程独角兽Windsurf以30亿美元估值易主

小米发布MiMo大模型：以小规模参数引领AI推理新风向

Meta发布Llama API和Meta AI App，全力进军AI智能助手领域

大模型竞争迈入深水区，百度千帆平台引领AI应用变革

百度发布文心大模型4.5 Turbo：AI技术与多模态能力再升级

OpenAI预测2030年收入大幅增长，AI智能体或成商业化新引擎

Crusoe：深耕AI基础设施，成就AI行业典范

禾赛科技：激光雷达加速机器人行业应用落地

中国AI崛起闪耀大阪世博，中国馆AI孙悟空惊艳亮相

火山引擎发布豆包1.5深度思考模型，AI推理模型迎来全新升级

大模型「六小虎」首个IPO，智谱科技携开源模型GLM-4-32B系列强势助力AI产业

OpenAI揭秘GPT-4.5研发细节：从灾难到突破的进阶之路

国产AI医学影像大模型助力突围，开创医疗领域新格局

斯坦福发布：全球AI竞争加速，DeepSeek登上焦点舞台

具身智能重塑机器人赛道，新一代AI推动场景落地与技术迭代

百度发布端到端语音语言大模型，引领语音交互新时代

智能升级，积墨AI知识库全新上线，打造企业AI知识管理新标杆

智源研究院发布跨本体具身协作技术，推动AI智能体生态发展

阿里巴巴开源新一代多模态模型Qwen2.5-Omni-7B，引领AI技术潮流

打造高效智能的AI团队模式，助力行业创新

AI打造智能、高效的评估体系

智谱再次融资，携诸葛大模型赋能AI产业

腾讯混元推出开源3D模型，FlashVDM技术引领AI大模型应用新趋势

中绿讯科发布AI生态平台，加速企业数字化转型

先付后用：AI智能体付费场景应用新模式

高效获客场景：AI赋能企业增长的关键

谷歌Gemini 2.0升级，AI助手深度革新

谷歌推出DiLoCo训练方法，开启大模型训练新篇章

阿里通义实验室推出R1-Omni模型，革命性RLVR助力全模态大语言模型全面升级

谷歌重磅发布Gemma 3，单GPU运行，打造最强多模态AI模型

清华系AI大模型独角兽智谱完成5亿元融资，珠海AI产业迎来新突破

Manus的爆火：Agentic AI产品竞争优势探索

英伟达首发Mamba-Transformer混合视觉骨干网络

Manus掀起智能体复现热潮，DeepSeek成协作焦点

MCP协议引领智能体标准化革命，推动AI智能体平台新发展

Open Manus引爆国内市场，开源AI智能体竞赛白热化

广和通发布星云系列，推动端侧AI智能化变革

Meta推进世界模型，V-JEPA开启直观物理新纪元

积墨AI推出本地化部署方案，轻松接入DeepSeek-R1大模型