近日,中国科学院东莞材料科学与技术研究所(简称“东莞材料所”)正式发布MatChat 2.0,这是国内首个专注于材料科学领域的AI智能体的全新升级版。相较于前代产品,MatChat 2.0在知识库规模、推理能力、响应效率以及场景覆盖等核心维度均实现了显著提升,可为广大科研工作者提供一种全新的文献检索与知识获取方式。
记者了解到,MatChat 2.0基于超过80万篇精选学术论文构建而成,涵盖材料科学的各个分支领域,包括但不限于新能源材料、电子信息材料、结构材料、生物医用材料等。这一庞大的知识库内容均来源于权威学术期刊与会议论文,经过经过严格筛选与质量把控,确保信息的可靠性与前沿性。
本次升级主要体现在四个方面:知识库规模方面,从原有的28万篇拓展至80万篇以上,知识储量增长近三倍,这意味着此前难以检索到的大量前沿研究成果如今可以轻松获取。
响应效率方面,引入全新的动态路由算法与知识检索优化技术,平均响应时间压缩至秒级,实现即时文献调研支持。
领域理解方面,系统采用四层协同架构:智能上下文持久层支持十余轮持续深度对话;意图分类与路由层精准识别用户需求,有效过滤无效信息干扰;智能体推理与执行层兼顾深度思考与快速响应两种模式;学术知识数据库引擎整合近百万量级的权威文献资源,共同保障复杂研究场景下的连贯交互体验与专业理解。
应用场景方面,覆盖材料合成与制备、性能表征与测试、学术论文撰写、项目申报等多个环节,可为科研工作提供专业、智能、可靠的支持服务。
长期以来,大模型的“幻觉”问题始终是制约其在学术领域深入应用的核心障碍。AI生成看似合理但实际并不存在的论文引用,可能导致研究结论出现偏差,甚至危及科研人员的学术声誉。传统通用大模型在专业领域的幻觉率通常高达10%以上,这一比例显然难以满足科学研究对严谨性的要求。
MatChat 2.0在这方面取得了突破性进展。记者了解到,MatChat 2.0的幻觉率仅为1.3%,大幅领先于GPT-4.1(5.6%)、DeepSeek-V3(6.1%)、Llama-3.3(4.1%)以及Grok-3(5.8%)等主流大模型 (数据来源:Vectara Hallucination Leaderboard)。
MatChat 2.0由东莞材料所主导发布,是其“AI+Science”战略部署的重要一环。作为粤港澳大湾区重要的材料科学创新高地,东莞材料所聚焦信息材料、能源材料、功能陶瓷、先进金属等领域研究,正加快抢占新材料领域科技制高点。(中国日报社广东记者站 编辑:邱铨林)