文稿:
主持人:哈喽大家好,欢迎收听,我们的播客。今天我们来聊一聊,这个联著的这个档案智能开放审核系统。在接入了 DeepSeek 之后他的这个智能化的提升以及怎么去缓解这个 AI 可能会产生的幻觉的问题。嘉宾:听起来很有意思哎那我们就直接开始吧直接开始深入了解一下这个系统到底带来了什么新的东西。主持人:哎,那我们先来问第一个问题就是联著实业。在把这个 DeepSeek 接入到他们的这个档案智能开放审核系统的过程当中,到底实现了哪些突破同时又遇到了什么挑战?嘉宾:就是这个联著实业他们是做了这个 DeepSeek 大模型的一个本地化的部署。然后把这个档案的智能化的应用和这个算力成本的一个节约和这个模型的开源的优势啊做了一个深度的结合。同时呢他们还使用了自己的这个语义工程的技术啊来缓解这个。大模型很容易产生的幻觉的问题。最终呢是提升了这个系统的一个可解释性,给这个客户呢带来了一个更加高效。精准安全的一个档案管理的一个服务。主持人:那我想问一下就是这个 DeepSeek 具体给这个联著的这个档案智能开放审核系统带来了哪些价值?然后它的应用前景会是怎么样的?嘉宾:就是这个系统呢它有一个非常独特的地方就叫做划控理由原文摘录。就是它会在这个原来的这个检测结果的基础上,它会进一步的去摘录原文。或者说归纳这个表格的内容然后并且呢它还可以一键导出这个Excel 的表格,让这个复核的人呢就不用再去。反复地看原文了,这是一个非常大的效率上的提升。主持人:听起来真的很智能啊,那它还有什么其他的优势吗?嘉宾:当然他的这个自然语言处理的能力也非常的强,他能够很精准的去理解语义啊。然后呢,呃也会避免一些误判啊或者说遗漏。他也会去结合一些语言模型和词典啊来做一些 OCR 的结果的校正。对这个都是非常高效的。他也可以秒级的去解析一些复杂的表格做一些摘要。同时呢他还做到了这个数据不出域。呃也做到了这个模型的轻量化的部署,对所以他的这个应用场景就会非常的广。主持人:哎那这个,AI 的这个幻觉问题一直都挺被人诟病的嘛对这个 DeepSeek 它这个幻觉是怎么产生的?然后会带来哪些具体的问题呢?嘉宾:就是这个幻觉其实就是说,他会生成一些内容啊这些内容呢。可能是与事实不符的啊或者说他的逻辑是有问题的啊或者说他跟上下文是无关的。他就是,本质上是因为这个模型他是基于统计概率去做的一个。呃合理的猜测,但是呢这个就会导致他可能会有一些偏差。对然后这些偏差呢可能是来自于他的训练数据有一些错误或者说数据太片面了或者说他对于一些。非常复杂的场景他没有办法去很好的泛化,他也没有办法去动态的更新他的一些知识。他也会对于一些用户的模糊的提问啊去。自由发挥啊,就会产生一些。嘉宾:是啊,那这个,虚假的信息就会导致。决策的失误嘛对然后他的这个泛化能力不好的话就会让这个模型的可用性就下降嘛。还有一些可能会有一些法律上的问题合规的问题。对所以这个解决这个幻觉的问题是需要。技术上的优化啊数据的清洗,甚至一些伦理的规范一起。才能够,确保这个 AI 系统的一个可靠性和安全性。主持人:联著实业是怎么去针对这个 DeepSeek 模型的这个幻觉的问题做优化的?然后这对于档案行业来说又意味着什么呢?嘉宾:就是他们,在这个档案开放审核系统里面内置了他们自己的一个语义知识库。然后呢这个知识库呢就会去把这些专业的知识啊和这些规则。注入到这个模型里面去,让这个模型呢可以更准确的去理解这个。具体的场景啊减少他的一些自由发挥。嘉宾:是啊然后他们还研发了一个语义分析引擎,去对他的这个输出进行一个约束和校验。把那些不合理的内容啊都过滤掉。另外呢就是他们还会。把这个审核的过程当中的一些高质量的数据啊沉淀下来去。微调这个模型,让这个模型可以不断地去适应这个档案审核的这个要求,最终呢就是提升了这个效率啊也降低了他的这个应用的成本啊,也给这个档案行业的这个数智化转型提供了一个更安全高效的一个解决方案。主持人:对今天我们聊了这个联著实业他们是怎么通过这个引入 DeepSeek 并且结合自己的这个语义工程的技术。给这个档案的智能开放审核系统带来了一个智能化的跃升。然后同时呢也缓解了这个 AI 模型很容易出现的这个幻觉的问题。对反正我觉得还是挺让人兴奋的一个话题也让我们看到了技术的这种。无限的可能性。嘉宾:以上就是这期播客的全部内容啦然后感谢大家的收听咱们下期再见拜拜!