【本文来自《欧洲议会:弃用谷歌》评论区,标题为小编添加】
都在用AI,也在说AI,不妨让AI来回答。
A和B对话如下:
A:都到 AI 时代了,欧洲还在折腾搜索引擎。
B:很奇怪的言论。没有搜索引擎,AI如何调用整合数据?DS不用博查的搜索引擎如何工作?
A:你在说什么??? AI需要的是结构化数据,没有结构化的只叫信息,搜索引擎只提供信息,不提供数据。
AI回答如下:
我们可以把争论拆解开来分析:
关于AI是否需要搜索引擎:B说的是对的,AI特别是大语言模型,确实需要搜索引擎作为外脑,来调用和整合外部数据,例如DEEPSEEK等模型在开户联网搜索功能时,底层正是依赖博查等第三方搜索提供的API来获取实进信息,如果没有搜索引擎提供实时的多源数据,AI就只能依预训练的知识库,无法处理时效性问题。
• A的盲区: A认为“都到AI时代了还在折腾搜索引擎”,这忽略了传统搜索与AI融合的趋势。目前业界的主流共识是“搜索 vs 对话不是二选一,而是融合”。无论是搜索引擎内置AI摘要,还是对话引擎支持实时搜索,两者都在互相借力。
关于结构化数据和搜索引擎
• A说对了一半,但概念有混淆。
o 对的地方在于: AI确实极度偏爱“结构化数据”。为了让AI能够精准理解和引用,内容创作者和企业需要进行GEO(生成式引擎优化),使用Schema.org等标记为网页添加结构化数据(如FAQ、产品信息等)。没有结构化的纯文本,AI解析起来确实更困难,被引用的概率也会大打折扣。
o 错的地方在于: A将“搜索引擎”和“信息/数据”完全对立起来了。事实上,现代AI搜索引擎本身就在做数据的提取与重组工作。虽然AI需要结构化数据作为基础,但搜索引擎依然是连接用户与海量非结构化互联网信息的桥梁。
• B的反驳很犀利,但也略显绝对。 B指出了AI对搜索引擎的依赖,但没有回应A关于“结构化数据重要性”的核心论点。在AI时代,传统的SEO(基于关键词密度的优化)确实在部分失效,取而代之的是更加注重内容权威性、语义覆盖和结构化程度的GEO策略。
你的AI在你不聪明的小脑瓜的提问下,AI没搞懂我们到底在讨论什么。
首先,AI不等于LLM,LLM只是AI的一个小分支,部分LLM使用和搜索引擎(广义上技术形态)的数据公司合作,就意味着“搜索引擎(狭义)”是AI的基础。
数据来源于信息,对信息抓取,整理,排序后,我们得到数据,对数据标注分类后得到结构化数据。
这里要突出的是搜索引擎,分广义与狭义,根据我们的上下文欧盟禁用谷歌开发了自己Qwant,我们既然在该问题下回答,那么我们讨论的话题应该是聚焦于狭义搜索引擎(即面向公众的搜索门户)。广义上搜索引擎是个技术概念,即抓取,检索,排序,索引,召回,联网,验证等能力,通过一套算法进行能力整合,我们获得了一个“搜索引擎”的技术方案,你如果想滚刀,坚称你一开始的表述就是广义的,那么你说的对,我在狭义话题下对你的广义理解存在误解,我们也没啥需要进一步讨论的必要,因为你说的对。
我不需要通过别的大模型和你进行讨论,当然也欢迎你继续通过大模型和我讨论,至少AI能让讨论变得有效。
顺便提一嘴,即使是广义上的搜索引擎,我也认为未来(或者当下已经)对于AI是非必需的(有部分步骤可以省略或拆分成若干个独立能力以提升效率),比如西门子有一套工业AI工具,利用内部知识库、业务系统、专业数据库、实验数据、代码库、日志、文档和结构化数据,训练出的工业AI,但我没法看到他的核心是通过搜索引擎还是其他数据处理的路径完成数据的调用。但理论上,如果在信息录入时,通过系统采集,已经标注好索引,时间戳,类别等,甚至数据集之间已经做好内在的逻辑构建,那么处理起来会很有意思,只要有万物互联且多纬度感知的能力,那么检索的损耗会大大降低。