从“搜索”到“执行”:互联网入口的转移
关键词:互联网入口、大模型、AI Agent、意图识别、端侧搜索、知识图谱、自然语言交互
摘要:本文将用“小学生逛菜市场”“图书馆借书记”“外卖平台秒下单”这类生动的生活类比,一步一步带你梳理互联网入口30年的三次重大转移:从门户导航(货架找店)到搜索引擎(关键词问书)再到AI驱动的“执行入口”(说句话就有人跑腿)。我们会拆解搜索和执行的核心技术差异、用Python手写简化版的意图识别AI Agent、聊聊互联网大厂的布局案例、以及普通人能抓住的未来小趋势。全文没有晦涩的术语堆砌,只有清晰的逻辑和好玩儿的代码!
背景介绍:原来互联网入口是“谁先抢到用户第一句话”
目的和范围
这篇文章不是要教你写大厂的搜索引擎或者完整的AI Agent(那需要几百人团队+百万级GPU集群),而是要:
- 搞懂本质:什么是互联网入口?为什么它能决定互联网公司的生死?
- 理清脉络:用逛30年不同“消费/信息场景”的方式,复盘从1994年到2024年的三次入口大转移。
- 触摸技术:用Python写3个小玩具——1990年代的静态导航页、2000年代的反向索引搜索、2020年代的“问天气报菜名写清单”三合一简化AI Agent,让你亲手摸到入口的“心脏”。
- 看到未来:聊聊现在大厂在做什么“执行入口”、端侧搜索和大模型的结合会带来什么、普通人如何用AI工具打造自己的“微型执行入口”。
预期读者
- 对互联网感兴趣的普通人:想知道为什么百度、阿里、字节跳动能成为巨头?为什么现在打开手机第一件事可能是微信或者抖音,而不是浏览器的搜索框?
- 刚入门的程序员/产品经理:想了解搜索和AI Agent的核心技术逻辑,为以后的职业发展打基础。
- 想创业的小团队:想找到互联网入口转移中剩下的“小缝隙”,做个小而美的产品。
文档结构概述
我们的探索之旅会像玩一场“时空穿越游戏”:
- 第一关:1994-2000年的“货架入口”(门户时代):逛1990年代的“互联网百货商店”,比如雅虎、搜狐、新浪,看看它们是怎么把网站像货架上的商品一样摆出来的。
- 第二关:2000-2020年的“问书入口”(搜索时代):去2000年代的“超级图书馆”,比如Google、百度,看看它们是怎么用“关键词问书架管理员”的方式,帮你找到想要的信息的。
- 第三关:2020年至今的“跑腿入口”(执行时代):到2024年的“AI家政+外卖+快递+私人助理”超级服务中心,比如ChatGPT Plus with Actions、文心一言插件、微信豆包,看看它们是怎么“听到你的一句话,就帮你把所有事做完”的。
- 技术实验室:亲手做3个小玩具,从静态HTML到反向索引Python代码再到用OpenAI API的简化AI Agent。
- 未来展望厅:看看现在的趋势,聊聊普通人的机会。
- 闯关小测试:给你留3个小问题,看看你有没有完全掌握。
术语表
为了让大家“逛得更顺畅”,我们先把几个后面会反复用到的“小道具”解释清楚:
核心术语定义
- 互联网入口:就像你每天出门的第一扇门——从这扇门出去,你才能到达想去的所有地方(网站、APP、服务);谁能把门放在你家门口最显眼的地方,谁就能控制你今天的“行程”(流量、广告、交易)。
- 静态导航页:就像1990年代百货商店门口贴的“楼层导购图”——楼层、柜台、商品都是提前贴好的,不会随便变;你要找东西,就得自己一层一层翻,或者记住导购图上的位置。
- 反向索引:就像超级图书馆里的“书名/作者索引卡柜”——管理员不是把所有书按上架顺序堆起来(正向索引),而是把每本书里的关键词都抄下来,写在小卡片上,每个小卡片对应一本书的编号;你问“红烧肉怎么做”,管理员就去索引卡柜找“红烧肉”“怎么做”的卡片,把对应的书都找出来给你。
- 意图识别:就像AI家政服务员的“耳朵和脑子”——你说“今天北京好热啊”,她不是只听到“北京”“热”两个词,而是听懂你“可能想知道今天北京的最高气温”“可能想让我帮忙订一杯冰奶茶”“可能想让我提醒你下午出门带伞遮阳”这几个潜在的意图。
- AI Agent:就像一个“会自己思考、会自己查资料、会自己用工具、会自己把事情做完的私人AI助理”——你说“下周三下午2点到4点帮我在北京国贸附近订一家有投影设备、能坐10人的会议室,预算5000块以内,还要帮我通知3个同事”,它会自己查天气(怕下周三堵车提前调整时间?不对哦预算是会议室的)、自己查会议室预定平台、自己筛选符合条件的、自己下单、自己用企业微信通知同事——整个过程你只需要说一句话。
相关概念解释
- 流量:就像百货商店门口的人流量——每天有多少人从这扇门进来,就有多少“潜在的客户”;互联网公司把这些流量卖给广告商,或者自己在门口开个“小卖部”(电商、游戏)赚钱。
- 变现模式:就像百货商店的赚钱方式——要么收“摊位费”(给雅虎、新浪交广告费,把自己的网站放在导购图的显眼位置),要么收“交易抽成”(给淘宝、京东交佣金,卖东西的时候抽走一部分钱),要么“自己卖东西”(字节跳动自己做游戏、做电商、做教育)。
- 端侧搜索:就像你手机里自带的“本地搜书工具”——不用联网去超级图书馆,直接在自己的手机相册、通讯录、备忘录、聊天记录里搜;速度快,还不会泄露隐私。
- 知识图谱:就像你脑子里的“人际关系网+百科全书网”——你知道“北京是中国的首都”“红烧肉需要用到猪肉、酱油、冰糖”“张小明是我的同事,他的企业微信账号是xiaoming.zhang”;知识图谱就是把这些“实体”(北京、中国、红烧肉、猪肉、张小明)和“关系”(是首都、需要用到、是同事)用计算机语言存起来的一个大网络。
缩略词列表
- NLP:Natural Language Processing,自然语言处理——就像AI的“翻译官+语文老师”,能听懂人类说的话,也能写出人类能看懂的话。
- LLM:Large Language Model,大语言模型——就像一个“读了全世界所有书(差不多)的超级语文老师+百科全书作者”,能回答各种问题,能写文章,能写代码,还能画画(有些模型能)。
- API:Application Programming Interface,应用程序接口——就像两个“公司”之间的“专用电话线”——比如你的AI Agent想订会议室,就可以通过美团会议室的API“给美团打电话”,告诉它你的需求,美团再通过API“给你回电话”,告诉你符合条件的会议室。
- HTML:HyperText Markup Language,超文本标记语言——就像“写楼层导购图的笔和纸”——用它可以把文字、图片、链接组织起来,做成一个网页。
时空穿越第一关:1994-2000年的“货架入口”(门户时代)
故事引入:逛1996年的“中国互联网百货商店”
1996年,张小明的爸爸张大伟(假设是北京的一个大学计算机老师)第一次买了一台电脑,还装了调制解调器(就是我们常说的“猫”,拨号上网的时候会发出“吱吱吱”的声音),花了好几千块钱——差不多是当时张大伟半年的工资!
张大伟打开电脑,装上了Netscape Navigator浏览器(当时最火的浏览器,就像现在的Chrome),然后输入了一个网址:www.sohu.com(哦不对,搜狐是1998年成立的,我们换www.yahoo.com吧,雅虎是1994年成立的)。
哇!屏幕上出现了一个花花绿绿的网页——这就是当时的“互联网百货商店”!网页上有很多“楼层”:新闻、体育、娱乐、科技、教育、购物……每个“楼层”下面又有很多“柜台”:比如新闻下面有“人民日报”“光明日报”“新华社”的链接;科技下面有“微软中国”“IBM中国”“联想中国”的链接;购物下面有“亚马逊中国”(哦不对,亚马逊中国是2004年收购卓越网才有的,我们换“8848.net”吧,8848是1999年成立的中国第一家B2C电商网站)的链接。
张大伟想找“北京今天的天气预报”——他得先点“新闻”楼层,再找“天气预报”柜台(有时候可能找不到,因为当时的导航页更新很慢,或者根本没有这个柜台);如果找不到,他就得自己记住天气预报的网址,下次直接输入——这就像你每次去百货商店买酱油,都得自己记住“二楼食品区调味品柜台第三排第二个货架”,如果百货商店搬家了,你就得重新找!
张大伟又想找“红烧肉的家常做法”——当时的导航页可能根本没有“美食”楼层,就算有,也可能只有几个“美食网站”的链接,比如“美食天下”的前身“中华美食网”;他得点进去那个美食网站,然后自己在网站里找“红烧肉”的菜谱——这就像你去百货商店买一本菜谱,但是导购图上只写了“二楼图书区”,你得自己进去一本一本地翻!
这时候,张大伟心里想:要是有一个“超级管理员”,我直接问他“北京今天的天气预报”“红烧肉的家常做法”,他就能直接把我带到对应的地方,那该多好啊!
核心概念一:静态导航页——提前贴好的楼层导购图
刚才故事里的雅虎、早期的搜狐新浪,用的就是静态导航页。我们可以用小学生能看懂的语言再解释一遍:
- 静态导航页就像百货商店门口贴的纸质楼层导购图:
- 导购图上的内容是提前由人工编辑好的——就像百货商店的经理每天下班前会检查一下导购图,看看有没有新的柜台入驻,有没有旧的柜台搬走,然后用胶水贴上去或者撕下来;
- 导购图的内容更新很慢——因为人工编辑需要时间,比如早期的雅虎,每天只有几个编辑在更新导航页,可能一个星期才会更新一次;
- 你要找东西,只能自己一层一层翻导购图,或者记住具体的网址——就像你去百货商店买东西,不能问经理,只能自己看导购图,或者记住柜台的位置;
- 导购图的顶部和右侧通常是“黄金位置”——就像百货商店门口的第一排柜台,人流量最大,所以广告商愿意花很多钱把自己的网站放在那里;这就是早期门户的主要变现模式:收广告费。
核心概念二:URL(统一资源定位符)——柜台的具体地址
刚才故事里张大伟输入的www.yahoo.com,就是一个URL(统一资源定位符)。我们可以用小学生能看懂的语言再解释一遍:
- URL就像柜台的具体地址:比如“北京市朝阳区建国路88号SOHO现代城B座2层食品区调味品柜台第三排第二个货架”——这就是一个具体的地址,你可以直接打车过去;
- URL的格式通常是“协议://域名/路径”:比如“https://www.baidu.com/s?wd=红烧肉”——
- “https://”是协议:就像你打车用的“滴滴出行”或者“高德打车”,约定了你和司机之间的沟通方式;
- “www.baidu.com”是域名:就像“SOHO现代城B座”,是一个容易记住的名字;
- “/s?wd=红烧肉”是路径和参数:就像“2层食品区调味品柜台第三排第二个货架”,告诉你具体的位置和你要找的东西。
核心概念原理和架构的文本示意图
我们可以用一个简单的文本示意图来表示门户时代的互联网架构:
用户电脑 → Netscape Navigator浏览器 → 输入雅虎的URL → 互联网(通过调制解调器拨号) → 雅虎的服务器 → 返回静态HTML导航页 → 用户电脑屏幕显示导航页 → 用户点击导航页上的链接 → 互联网 → 对应网站的服务器 → 返回该网站的静态HTML → 用户电脑屏幕显示该网站