news 2026/2/2 21:45:53

【BUG】【Python】【爬虫】爬取加载中的数据

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【BUG】【Python】【爬虫】爬取加载中的数据

示例网页链接:https://movie.douban.com/subject/36907263/

BUG

浏览器开发者模式可以看到所需信息有对应的HTML显式结构

但代码爬取时发现结构被hidden,需要二次加载

importrequests url='https://movie.douban.com/subject/36907263/'headers={'User-Agent':'Mozilla/5.0'}response=requests.get(url,headers=headers)print(response.text)


即便使用selenium将修改type属性,让其不隐藏,再取出被隐藏的数据,也不行

fromseleniumimportwebdriver driver=webdriver.Chrome()driver.get('https://movie.douban.com/subject/36907263/')js="document.getElementById('red').type='text';"driver.execute_script(js)content=driver.find_element(by='id',value='red').textprint(content)driver.quit()



其实我觉得这个逻辑是对的,但结果非预期,求助是不是哪块代码没写对? T^T 想打印下修改后的HTML也没打印出来 o(╥﹏╥)o

DEBUG

Selenium 的核心功能是模拟用户在浏览器中的操作,所以只需要增加等待时间,等待页面全部加载出来即可。加载后的页面就是我们在浏览器开发者模式下看到的全部HTML结构。

fromseleniumimportwebdriverimporttime driver=webdriver.Chrome()driver.get('https://movie.douban.com/subject/36907263/')time.sleep(5)# 等待页面加载content=driver.find_element(by='id',value='info').textprint(content)driver.quit()


注意加载后要找的就是加载后的数据,即id=info,不再是之前的id=red。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/2 1:15:56

MiniMax的全球化之路:中国AI公司出海的新样本

MiniMax成立4年即实现73%海外收入,以Talkie、海螺AI为核心产品,凭借“生而全球化”战略,从底层架构适配全球市场,通过文化本地化运营和高效市场推广,在全球200多个国家及地区拥有2.12亿用户,为中国AI公司出…

作者头像 李华
网站建设 2026/2/1 20:22:15

2023年NOC大赛创客智慧编程赛项Python复赛模拟题(二)

更多内容和历年真题请查看网站:【试卷中心 -----> NOC ----> Python ----> 复赛】 网站链接 青少年软件编程历年真题模拟题实时更新 2023年NOC大赛创客智慧编程赛项Python复赛模拟题(二) 一、编程题 第 1 题 NOC大赛创客智慧编程…

作者头像 李华
网站建设 2026/2/2 17:35:53

SpringBoot整合Thymeleaf

一、Thymeleaf 简介Thymeleaf 是一款现代化的服务器端 Java 模板引擎,主要用于 Web 开发中渲染 HTML 页面,能够无缝集成 Spring Boot 框架。它的核心优势是:支持 HTML 原生语法,模板文件可直接在浏览器中打开预览(无后…

作者头像 李华
网站建设 2026/2/2 14:00:58

亲测好用!8个AI论文平台测评,研究生毕业论文必备

亲测好用!8个AI论文平台测评,研究生毕业论文必备 2026年AI论文平台测评:从功能到体验的深度解析 随着人工智能技术在学术领域的广泛应用,越来越多的研究生开始依赖AI工具来提升论文写作效率。然而,面对市场上五花八门的…

作者头像 李华
网站建设 2026/2/2 16:03:11

循环经济在不同行业的应用前景比较

循环经济在不同行业的应用前景比较 关键词:循环经济、行业应用、应用前景、可持续发展、资源利用 摘要:本文旨在深入探讨循环经济在不同行业的应用前景并进行比较。首先介绍了循环经济的背景知识,包括其目的、适用读者、文档结构和相关术语。接着阐述了循环经济的核心概念、…

作者头像 李华