1赞

4回答

0收藏

求教爬取丁香医生网页的隐藏信息

问答交流 问答交流 1059 人阅读 | 4 人回复 | 2022-05-22

网站:https://drugs.dxy.cn/

想要抓取每个‘药类分类’下面的具体药品信息,但是在F12查看之后发现,当前页面只能看到第一个分类中“消化道及代谢”的数据,后面的类别都被隐藏起来了,见下图。
想问下碰到这种问题,应该怎么办?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
分享到:
回复

使用道具 举报

回答|共 4 个

shinsbo

发表于 2022-5-23 09:40:53 | 显示全部楼层

所有的隐藏数据都写在源代码里面呀,你查看源代码,然后搜索__NEXT_DATA__
回复

使用道具 举报

wushiguize

发表于 2022-5-23 13:00:06 | 显示全部楼层

shinsbo 发表于 2022-5-23 09:40
所有的隐藏数据都写在源代码里面呀,你查看源代码,然后搜索__NEXT_DATA__

那怎么把源代码里的nextdata后面的内容爬出来呢?
回复

使用道具 举报

shinsbo

发表于 2022-5-23 23:06:06 | 显示全部楼层

wushiguize 发表于 2022-5-23 13:00
那怎么把源代码里的nextdata后面的内容爬出来呢?

这就是个json,读取一下数据就出来了。
建议你先学习一下正则和json,这些都是爬虫的基础。
回复

使用道具 举报

wushiguize

发表于 2022-5-24 11:52:28 | 显示全部楼层

shinsbo 发表于 2022-5-23 23:06
这就是个json,读取一下数据就出来了。
建议你先学习一下正则和json,这些都是爬虫的基础。 ...

嗯,我看了下源代码确实是json,已经解决啦~本来以为会有其他的问题呢,谢谢咯
回复

使用道具 举报

23 积分
1 主题