然后您可以从网页中提取独特的信息。 URL 列表中。你可以引入 H1、规范等各种各样的东西,而且它可以非常轻松地大规模地进行操作。我最喜欢的从 URL 中提取内容的方法之一是使用 Python 中的 xpath。 它比看上去的要简单。因此,对于某些网站来说,它可能是 XPath,但网站的标记方式不同。
因此,当您尝试从特定网站提取某些内容时,您可以在 Chrome 开发者工具 洪都拉斯电报数据库 中单击鼠标右键。在 Chrome 开发者工具中,您可以右键单击要使用 Python 抓取的内容。 您只需选择“复制 XPath”,它就会为您提供该网站的精确 XPath,如果您对此感兴趣的话,这是一种有趣的技巧。 图书馆 什么是图书馆?我们怎样才能让这个东西尽可能的强大呢? Python 本身已经非常强大,但这些可以做不可思议的事情的库或包让它变得更加强大。
这只是可以执行数据收集、清理、可视化、处理和部署等任务的库的一小部分。我最喜欢的获取一些更流行软件包的方法之一就是下轿因为它附带了最常用、最流行的软件包. 所以这是一个将它们全部(或至少大部分)集中到一个地方的好方法。 了解更多 所以,您已经对 Python 有了一定的了解,并且了解了 Python 是什么以及人们用它做什么。