Python爬虫如何解析HTML页面

628 ℃

Python爬虫如何解析HTML页面,下面web建站小编给大家简单介绍一下!

具体语法如下:​

import re
html = '''
<!DOCTYPE html>
<html>
<head>
  <meta charset="utf-8">
  <title>这是页面标题</title>
</head>
<body>
  <div class="content">
    <h2>这是一级标题</h2>
    <p>这是一段文本</p>
  </div>
  <div class="footer">
    <p>版权所有 © 2021</p>
  </div>
</body>
</html>
'''
pattern = re.compile(r'<div class="content">.*?<h2>(.*?)</h2>.*?<p>(.*?)</p>.*?</div>', re.S)
match = re.search(pattern, html)
if match:
  title = match.group(1)
  text = match.group(2)
  print(title)
  print(text)

python爬虫如何利用Requests获取网页内容

标签: python爬虫, Python解析HTML

上面是“Python爬虫如何解析HTML页面”的全面内容,想了解更多关于 前端知识 内容,请继续关注web建站教程。

当前网址:https://m.ipkd.cn/webs_4768.html

声明:本站提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请发送到邮箱:admin@ipkd.cn,我们会在看到邮件的第一时间内为您处理!

生活小工具

收录了万年历、老黄历、八字智能排盘等100+款小工具!生活小工具
啵啵动漫:助你开启二次元的奇幻之旅
如何利用bootstrap4自动组件设置进度条
php语法如何利用循环在多维数组查询某个值
现在用户使用移动搜索的三种情况介绍
如果新站没有上排名怎么办?