管中窥豹六月飞霜...
这是一个留言本,是由程序自动生成的页面,您可以对其进行任意操作。...
还有 63 人发表了评论 加入17181人围观这是一个留言本,是由程序自动生成的页面,您可以对其进行任意操作。...
还有 63 人发表了评论 加入17181人围观服务端升级了frp版本后发现无法连接了,看了一下日志有两个原因
使用python库scrapy在提取html内容的时候, 如果需要提取的标签中有em一类标签, 这时候使用text进行提取就会出现内容丢失,比如
go微架go-micro深度学园
这时候可以考虑手动提取, 或者使用lxml库中的etree
html = etree.HTML(html_text)
title = ''.join(html.xpath('.//text()'))
```<!--autointro-->