文章詳情頁

python - 正則表達式匹配html的問題。

瀏覽：82日期：2022-09-05 14:29:29

問題描述

<dd class='gray6'> 中文 中文 中文內容 #需要抓取的內容</dd>用BeautifulSoup html.parser解析的網頁，現在用re模塊想抓取**第7行**的中文內容，放在一個組里面（.*?）。正則老是匹配不上，用換行符也匹配不上，不知道怎么寫了。。。

問題解答

回答1：

既然你都用bs4解析了，為什么不用它提取哪？bs4內有一個stripped_string的函數正好滿足你的需要。

回答2：

import repattern = re.compile(r’.*?(.*?)</dd>’, re.S)str = ’’’<dd class='gray6'> 中文 中文 中文內容 #需要抓取的內容</dd>’’’print(pattern.search(str).group(1))===> 中文內容 #需要抓取的內容回答3：

const re = /^(.*)</dd>$/

這樣可以不?

Python 編程

上一條：python - 這段函數如何改寫比較優雅?下一條：python - 如何在scrapy中帶cookie訪問？

相關文章：

1. node.js - mysql如何通過knex查詢今天和七天內的匯總數據2. mysql 插入數值到特定的列一直失敗3. 360瀏覽器與IE瀏覽器有何區別？？？4. mysql - 百萬行的表中是否盡量避免使用update等sql語句？5. python - 在使用Pycharm時經常看到如下的樣式，小括號里紅色的部分是什么意思呢？6. Python從URL中提取域名7. javascript - 新浪微博網頁版的字數限制是怎么做的8. 怎么在網頁中設置圖片進行左右滑動9. javascript - 豆瓣的這個自適應是怎么做的？10. javascript - 用jsonp抓取qq音樂總是說回調函數沒有定義

排行榜

					
					android - MIUI8短信權限問題
angular.js - 在angular中，使用ng-repeat循環輸出一個列表，然后節當中具體的一個參數值（是數值），然后整個循環節的值總數相加
代碼如下，java用BigDecimal四舍五入怎么還有問題呀？哪種方式是完全沒有問題的？
angular.js - angularjs ng-repeat 不能刷新
javascript - 如何讓手機端的代碼只能在手機端執行，在pc端的模擬器里面也不執行
android - 安卓使用webview播放騰訊、優酷視頻的方法
javascript - vue如何偵聽change事件實現雙向綁定的？
android-studio - Androidstudio運行時報錯
java - Spring使用@Autowired失效但是getBean()可以執行成功
微信開放平臺 - android 微信支付后點完成按鈕，后回調打開第三方頁面，屏幕閃動，求解決方法
java - 所有類都是由Object類的記載器加載的嗎？
				

熱門標簽

成人在线亚洲_国产日韩视频一区二区三区_久久久国产精品_99国内精品久久久久久久

python - 正則表達式匹配html的問題。