成人在线亚洲_国产日韩视频一区二区三区_久久久国产精品_99国内精品久久久久久久

您的位置:首頁技術文章
文章詳情頁

a標簽 url 正則怎么寫(python 或者js)

瀏覽:132日期:2022-07-17 17:06:50

問題描述

<a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a>

我要取 href里的鏈接

6個鏈接 前三個符合條件 正則怎么寫(即鏈接中必須帶有參數viewkey page viewtype category)

第二個和第三個鏈接相同 怎么去重復(python下)

問題解答

回答1:

# python 2.7import rea = ’’’<a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a>’’’print set(re.findall(’’’(?=.*(?:viewkey))(?=.*(?:page))(?=.*(?:viewtype))(?=.*(?:category))href=['’]([^’']+)’’’, a))回答2:

提取前三個鏈接:

links= re.findall(r’href='http://www.piao2010.com/wenda/(.*?=rf)'’,l_string,re.S)

去重:

new_links=set(links)

標簽: Python 編程
相關文章: