a標簽 url 正則怎么寫(python 或者js)
問題描述
<a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a>
我要取 href里的鏈接
6個鏈接 前三個符合條件 正則怎么寫(即鏈接中必須帶有參數viewkey page viewtype category)
第二個和第三個鏈接相同 怎么去重復(python下)
問題解答
回答1:# python 2.7import rea = ’’’<a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a><a target='blank'></a>’’’print set(re.findall(’’’(?=.*(?:viewkey))(?=.*(?:page))(?=.*(?:viewtype))(?=.*(?:category))href=['’]([^’']+)’’’, a))回答2:
提取前三個鏈接:
links= re.findall(r’href='http://www.piao2010.com/wenda/(.*?=rf)'’,l_string,re.S)
去重:
new_links=set(links)
相關文章:
