json - python中用正則表達(dá)式去掉字符串中的冒號(hào)
問題描述
初學(xué)python,最近嘗試爬數(shù)據(jù),json字符串的value中有冒號(hào),需要去掉。我的代碼如下。 a和b都是value中會(huì)有冒號(hào)的字符串
import rea = 'Title:’Intern: Customer Experience + Innovation (CX+I) Intern Brands’'b = 'cmp:’Adecco: USA’,cmpesc:’Adecco: USA’'result = re.sub(’^(?:Title|cmp|cmpesc):.+(:)’,’’, a)
代碼執(zhí)行結(jié)果是只剩 Customer Experience + Innovation (CX+I) Intern Brands’,之前的內(nèi)容全被刪除了,而我想要的效果是只刪intern之后的那個(gè)冒號(hào)(title后的冒號(hào)要保留)。請(qǐng)問大家該如何修改?
問題解答
回答1:import reresult = re.sub(’^(Title|cmp|cmpesc:)(.+):(.*)’,’123’,'Title:’Intern: Customer Experience + Innovation (CX+I) Intern Brands’')print(result) # Title:’Intern Customer Experience + Innovation (CX+I) Intern Brands’回答2:
這樣的話:
’’.join(re.split(’(?<![Title|cmp|cmpesc]):’,a))
就好了
回答3:果然是我看錯(cuò)題目了....
回答4:不用去掉冒號(hào),直接變成字典就行了~
>>> a = 'Title:’Intern: Customer Experience + Innovation (CX+I) Intern Brands’';b = 'cmp:’Adecco: USA’,cmpesc:’Adecco: USA’'>>> dict([s.split(’:’,1) for s in a.split(’,’)]){’Title’: '’Intern: Customer Experience + Innovation (CX+I) Intern Brands’'}>>> dict([s.split(’:’,1) for s in b.split(’,’)]){’cmpesc’: '’Adecco: USA’', ’cmp’: '’Adecco: USA’'}>>>
寫成函數(shù)
a = 'Title:’Intern: Customer Experience + Innovation (CX+I) Intern Brands’'b = 'cmp:’Adecco: USA’,cmpesc:’Adecco: USA’'def fn(x): return dict((s.split(’:’,1) for s in x.replace('’','').split(’,’)))print(fn(a))print(fn(b))# {’Title’: ’Intern: Customer Experience + Innovation (CX+I) Intern Brands’}# {’cmp’: ’Adecco: USA’, ’cmpesc’: ’Adecco: USA’}
相關(guān)文章:
1. phpstady在win10上運(yùn)行2. 跟著課件一模一樣的操作使用tp6,出現(xiàn)了錯(cuò)誤3. docker 17.03 怎么配置 registry mirror ?4. 在應(yīng)用配置文件 app.php 中找不到’route_check_cache’配置項(xiàng)5. css3 實(shí)現(xiàn)一個(gè)線性漸變出現(xiàn)的問題?6. PHPExcel表格導(dǎo)入數(shù)據(jù)庫怎么導(dǎo)入7. ddos - apache日志很多其它網(wǎng)址,什么情況?8. html - 這種錯(cuò)位的時(shí)間軸怎么布局,然后用css實(shí)現(xiàn)?9. PHP單例模式10. PHP類封裝的插入數(shù)據(jù),總是插入不成功,返回false;
