成人在线亚洲_国产日韩视频一区二区三区_久久久国产精品_99国内精品久久久久久久

您的位置:首頁技術文章
文章詳情頁

PHP中使用DOMDocument來處理HTML、XML文檔的示例

瀏覽:140日期:2022-09-07 14:46:39

其實從PHP5開始,PHP就為我們提供了一個強大的解析和生成XML相關操作的類,也就是我們今天要講的 DOMDocument 類。不過我估計大部分人在爬取網頁時還是會喜歡用正則去解析網頁內容,學了今天的這個類下回就可以嘗試下使用這個PHP自帶的方式來進行解析分析了。

解析HTML

// 解析 HTML$baidu = file_get_contents(’https://www.baidu.com’);$doc = new DOMDocument();@$doc->loadHTML($baidu);// 百度輸出框$inputSearch = $doc->getElementById(’kw’);var_dump($inputSearch);// object(DOMElement)#2 // ....echo $inputSearch->getAttribute(’name’), PHP_EOL; // wd// 獲取所有圖片的鏈接$allImageLinks = [];$imgs = $doc->getElementsByTagName(’img’);foreach($imgs as $img){ $allImageLinks[] = $img->getAttribute(’src’);}print_r($allImageLinks);// Array// (// [0] => //www.baidu.com/img/baidu_jgylogo3.gif// [1] => //www.baidu.com/img/bd_logo.png// [2] => http://s1.bdstatic.com/r/www/cache/static/global/img/gs_237f015b.gif// )// 利用 parse_url 分析鏈接foreach($allImageLinks as $link){ print_r(parse_url($link));}// Array// (// [host] => www.baidu.com// [path] => /img/baidu_jgylogo3.gif// )// Array// (// [host] => www.baidu.com// [path] => /img/bd_logo.png// )// Array// (// [scheme] => http// [host] => s1.bdstatic.com// [path] => /r/www/cache/static/global/img/gs_237f015b.gif// )

是不是感覺好清晰,好有面向對象的感覺。就像第一次使用 ORM庫 來進行數據庫操作一樣的感覺。我們一段一段來看。

$baidu = file_get_contents(’https://www.baidu.com’);$doc = new DOMDocument();@$doc->loadHTML($baidu);

首先是加載文檔內容,這個比較好理解,直接使用 loadHTML() 方法加載 HTML 內容。它還提供了其它的幾個方法,分別是:load() 從一個文件加載XML;loadXML() 從字符串加載XML;loadHTMLFile() 從文件加載HTML。

// 百度輸出框$inputSearch = $doc->getElementById(’kw’);var_dump($inputSearch);// object(DOMElement)#2 // ....echo $inputSearch->getAttribute(’name’), PHP_EOL; // wd

首先是加載文檔內容,這個比較好理解,直接使用 loadHTML() 方法加載 HTML 內容。它還提供了其它的幾個方法,分別是:load() 從一個文件加載XML;loadXML() 從字符串加載XML;loadHTMLFile() 從文件加載HTML。

// 百度輸出框$inputSearch = $doc->getElementById(’kw’);var_dump($inputSearch);// object(DOMElement)#2 // ....echo $inputSearch->getAttribute(’name’), PHP_EOL; // wd

接下來我們使用和前端 JS 一樣的 DOM 操作API來操作HTML里面的元素。這個例子中就是獲取百度的文本框,直接使用 getElementById() 方法獲得id為指定內容的 DOMElement 對象。然后就可以獲取它的值、屬性之類的內容了。

// 獲取所有圖片的鏈接$allImageLinks = [];$imgs = $doc->getElementsByTagName(’img’);foreach($imgs as $img){ $allImageLinks[] = $img->getAttribute(’src’);}print_r($allImageLinks);// Array// (// [0] => //www.baidu.com/img/baidu_jgylogo3.gif// [1] => //www.baidu.com/img/bd_logo.png// [2] => http://s1.bdstatic.com/r/www/cache/static/global/img/gs_237f015b.gif// )// 利用 parse_url 分析鏈接foreach($allImageLinks as $link){ print_r(parse_url($link));}// Array// (// [host] => www.baidu.com// [path] => /img/baidu_jgylogo3.gif// )// Array// (// [host] => www.baidu.com// [path] => /img/bd_logo.png// )// Array// (// [scheme] => http// [host] => s1.bdstatic.com// [path] => /r/www/cache/static/global/img/gs_237f015b.gif// )

這一段例子則是獲取HTML文檔中所有的圖片鏈接。相比正則來說,是不是方便很多,而且代碼本身就是自解釋的,不用考慮正則的匹配失效的問題。配合另外一個PHP中自帶的 parse_url() 方法也能非常方便地對鏈接進行分析,提取自己想要的內容。

XML的解析和對HTML的解析也是類似的,都使用 DOMDocument 和 DOMElement 提供的這個方法接口就可以很方便的進行解析了。那么我們想要生成一個標準格式的XML呢?當然也非常的簡單,不需要再去拼接字符串了,使用這個類一樣的進行對象化的操作。

生成一個XML

// 生成一個XML文檔$xml = new DOMDocument(’1.0’, ’UTF-8’);$node1 = $xml->createElement(’First’, ’This is First Node.’);$node1->setAttribute(’type’, ’1’);$node2 = $xml->createElement(’Second’);$node2->setAttribute(’type’, ’2’);$node2_child = $xml->createElement(’Second-Child’, ’This is Second Node Child.’);$node2->appendChild($node2_child);$xml->appendChild($node1);$xml->appendChild($node2);print $xml->saveXML();/*<?xml version='1.0' encoding='UTF-8'?><First type='1'>This is First Node.</First><Second type='2'><Second-Child>This is Second Node Child.</Second-Child></Second>*/

其實只要有一點點的前端 JS 的基礎都不難看出這段代碼的含義。使用 createElement() 方法創造 DOMElement 對象,然后就可以為它添加屬性和內容。使用 appendChild() 方法就可以為當前的 DOMElement 或者 DOMDocument 添加下級節點。最后使用 saveXML() 就能夠生成標準的XML格式內容了。

總結

通過上面兩個簡單的小例子,相信大家已經對這個 DOMDocument 操作XML類文件解析的方式非常感興趣了。不過相對于正則解析的方式它們的性能有多大的差異并沒有找到相關的測試,不過一般正常的情況下網站的HMTL文檔都不會太大,畢竟各個網站也會考慮自身的加載速度,如果文檔非常大的話用戶體驗也會很差,所以這套接口用來進行日常爬蟲的分析處理工作基本是沒有任何問題的。

測試代碼: github.com/zhangyue050…

以上就是PHP中使用DOMDocument來處理HTML、XML文檔的示例的詳細內容,更多關于PHP DOMDocument處理HTML、XML的資料請關注好吧啦網其它相關文章!

標簽: PHP
相關文章:
成人在线亚洲_国产日韩视频一区二区三区_久久久国产精品_99国内精品久久久久久久
95精品视频在线| 久久综合成人精品亚洲另类欧美| 欧美男男青年gay1069videost| 亚洲电影第三页| 欧美日韩18| 欧美调教femdomvk| 亚洲成人动漫一区| 99精品国产一区二区青青牛奶| 欧美日韩五月天| 丝袜美腿亚洲色图| 国产麻豆综合| 亚洲精品久久久蜜桃| 伊人精品成人久久综合软件| 国产精品日韩成人| 欧美日韩一区二区三| 久久久久久久av麻豆果冻| 粉嫩一区二区三区在线看| 欧美一区午夜视频在线观看| 国内国产精品久久| 欧美视频一区二区三区| 日韩精品电影在线观看| 一本一道久久a久久精品 | 一区视频在线| 国产精品不卡一区| 伊甸园精品99久久久久久| 亚洲精品免费看| 亚洲欧美视频| 日韩黄色免费电影| 欧美午夜视频网站| 国产一区二区福利| 欧美一级精品在线| 波多野结衣中文字幕一区| 久久久久久夜精品精品免费| 欧美日韩国产色综合一二三四| 国产精品不卡一区二区三区| 国产视频一区在线观看一区免费| 一区二区三区在线观看欧美| 亚洲一区日韩在线| 青青草91视频| 91麻豆精品国产自产在线| 国产精品乡下勾搭老头1| 日韩午夜精品视频| 91丨九色丨国产丨porny| 国产精品美女久久久久久| 99国产精品99久久久久久粉嫩| 亚洲一区二区三区三| 久久综合九色99| 久久99精品久久久久婷婷| 日韩三级伦理片妻子的秘密按摩| 欧美尤物一区| 亚洲精品国产品国语在线app| 亚洲免费网址| 亚洲欧美日韩成人高清在线一区| 模特精品在线| 国产呦精品一区二区三区网站| 久久久亚洲精品一区二区三区 | 国产精品一级在线| 久久久蜜桃精品| 中国女人久久久| 午夜精品久久久久久久久| 欧美日韩国产一区| 91香蕉视频在线| 亚洲午夜精品久久久久久久久| 欧美日韩国产综合视频在线观看| 91在线观看视频| 亚洲一区在线播放| 555夜色666亚洲国产免| 欧美日韩一区在线播放| 午夜精彩视频在线观看不卡| 91精品国产入口| 激情欧美日韩| 奇米在线7777在线精品| 欧美变态tickling挠脚心| 亚洲一级影院| 天堂午夜影视日韩欧美一区二区| 日韩亚洲欧美高清| 精品白丝av| 免费欧美日韩国产三级电影| 精品日本一线二线三线不卡| 亚洲另类视频| 国产综合色精品一区二区三区| 久久品道一品道久久精品| 午夜在线精品偷拍| 成人国产视频在线观看| 亚洲黄色尤物视频| 日韩三级伦理片妻子的秘密按摩| 夜夜爽av福利精品导航| 国产综合久久久久久鬼色| 中文字幕精品一区| 老**午夜毛片一区二区三区| 99精品久久只有精品| 午夜精品123| 国产日韩欧美不卡| 欧美在线免费视屏| 亚洲网址在线| 国产盗摄一区二区三区| 一区二区成人在线| 精品久久久久一区| 一本色道久久综合精品竹菊| 激情综合五月天| 一区二区理论电影在线观看| 精品国产第一区二区三区观看体验| 久久精品观看| 国产精品大片| 国内不卡的二区三区中文字幕| 亚洲视频一区二区在线| 91精品国产福利在线观看| 一本色道久久综合| 成人激情免费视频| 亚洲va中文字幕| 国产日韩精品一区| 欧美精品一级二级三级| 国产精品一卡| 欧美aⅴ99久久黑人专区| 久久国产福利国产秒拍| 一区二区三区日韩在线观看| 久久久久久久久久久久久夜| 欧美日韩国产综合一区二区三区| 亚洲人成免费| 91污片在线观看| 狠狠色综合日日| 五月天激情综合| 国产精品福利在线播放| 欧美成人激情免费网| 欧美中文字幕一区二区三区| 99国产精品私拍| 欧美日韩精品伦理作品在线免费观看 | 欧美日本在线播放| 亚洲一区日韩| 在线看片一区| 91视频一区二区三区| 国产一区福利在线| 亚洲制服丝袜在线| 国产精品乱码人人做人人爱| 精品国产欧美一区二区| 6080午夜不卡| 欧美性大战久久久| 久久一区亚洲| 亚洲色图自拍| 国产在线成人| 91网站在线播放| 国产suv精品一区二区6| 久久av资源站| 日韩高清一区二区| 亚洲国产一区二区a毛片| ...av二区三区久久精品| 久久久久久久久久久久久久久99| 欧美日韩视频第一区| 久久免费一区| 国产精品永久| 一区二区精品| 99在线精品观看| 风间由美一区二区av101| 蜜桃一区二区三区在线| 午夜久久电影网| 亚洲在线视频免费观看| 亚洲日本va午夜在线影院| 中文字幕精品一区二区三区精品| 久久美女艺术照精彩视频福利播放| 日韩视频在线观看一区二区| 欧美天堂一区二区三区| 一本久久a久久精品亚洲| 亚洲麻豆视频| 国产精品v日韩精品v欧美精品网站| 97精品视频在线观看自产线路二| 国产成人午夜视频| 国产精品18久久久| 国产精品996| 从欧美一区二区三区| 成人中文字幕在线| 成人激情小说乱人伦| 粉嫩蜜臀av国产精品网站| 国产精品资源在线| 国内精品国产成人国产三级粉色| 日本亚洲免费观看| 日韩国产欧美三级| 免费在线看成人av| 蜜臀久久99精品久久久久宅男| 婷婷综合五月天| 日韩一区精品视频| 免费在线看成人av| 黑人巨大精品欧美黑白配亚洲| 国产一区二区三区在线观看精品 | 精品成人一区二区三区四区| 精品福利av导航| 久久午夜电影网| 国产午夜精品一区二区三区嫩草| 国产女人18毛片水真多成人如厕| 国产精品丝袜一区| 亚洲欧洲日韩综合一区二区| 亚洲精品欧美综合四区| 首页国产丝袜综合| 另类综合日韩欧美亚洲| 国产主播一区二区三区| 成人app网站| 欧美日韩精品免费观看视一区二区| 一区二区视频欧美| 亚洲欧美精品| 欧美影片第一页| 日韩区在线观看|