为了获取下图的北京菜所在的位置虽然可以用Hawk,但为了方便可以使用Chrome搜狗和360浏览器的F12开发者工具功能,找到对应的元素点击右键,拷贝XPath:
因为要获取所囿的子li在刚才的数据清洗中,向Content列拖入XPath筛选器配置如下:
由于要获取所有的li子节点,所以去掉了最后的可以适当复习XPath语法。
接下来步骤很简单我不截图了:
再拖入正则转换器到HTML,配置如下:
g\d+代表匹配那个门类的ID比如刚才的g311
直接茬Text列的上方修改名称为门类
如果自己做不下来也没有关系,加载Github上大众点评的教程.xml
可以直接用这个现成的模块,也可以单步调试之看看它是怎么写的。
有任何问题欢迎留言。
版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。