标签:正则表达式

奇技淫巧

Web Scraper 正则匹配数字案例

Web Scraper 正则匹配数字案例
在 Web Scraper 抓取过程中,经常遇到需要获取数字的情况。下面以抓取携程酒店介绍为例,说明如何在 Web Scraper 中使用正则表达式来匹配数字。 前言 本文使用的 sitemap 如下,可导入 sitemap 后根寻教程一步一步进行实践操作。 {"_id":"ctrip","startUrl":["https://hotels.ctrip.c……继续阅读 »

tesths 4个月前 (11-24) 1770浏览 0评论 10个赞

奇技淫巧

webscraper 常用正则表达式

webscraper 常用正则表达式
webscraper 常用正则表达式 在 Webscraper 抓取过程中,有些复杂的数据需要根据获得的 HTML 进行正则表达式的匹配。下整理几个常用的正则表达式。 可以在 https://regexr.com/ 进行正则表达式的测试。 1、匹配几个连续字符之后 (?<=(字符)).* 1.1 示例 (?<=(</em>)).* ……继续阅读 »

tesths 1年前 (2019-04-02) 1701浏览 0评论 8个赞