PHP爬虫框架 第8章 snoopy PHP爬虫框架 第8章 snoopy

2024-04-02

一、介绍

Snoopy 是一个 php 类,用来模拟浏览器的功能,可以获取网页内容,发送表单,可以用来开发一些采集程序。

它封装了很多常用且实用的功能,比如获取全部连接,获取全部纯文本内容等,它的表单模拟是它的一大亮点。

二、下载

通过 github 下载

https://github.com/endroy/Snoopy/blob/master/Snoopy.class.php

三、例子

例子

include 'Snoopy.class.php';

$snoopy = new Snoopy();

$url = "https://lulublog.cn";

// $snoopy->fetch($url);

$snoopy->fetchtext($url);//去除HTML标签和其他的无关数据

//$snoopy->fetchform($url);//只获取表单

//只返回网页中链接 默认情况下,相对链接将自动补全,转换成完整的URL。

// $snoopy->fetchlinks($url);
var_dump($snoopy->results);
阅读 583