Goutte PHP 爬虫库开源项目

我要开发同款
匿名用户2013年12月31日
67阅读
开发技术PHP
所属分类Web应用开发、HTML解析器
授权协议MIT

作品详情

Goutte是一个抓取网站数据的PHP库。它提供了一个优雅的API,这使得从远程页面上选择特定元素变得简单。

示例代码:

require_once '/path/to/goutte.phar';use Goutte\Client;//发送请求$client = new Client();$crawler = $client->request('GET', 'https://www.oschina.net/');//点击链接$link = $crawler->selectLink('Plugins')->link();$crawler = $client->click($link);//提交表单$form = $crawler->selectButton('sign in')->form();$crawler = $client->submit($form, array('signin[username]' => 'fabien', 'signin[password]' => 'xxxxxx'));//提取数据$nodes = $crawler->filter('.error_list');if ($nodes->count()){  die(sprintf("Authentication error: %s\n", $nodes->text()));}printf("Nb tasks: %d\n", $crawler->filter('#nb_tasks')->text());
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论