HTML解析器

HtmlCleaner是一个开源的Java语言的Html文档解析器。HtmlCleaner能够重新整理HTML文档的每个元素并生成结构良好(Well-Formed)的 HTML 文档。默认它遵循...
540JavaHTML解析器
RenderSnake 是一个轻量级的Java类库用来通过Java方法生产html页面,包含4个核心类库: HtmlCanvas , a class that has methods for a...
460JavaHTML解析器
Jericho HTML解析器是一个Java库,以分析和操纵部分的HTML文件,其中包括服务器端的标签,而过滤掉任何无法识别的或无效的HTML 。它也提供高层次的HTML表单操作函数。 示例代码...
470JavaHTML解析器
毫无疑问,HTML、HTTP 和 XML 是支撑 Web 技术的三种最重要的技术。对于 PHP 开发人员而言,使用这些技术可能比较麻烦。但是,新的 QueryPath 库,即 jQuery Ja...
530PHPHTML解析器
Scrender是一个用来生成网页缩略图的Java类库,基于SWT开发。它实质上是调用本地浏览器引擎对要进行截图的网站进行渲染,然后保存该网页的缩略图。 示例代码请看这里。
560JavaHTML解析器
NekoHTML 是一个 Java语言的 HTML扫描器和标签补全器(tag balancer) ,使得程序能解析HTML文档并用标准的XML接口来访问其中的信息。这个解析器能够扫描HTML文件...
640JavaHTML解析器
Html Agility Pack 是CodePlex 上的一个开源项目。它提供了标准的DOM API 和XPath 导航--即使 HTML 不是适当的格式! 示例代码: HtmlDocume...
450C#HTML解析器
Harser 是一个简单的 Python HTML 解析器。 安装:pip install harser 示例代码: >>> from harser import Harser >>>...
630PythonHTML解析器
xhtmlrenderer开源项目
解析HTML和CSS,并且能输出成image,PDF等格式. Flying Saucer is an XML/CSS renderer, which means it takes XML fil...
540JavaHTML解析器
Goutte 是一个抓取网站数据的 PHP 库。它提供了一个优雅的 API,这使得从远程页面上选择特定元素变得简单。 示例代码: require_once '/path/to/goutte....
700PHPHTML解析器
gohtml 是一个很小的 Java 类库,用来解析 HTML 文档,目前尚未公开发布版本。
520JavaHTML解析器
woody 是一款基于 Java 的 HTML 解析/提取器,用法非常类似 webmagic,是对其抽取模块的完全重写。 功能: 多种结果数据类型(String, char, byte, sho...
660JavaHTML解析器
简介 Jumony是一套基于.NET Framework 3.5的HTML分析处理引擎,使得可以在C#中方便简单的操纵HTML文档,同时也可以充当Web的页面引擎使用。 目标 Jumony希望在...
460C#HTML解析器
SgmlReader 是一个敏捷的 C# .NET 库,通过 XmlReader API 解析 HTML 和 SGML 文件。同时提供一个命令行工具可以对这些内容进行格式化输出到 XML 结果。...
800C#HTML解析器
NSoup是JSoup的Net移植版本。使用方法基本一致。 特性: jQuery 风格的 CSS 选择器 对不信任的源的 HTML 进行清理 操作 HTML 文档. 示例代码: NSoup.No...
470C#HTML解析器
很多人需要提取网页的一些内容, 可以利用正则表达式提取,也可以用beautifulsoap等工具. 正则表达式方法速度快,缺点是不好找到匹配的正则. 其他类似beautiful的工具因为要全面分...
520PythonHTML解析器
JTidy 是 HTML Tidy 用Java语言实现的版本,提供了一个HTML的语法检查器和很好的打印功能。JTidy可以用来清除格式不好和不对的 HTML。此外,JTidy提供了对整个HTM...
490JavaHTML解析器
scrape.py 是一个 Python 模块用来从网页上提取内容的工具,可用它轻松实现页面抓取、链接点击、表单提交等操作,自动支持 Cookie、重定向和 SSL。 scrape.py 并不解...
730PythonHTML解析器
htmlsprite 是一个 Flash 用来解析 HTML 文档的开发包。 示例代码: import com.redurban.HTMLSprite var htmlsprite:HTMLSp...
620ActionScriptHTML解析器
HtmlCompressor 是一个 Java 类库,用来对 HTML 内容进行压缩。HtmlCompressor 会删除 HTML 中无用的空格、空行、注释等内容。 该项目还提供了 Maven...
720JavaHTML解析器
当前共65个项目
×
寻找源码
源码描述
联系方式
提交