SgmlReader是一个敏捷的C#.NET库,通过XmlReaderAPI解析HTML和SGML文件。同时提供一个命令行工具可以对这些内容进行格式化输出到XML结果。
示例代码:
XmlDocument FromHtml(TextReader reader) { // setup SgmlReader Sgml.SgmlReader sgmlReader = new Sgml.SgmlReader(); sgmlReader.DocType = "HTML"; sgmlReader.WhitespaceHandling = WhitespaceHandling.All; sgmlReader.CaseFolding = Sgml.CaseFolding.ToLower; sgmlReader.InputStream = reader; // create document XmlDocument doc = new XmlDocument(); doc.PreserveWhitespace = true; doc.XmlResolver = null; doc.Load(sgmlReader); return doc;}
评论