SgmlReader是一个敏捷的C#.NET库,通过XmlReaderAPI解析HTML和SGML文件。同时提供一个命令行工具可以对这些内容进行格式化输出到XML结果。
示例代码:
XmlDocumet FromHtml(TextReader reader) { // setup SgmlReader Sgml.SgmlReader sgmlReader = ew Sgml.SgmlReader(); sgmlReader.DocType = "HTML"; sgmlReader.WhitespaceHadlig = WhitespaceHadlig.All; sgmlReader.CaseFoldig = Sgml.CaseFoldig.ToLower; sgmlReader.IputStream = reader; // create documet XmlDocumet doc = ew XmlDocumet(); doc.PreserveWhitespace = true; doc.XmlResolver = ull; doc.Load(sgmlReader); retur doc;}
评论