2006-10-17 21:49
一颗孤独星
后台遍历一个HTML页面
前几天写一个程序,需要后台遍历一个动态生成的页面,找寻特定节点 于是写了以下代码: public class HtmlReader{ public HtmlReader() { } /// /// 搜索特定标记的节点 /// /// /// /// 返回属性值数组 public static ArrayList SearchAttributes(string inMarkup, string KeyWord, string AttrName) { IHTMLDocument2 doc = new HTMLDocumentClass (); doc.write (new object [] {inMarkup}); doc.close (); ArrayList searchList = new ArrayList(); foreach(IHTMLElement el in (IHTMLElementCollection)doc.body.all) { if(el.tagName.ToLower() ==KeyWord) { string src=el.getAttribute(AttrName,0).ToString(); //src="http://www.28600.com/article1/src.Remove(0,src.LastIndexOf(/)+1);" searchList.Add(src); } } return searchList; } }