採集需要登陸的內容,即破session

2021-08-28 15:49:49 字數 1603 閱讀 3616

webclient mywebclient = new webclient();

string sessionkey=textbox78.text;

string refererurl=textbox77.text;

mywebclient.headers.clear();     

mywebclient.headers.add("cookie",sessionkey);

mywebclient.headers.add("referer", refererurl);

mywebclient.headers.add("user-agent", "mozilla/5.0 (x11; u; linux i686; en-us; rv:1.5) gecko/20031107 debian/1.5-3");

這樣就欺騙了伺服器了,哈哈

byte mydatabuffer = mywebclient.downloaddata(remoteuri);

download = encoding.default.getstring(mydatabuffer);

3.第3部就是資料的匹配了,我是將流讀取到資料裡,然後用indexof得到2個關鍵字段的位置,然後用substring取出來的,我知道這很笨,但用正規表示式難啊(誰會的指點我下),匹配完了得到的字串我就用以下的函式去掉了html**:

private string striphtml(string strhtml)

)|\s)*?(\/\s*)?>",

@"([\r\n])[\s]+",

@"&(quot|#34);",

@"&(amp|#38);",

@"&(lt|#60);",

@"&(gt|#62);",

@"&(nbsp|#160);",

@"&(iexcl|#161);",

@"&(cent|#162);",

@"&(pound|#163);",

@"&(copy|#169);",

@"&#(\d+);",

@"-->",

@""",

"","",

"\"",

"&",

"<",

">",

" ",

"\xa1",//chr(161),

"\xa2",//chr(162),

"\xa3",//chr(163),

"\xa9",//chr(169),

"","\r\n",

""};

string newreg =aryreg[0];

string stroutput=strhtml;

for(int i = 0;i

stroutput.replace("<","");

stroutput.replace(">","");

stroutput.replace("\r\n","");

return stroutput;

} 4.到了後面就是入庫了,這個大家都懂了吧.但是我還有點問題就是,在我寫資料的時候,出了exception,說我的字段太長了,不能寫進到資料庫,我用的是access,我試驗下用sql吧.

5.大家有什麼好的建議給我留個言賽.共同進步嘛.

DEDE首頁使用者登陸後登陸框顯示的內容修改方法

預設的登陸 從預設的來看,處理登陸的檔案是member index do.php這個檔案出來了正常的登陸操作 那登陸後顯示的介面在哪修改呢?再看這句在index裡面查詢checklogin函式會找到 又是ajax呼叫member ajax loginsta.php 找到此檔案可以看到如下 requi...

Python爬取需要登陸的兩種方法

爬取微博某些內容需要登陸,整理兩種方法 不知道對不對 def gethtmltext url cookie xx headers try r requests.get url,headers headers,timeout 30,proxies r requests.get url,headers ...

母版頁判斷登陸 及 母版頁與內容頁的執行順序

轉 public static void check page apage 在母版頁裡呼叫的正確方法 protected void page init object sender,eventargs e 原因 母版頁和內容頁的執行順序 1.母版頁中控制項的init 2.內容頁控制項的init 3.母...