java 學習 網路爬蟲 中國人才熱線郵箱抓取

2021-06-21 16:06:21 字數 1983 閱讀 1424

很簡陋的乙個抓取郵箱的,抓取效率很低,純當熟悉鍵盤。

1. 函式入口

public class test01 

//// h1.email();

// h1.email();

} }

2. 正規表示式

public class regx 

companylist.add(string);

} }/**

* 找到公司官網主頁位址

* * @param buf

* @throws ioexception

*/public synchronized static void findwebsite(string buf)

websitelist.add(string);

} }/**

* 郵箱位址驗證

* * @param str

* @return

*/public synchronized static listemail(string str) catch (ioexception e1)

pattern pattern = pattern

.compile("[a-za-z0-9_.-]+@[a-za-z0-9-]+\\.[a-za-z]");

matcher matcher = pattern.matcher(str);

listlist = new arraylist();

while (matcher.find()) catch (ioexception e) finally catch (ioexception e)

}list.add(restring);

return list;

}} return null;

}}

3. 頁面內容抓取

// 網頁編碼

//string charset = getcharset(connection.getcontenttype());

bufferedreader br = null;

try catch (unsupportedencodingexception e) catch (ioexception e)

string str = null;

try

}} catch (ioexception e)

} /**

* 網頁編碼

* * @param contenttype

* @return

*/private string getcharset(string contenttype)

public synchronized static boolean putemail(string str)

return false;

} public synchronized static void writlog(string str) catch (filenotfoundexception e) catch (ioexception e) finally catch (ioexception e)

} }public void email()

public mrunable(htmlpage htmlpage)

@override

public void run()

}

中國人英語學習的七個階段

第一階段 嬰兒階段 聽說讀寫全不會,只會背26個英文本母 第二階段 只言片語階段 簡單的幾個單詞短語,此時遇見老外一般除了hello,good morning之外基本就是啞巴,基本上是我初中時候的情況。第三階段 應付考試階段 這時候基本上能聽懂一些聽力考試中的對話,英語考題也能基本上根據英語課上講的...

中國人英語學習的七個階段

第一階段 嬰兒階段 聽說讀寫全不會,只會背26個英文本母 第二階段 只言片語階段 簡單的幾個單詞短語,此時遇見老外一般除了hello,good morning之外基本就是啞巴,基本上是我初中時候的情況。第三階段 應付考試階段 這時候基本上能聽懂一些聽力考試中的對話,英語考題也能基本上根據英語課上講的...

Java學習 網路程式設計知識

一 網路程式設計概述 計算機網路之間以何種規則進行通訊,就是網路模型研究問題。網路模型一般是指osi open system interconnection開放系統互連 七層參考模型,tcp ip四層參考模型 主機至網路層 物理層 資料鏈路層 網際層 傳輸層 應用層 應用層 表示層 會話層 二 協議...