收集的材料 關於資料庫和抓取器方面的

2021-08-27 10:14:47 字數 438 閱讀 6281

同事 的部落格

裡面有很多 不錯的東西

值得 我這個水平不高的人學習

順便給他漲個人氣

抓取器:

c#.net gb2312編碼轉化為中文

正規表示式替換---lamda表示式(unicode編碼)

去除擷取物件中的html**

人人網抓取demo

discuz論壇的抓取

玩玩小爬蟲——抓取時的幾個小細節

獲取頁面原始碼(自動獲取頁面的編碼格式)

資料庫:

sql查詢效率:100w資料查詢只需要1秒鐘

查詢 31到40條記錄 的各種玩法(分頁可以支援海量資料5百萬,時間大約在1--5秒)

sql中資料查詢分頁操作集中地

sql優化-索引

基於索引的sql語句優化之降龍十八掌

關於SQL資料庫和NoSql資料庫的資料庫選擇案例

一 sql和nosql資料庫的特點對比 sql 資料庫的特點 在表中儲存相關聯的資料 在使用之前需要定義表的乙個模式 鼓勵標準化減少資料冗餘 支援從多個表中檢索相關資料表連線在乙個單一的命令 實現資料完整性規則 提供事務使兩個或兩個以上的成功或失敗的資料更改作為乙個原子單元 可以擴充套件 有一些努力...

Django 資料匯入和匯出(資料庫的遷移方法)

簡單的資料匯出與匯入 簡單的遷移 1資料匯出 python manage.py dumpdata blog blog dump.json python manage.py loaddata blog dump.json 優點 可以相容各種支援的資料庫,也就是說,以前用的是 sqlite3,可以匯出後...

資料庫關於varchar和nvarchar的區別

unicode字符集就是為了解決字符集這種不相容的問題而產生的,它所有的字元都用兩個位元組表示,即英文本元也是用兩個位元組表示 如果還為了這個糾結,就直接看看後面的解說,做決定吧。一般如果用到中文或者其它特殊字元,我就會使用n開頭的型別,否則的話直接使用var開頭的。sql server中的varc...