本週任務備忘

2021-08-22 18:55:32 字數 432 閱讀 7700

本週任務備忘:

1、網頁內repeatable pattern的自動識別,block repeat script,block repeat的crawl.

[repeatable pattern的detect演算法通過對抽象出來的模型使用動態規劃已經解決,複雜度o(m+n),已做了一些試驗,效果很好]

2、網頁中pagination的自動識別,建立pagination模型,dectect next page link,網頁間的

repeatable pattern的自動識別,page repeat script,page repeat crawl.

[由於網頁的分頁方式比較多,只建立了簡單的模型,仍未實現自動識別,使用者仍需自己標示出pagination block,可以生

成page repeat script,可以進行crawl,使用者需要參與的操作已經很少]

本週看完 JTable

明天又是周二了。5.15 12.19 第一天的來公司的情景還歷歷在目,轉眼就已經七個多月了。上了半年的夜班,我就整整荒廢了六個月,慶幸現在終於不用上了。每次以前的同事問我在作什麼,都告訴他說,我在維護乙個 swing 的工具,從來沒有說過我在作 swing 實在是心裡有愧,因為確實沒大涉及到 swi...

本週總結(09 11 13)

計畫總是趕不上變化的,本來還想著能夠在中旬之前結束寫文件,但是現在看看還得再用一段時間。前幾天不經意之間想了一下,把自己嚇了一跳。這個學期馬上就要結束了!時間要轉進吶,質量也不能放下,畢竟也算是第一次正兒八經的做工程 以前的那個算是玩耍吧 這週也沒白過,腦袋始終是出於迴圈狀態。不斷的思考著這個系統中...

本週複習總結

1.軟體 是為完成某些特定功能而編制的乙個到多個程式檔案的集合 2.程式語言的發展 機器語言 組合語言 高階語言 3.編碼實現 源 編譯源 鏈結注意 1 在編譯源 的過程中,翻譯 解釋 程式比編譯程式的執行速度要慢 4.乙個簡單的程式設計一般包含分析問題,設計演算法,編制程式,除錯程式 5.任何解決...