個人筆記 C txt文字分割器

2021-05-31 21:17:15 字數 1611 閱讀 8713

using system;

using system.collections.generic;

using system.componentmodel;

using system.data;

using system.drawing;

using system.linq;

using system.text;

using system.windows.forms;//openfiledialog

using system.io;//文字處理

namespace cuttxt

//瀏覽按鈕的事件

private void bt_browsefile_click(object sender, eventargs e)

}//分割按鈕的事件

private void bt_cutfiles_click(object sender, eventargs e)

else if (tb_linenumber.text == "0")

else

}//得到行數

public int gettxtproperty(string filelocation)

return bb;

}//開始分割

public void cuttxt(string filelocation, int linenumbers)

//開始處理分割

int curline = 0;//工作行

int curpage=0;//當前工作篇

for (int p = 0; p < page-1; p++)//先寫前n篇,最後一篇單獨寫

sw.flush();

sw.close();

curline += setlines;

curpage=p;

"當前索引:" + curline+"當前page值:"+curpage);

}//寫最後一篇

streamwriter sw_last = new streamwriter("xiangjun" + (curpage+1) + ".txt", true, encoding.getencoding("gb2312"));

for (int j = curline; j < filelines; j++)

sw_last.flush();

sw_last.close();

messagebox.show("分割成功!");

}//當設定的行數更改時,記錄其數值

//設定文字框失效事件,在form1.designer.cs中

private void tb_linenumber_lostfocus(object sender, eventargs e)

private void tb_linenumber_textchanged(object sender, eventargs e)

else

}private void linklabel1_linkclicked(object sender, linklabellinkclickedeventargs e)}}

python實現文字分割

文字分割是自然語言理解資料預處理中的重要步驟,本段程式實現的是用 分割文章,並且分割子句單句成行 import re pattern r 正則匹配模式,用 表示至少乙個字元 flags sentence txt with open test.txt r encoding utf 8 as reade...

shell文字分割 擷取 去重方法

aa sdf dslkfjuklsdfjlksjdf aa sdf dslkfjuklsdfjlksjdf bb sdf2 dslkfjuklsdfjlksjdf bb sdf2 dslkfjuklsdfjlksjdf bb sdf2 dslkfjuklsdfjlksjdf bb sdf2 dslk...

文獻筆記 短文本分析

基於稀疏特徵的中文微博短文本聚類方法研究 熊祖濤簡介 目前的主要文字表示模型 vsm,n gram,類短語串,概念模型,圖模型,事件模型 vsm 每個文字由特徵項和對應權重表示 t 1,w1 t2,w2,t n,wn 特徵降維 文件頻率,資訊增益,chi統計量,互資訊,期望交叉熵 特徵權重的計算方法...