中文文字時間抽取 時間轉換及標準化

2021-10-13 01:31:18 字數 1557 閱讀 3709

分享乙個用於文字中的時間抽取、時間轉換、時間標準化的實用工具。工具位址 github

time-extractor的python3版本

用於句子中時間詞的抽取和轉換, 主要基於time_nlp做了部分優化

效果如下:

res = tn.parse(target=u'晚上8點到上午10點之間') # target為待分析語句,timebase為基準時間預設是當前時間

print("extract_result:", res)

res = tn.parse(target=u'2023年二月二十八日下午四點三十分二十九秒') # target為待分析語句,timebase為基準時間預設是當前時間

print("extract_result:", res)

res = tn.parse(target=u'預計耗時36天5小時30分') # target為待分析語句,timebase為基準時間預設是當前時間

print("extract_result:", res)

res = tn.parse(target=u'今年國慶節上午8點') # target為待分析語句,timebase為基準時間預設是當前時間

print("extract_result:", res)

res = tn.parse(target=u'下周五晚上') # target為待分析語句,timebase為基準時間預設是當前時間

print("extract_result:", res)

res = tn.parse(target=u'今天早上5點') # target為待分析語句,timebase為基準時間預設是當前時間

print("extract_result:", res)

res = tn.parse(target=u'明年大年初一')

print("extract_result:", res)

res = tn.parse(target=u'上個月5號半夜')

print("extract_result:", res)

返回結果:

time_extractor: ['晚上8點', '上午10點']

extract_result:

time_extractor: ['2023年2月28日下午4點30分29秒']

extract_result:

time_extractor: ['36天5小時30分']

extract_result: }

time_extractor: ['今年國慶節上午8點']

extract_result:

time_extractor: ['下週5晚上']

extract_result:

time_extractor: ['今天早上5點']

extract_result:

time_extractor: ['明年初1']

extract_result:

time_extractor: ['上個月5號半夜']

extract_result:

python test.py

特徵提取 中文文字特徵抽取

jieba庫 ex 1 import jieba def cut word text text join list jieba.cut text return text def cut chinese demo2 data 每乙個公民的合法權利都值得守護 每乙個維權訴求都值得珍視。當且僅當舉報渠道暢...

英時間轉換為中文時間

自己建立個類,寫進去可以直接用 public class dateconversion create date 2010 5 22下午03 40 44 描述 取出日期字串中的年份字串 param str 日期字串 return public static string getyearstr stri...

抽取文字中的日期和時間

寫這種演算法真的是累啊,我是沒轍,只能拿正則了,各位仁兄有何高見?測試效果 擷取字串裡的日期 param input return private static string get string regex,string input return arrays.copyof s,len priva...