python中從字串中擷取中文和英文本元

2021-07-22 21:48:35 字數 984 閱讀 9275

# -*- coding: utf-8 -*-

#encoding=utf8

import os,sys,re

## test_str1='蒙派克e'

## test_str2='新abc蒙派克'

## test_s1 = test_str1.decode('utf-8')

# test_s2= test_str2.decode('utf-8')

## pat_1 = re.compile(ur'[\u4e00-\u9fa5]') #這裡是關鍵,

## s1_zhongwen=''

## s2_zhongwen=''

## for item in re.findall(pat_1,test_s1): #這裡截取出中文字元

# # print item

# s1_zhongwen=s1_zhongwen+item

# print s1_zhongwen

## for item in re.findall(pat_1,test_s2):

# s2_zhongwen=s2_zhongwen+item

# print s2_zhongwen

## for item in (set(s1_zhongwen)-set(s2_zhongwen))|(set(s2_zhongwen)-set(s1_zhongwen)):

# print item

#計算到兩個車型的中文名稱的重疊度。

# print pat_1.split(test_s2)#這裡截取出非中文的字元

以及,快速的把字串,變成各個單個字元元素組成的集合的方法

# tl1=[1,3,5,'abc']

## tl2=[3,4,5]

## tl3=[5,9]##

## test_set=set(tl1) | set(tl2) | set(tl3)

#

shell中 字串擷取

一 號擷取,刪除左邊字元,保留右邊字元。echo 其中 var 是變數名,號是運算子,表示從左邊開始刪除第乙個 號及左邊的所有字元 即刪除 http 結果是 www.google.com test.htm 二 號擷取,刪除左邊字元,保留右邊字元。echo 表示從左邊開始刪除最後 最右邊 乙個 號及左...

shell中字串擷取

linux 的字串擷取很有用。有八種方法。假設有變數 var user 123 321 home dir 1.號擷取,刪除左邊字元,保留右邊字元。root zhoucentos var user 123 321 home dir root zhoucentos echo 321 home dir 其...

從某個字串中擷取子字串

首先拿到手上的是乙個路徑加上檔名的字串,但因為某種需要,我僅僅只要路徑,不需要檔案文,這時我們就可以做以下操作即可得到自己想要的。procedure tform4.button1click sender tobject varstr string str1 string str2 string n ...