asp檢測檔案編碼

2021-04-12 20:17:30 字數 1147 閱讀 5515

摘 要】

ansi的本地編碼,都是各國自己定義的,沒有固定的檔案頭格式,在大陸中文作業系統下,是可讀的gb2312,在其他語言的系統下,就是亂碼,所以這部分沒必要再詳細區分得到檔案編碼。

原理:用stream物件預讀檔案的頭兩個位元組,分析判斷出utf-8,unicode,ansi(簡體中文作業系統,即gb2312)編碼

補充

ansi的本地編碼,都是各國自己定義的,沒有固定的檔案頭格式,在大陸中文作業系統下,是可讀的gb2312,在其他語言的系統下,就是亂碼,所以這部分沒必要再詳細區分得到檔案編碼,stream流就能按照需要的編碼開啟,就不會亂碼了

摘自:http://www.webdn.com/web_file/program/asp/n0610920/

ansi:        無格式定義;

unicode:        前兩個位元組為fffe;

unicode big endian:   前兩位元組為feff; 

utf-8:         前兩位元組為efbb;

function checkcode(path)

set objstream=server.createobject("adodb.stream")

objstream.type=1

objstream.mode=3

objstream.open

objstream.position=0

objstream.loadfromfile path

bintou=objstream.read(2)

if ascb(midb(bintou,1,1))=&hef and ascb(midb(bintou,2,1))=&hbb then

checkcoder="utf-8"

elseif ascb(midb(bintou,1,1))=&hff and ascb(midb(bintou,2,1))=&hfe then

checkcode="unicode"

else

checkcode="gb2312"

end if

objstream.close

set objstream=nothing

end function

php 檢測檔案編碼型別

在網上找了些關於php如何獲取檔案編碼的例子。google搜尋 大至如下 define utf32 big endian bom chr 0x00 chr 0x00 chr 0xfe chr 0xff define utf32 little endian bom chr 0xff chr 0xfe ...

python chardet編碼檢測

使用detect函式 輸入字串,輸出檢測的編碼和置信度。import urllib rawdata urllib.urlopen read import chardet chardet.detect rawdata out 處理大量文字,增量式的檢測。import urllib from chard...

chardet檢測編碼

import chardet s chardet.detect b hello world print s confidence欄位,表示檢測的概率是1.0 即100 data 離離原上草,一歲一枯榮 encode gbk result chardet.detect data print resul...