簡述結構化資料 非結構化資料 半結構化資料

2021-09-27 10:57:25 字數 685 閱讀 6725

在資料分析中,我們會接觸到很多的資料,而這些資料都是有類別之分的。這些資料根據結構分類被劃分為三種,它們分別是結構化資料、非結構化資料、半結構化資料。在這篇文章中我們就簡單地給大家介紹一下這三種資料的相關知識。

首先我們說一下結構化資料,結構化的資料是指可以使用關係型資料庫表示和儲存,表現為二維形式的資料。一般特點是:資料以行為單位,一行資料表示乙個實體的資訊,每一行資料的屬性是相同的。能夠用資料或統一的結構加以表示,我們稱之為結構化資料,如數字、符號。傳統的關係資料模型、行資料,儲存於資料庫,可用二維表結構表示。而結構化的資料的儲存和排列是很有規律的,這對查詢和修改等操作很有幫助。

然後我們說一下半結構化資料,半結構化資料是結構化資料的一種形式,它並不符合關係型資料庫或其他資料表的形式關聯起來的資料模型結構,但包含相關標記,用來分隔語義元素以及對記錄和字段進行分層。因此,它也被稱為自描述的結構。半結構化資料,屬於同一類實體可以有不同的屬性,即使他們被組合在一起,這些屬性的順序並不重要。所謂半結構化資料,就是介於完全結構化資料和完全無結構的資料之間的資料,xml、html文件就屬於半結構化資料。它一般是自描述的,資料的結構和內容混在一起,沒有明顯的區分。而不同的半結構化資料的屬性的個數是不一定一樣的。有些人說半結構化資料是以樹或者圖的資料結構儲存的資料,怎麼理解呢?

結構化資料 半結構化資料 非結構化資料

結構化資料 即行資料,儲存在資料庫裡,可以用二維表結構來邏輯表達實現的資料 所謂半結構化資料,就是介於完全結構化資料 如關係型資料庫 物件導向資料庫中的資料 和完全無結構的資料 如聲音 影象檔案等 之間的資料,html文件就屬於半結構化資料。它一般是自描述的,資料的結構和內容混在一起,沒有明顯的區分...

結構化 半結構化和非結構化資料

在實際應用中,我們會遇到各式各樣的資料庫如nosql非關聯式資料庫 memcached,redis,mangodb rdbms關聯式資料庫 oracle,mysql等 還有一些其它的資料庫如hbase,在這些資料庫中,又會出現結構化資料,非結構化資料,半結構化資料,下面列出各種資料型別 結構化資料 ...

結構化 半結構化和非結構化資料

在實際應用中,我們會遇到各式各樣的資料庫如nosql非關聯式資料庫 memcached,redis。mangodb rdbms關聯式資料庫 oracle,mysql等 另一些其他的資料庫如hbase,在這些資料庫中。又會出現結構化資料。非結構化資料。半結構化資料,以下列出各種資料型別 結構化資料 可...