十大資料愛好者必備書籍

2021-07-10 23:32:30 字數 4399 閱讀 7942

matthew mayo 發表於 kdnuggets.

真正的資料愛好者閱讀許多關於大資料,機器學習,資料科學和資料探勘的書籍.除了這些技術領域,還有很多具體語言實現:hadoop,spark,python,r等等,更不用說職業生活各個方面自動化的多種工具.有不少話題需要及時了解.幸運的是(不幸?)這些學科不缺乏可用的書籍.

有很多資料相關類別的暢銷書名單.實際上kdnuggets 整理過資料探勘,資料庫和大資料,統計,ai和人工智慧和神經網路的相關名單.但這些都是基於亞馬遜狹義分類的暢銷書名單,沒有考慮免費的書籍.

首先,這個帖子的標題有誤導之嫌.這個廣泛的必備書籍列表為資料愛好者(或從業者)推薦暢銷付費或免費的資源.雖然我們可能從事或其他方式涉及數量有限的資料,我們趨向於對這些資料有更好的理解.

因此,hadoop的專家可能不需要專家級別的深度學習見解,他們對這一主題的興趣較為短暫.本文是為了鞏固興趣,同時為希望擴大知識範圍的資料愛好者提供材料建議.

請記住,在許多類別中,有些是重複的.通常材料焦點決定分類,而不是材料本身.

暢銷付費推薦: data science for business

當時圖了解乙個新的領域,最常見的困難是尋找適當深度的書籍(資料).不是簡單無用,就是繁重的學術書籍儘管權威並且全面,但注定無人問津.」data science for business」恰到好處.

- m l, amazon review.

暢銷免費推薦:the art of data science

這本書簡單,概括的描述了分析資料過程.作者有豐富的管理資料分析師和資料分析的經驗,這本書是他經驗的精華,適合於資料科學從業者和管理者.

- official website

暢銷付費推薦:big data: principles and best practices of scalable realtime data systems

我很少看到大資料背景下有關於資料建模,資料層,資料處理需求分析,資料架構和儲存問題(伴隨傳統資料庫的概念)實現重要性的討論.這本書提供了令人耳目一新的全面解決方案.

- kirk d. borne, amazon review

暢銷面費推薦:big data now: 2015 edition

四年內o』reilly已經提供了年度big data now報告,資料領域已經從嬰兒時期成長到青少年時期.在某些領域資料是領導者,並驅動創新,而且使用資料和分析來驅動決策的公司都跑贏同行.

- official website

暢銷付費推薦:hadoop: the definitive guide

我很欣賞這本書,涵蓋高層次概念,和設計,實現和日常執行hadoop我們需要了解的技術細節,以及各種相關技術.

- al gordon, amazon review

暢銷免費推薦:hadoop explained

hadoop是世界上建立於資料最重要的技術之一。了解它如何發展和進步,以這個見地指南解決大資料的持續挑戰。

- official website

暢銷付費推薦:learning spark

網際網路上可用資訊是偉大的,但是這本書將這些結合到一起。如果您想像spark程式設計師一樣思考 - 不是完全像乙個程式設計師 - 這是開始的地方。

- brian castelli, amazon review

暢銷免費推薦:mastering apache spark

這個筆記的spark使用過程中所有具體細節的集合.筆記旨在幫我們用spark設計開發更好的產品.

- official website

暢銷付費推薦:pattern recognition and machine learning

作者是乙個專家,他給出機器學習演算法背後複雜的數學證明.我從事神經網路方面工作相當長一段時間,教授線性代數,概率與回歸分析課程,並從這本書安靜的啟發中發現了一些東西。

- sidhant, amazon review

暢銷免費推薦:elements of statistical learning

好訊息是,這是相當最重要的一本書。它將所有東西連線到一起,在其他書中我從未發現。

暢銷付費推薦:python machine learning

這是乙個奇妙的書,即使是對像我這樣的機器學習初學者。看完這本書後,想到的第一件事是,完美的融合(至少對我來說)了理論和實踐,以及廣度和深度。

- brian m. thomas, amazon review

這本書介紹了統計學習方法。其目的是為在非數學科學高年紀本科生,碩士研究生和博士學生。書中還包含了許多r包的詳細解釋,比如如何實現在現實生活中設定的各種方法,和對實踐資料科學家應該是乙個寶貴資源。

- official website

由於付費深學習書籍的選擇是目前較少,這裡有兩個免費選擇。

暢銷免費推薦:neural networks and deep learning

神經網路,確保計算機從觀測資料學習

深度學習,神經網路學習中一套強大的技術

暢銷免費推薦:deep learning

在準備中,可能在不久的將來稱為深度學習書的權威,作者 ian goodfellow, yoshua bengio, and aaron courville。開發版本每月更新,並且將免費提供,直到發布。

暢銷付費推薦:data mining: concepts and techniques, third edition

資料探勘領域的全面概述,我認為這是研究生最好的資料探勘參考用書。這本書的重點是技術(即,如何分析資料,包括準備),它解決了所有領域的主要問題,包括資料儲存和預處理。然而,這本書是真正關心的分類方法,並在聚類分析的第二章講述特別徹底。

- susan katz, amazon review

暢銷免費推薦:mining of massive datasets

這本書被設計為在未受過正規前提條件教育的本科電腦科學水平。為了支援更深入的探索,大多數章節都輔以進一步的閱讀參考。

- official website

暢銷付費推薦:learning sql, second edition

如果你正在編寫任何型別的資料庫驅動**,或者你認為你不需要了解sql,讀這本書。你需要了解它,這本書教得很好。

- jack d. herrington, amazon review

暢銷免費推薦:learn sql the hard way

這本書將教你sql的80%,你可能需要有效地使用它,同時將概念混合到資料建模。如果你已經摸索構建web,桌面或移動應用程式,因為你不知道sql,那麼這本書適合你。這是為沒有資料庫,程式設計或sql知識的人寫的,但我們知道至少有乙個程式語言會有所幫助。

- official website

暢銷付費推薦:statistics in plain english, third edition

我作為乙個資料分析員,每天處理基本資料統計。我希望知道所有的模型和演算法。雖然統計軟體處理了所有問題,搞清楚軟體設定的引數成為棘手的問題。我的專業是生物技術,對於資料統計是陌生的。長話短說,我需要乙個堅實的基礎指南,這將有助於我適應統計的概念。

- shyam goli, amazon review

暢銷免費推薦:think stats: probability and statistics for programmers, second edition

想想統計強調用來探索真實資料集並回答有趣的問題的簡單技術。這本書以美國國立衛生研究院的資料為例。我們鼓勵讀者處理真實資料集的專案。

- official website

大資料基礎知識全集,大資料愛好者收藏必備

我們希望這些事情可以在雲平台上完成。雲上的所有產品都可以部署在乙個按鍵中,並且乙個按鈕是可伸縮的。新增的節點和減去的點可以直接操作在ui介面上。對於乙個企業來說,真正的核心是它自己的業務,而不需要花費太多的時間來尋找工具來使用 部署和管理大資料。大資料產品的運營和管理應轉移到大資料服務提供商,以獲得...

大資料必備的十大工具

預計到2020年,每人將產生1.7兆每秒的資料量。那將有很多資訊要處理。一方面,對很多公司來說,大資料是乙個遊戲規則的改變者,它提供了我們過去從未開啟的洞察力。另一方面,如果沒有合適的工具,就不可能利用這些資訊。為了充分利用任何大資料戰略,公司獲得管理 挖掘和理解資料的創新解決方案至關重要。幸運的是...

大資料處理必備的十大工具

隨著網際網路的愈來愈開放,電子商務平台和社交網路的盛行,導致資料在日益增長,給企業管理大量的資料帶來了挑戰的同時也帶來了一些機遇。隨著網際網路的愈來愈開放,電子商務平台和社交網路的盛行,導致資料在日益增長,給企業管理大量的資料帶來了挑戰的同時也帶來了一些機遇。下面是用於資訊化管理的大資料工具列表 1...