查詢資料庫前十條資料 入門資料分析的一些建議

2021-10-25 12:40:36 字數 1387 閱讀 9849

最近經常被問到怎麼入門資料分析,可能很多同學對怎麼開始學習還是比較困惑的。我回想自己學習資料分析的經歷,總結了一些建議,希望能給到大家幫助。

概率與統計是資料分析的基石,像一些概率分布、抽樣、線性回歸、時間序列都是資料分析當中經常會用到的,可以說日常碰到的大部分的分析需求都可以用統計分析來解決。

理工科專業的同學大多在本科期間就學過概率與統計這門課,這部分的基礎應該還是比較紮實的。對於沒有基礎的同學,有一本叫《深入淺出統計學》的書非常值得一讀,豆瓣上的評分8.5分。

這本書非常通俗易懂,講理論知識的時候結合了很多案例,把統計學應用到解決實際問題當中,讓原本枯燥的統計學原理變得有趣起來,適合非專業人士入門學習。

做資料分析離不開查詢資料庫,這裡主要涉及的是sql。對於傳統的資料庫如mysql,sql server,oracle,或者大資料平台hadoop,都可以通過sql查詢的方式來獲取資料。入門sql的書推薦一本《mysql必知必會》,豆瓣評分8.4分。

這本書實踐性很強,教你怎麼用sql語句操作mysql。可以自己在電腦上裝乙個mysql,跟著書中的案例操作一遍。

python和r是資料分析當中最常用的兩門語言。r是為資料分析而生的一門語言,但python在資料分析方面有後來居上的趨勢。公司裡的資料科學團隊在幾年前還是用r做的分析,最近一年已經轉向python了,身邊的朋友也聽到很多r轉python的。效能上來說,python的速度更快,可以處理上g的資料,而r不行。所以長遠來說,我還是看好python的。

講python基礎的有一本《a byte of python》非常推薦,我當初就是看這本書入門的,讀起來很輕鬆,兩三天就可以讀完。網上已經有人把這本書翻成中文,位址在這兒:介紹 · 簡明 python 教程

作者是廣受好評的pandas庫的開發者。讀完這本書,可以對用python做資料分析涉及到的一些工具、怎樣用pandas、怎樣做資料視覺化有比較詳盡的了解。

這本書介紹了機器學習中最常用的幾種演算法,對演算法背後的數學原理也有介紹,對於理解機器學習的演算法非常有幫助。書中的**和例子都是用python實現,非常適合有python基礎的同學學習。

以上這些是資料分析最基礎的技能,有程式設計基礎的同學花兩三個月差不多就能入門了,零基礎可能要多費點時間。當然看書學習只是掌握理論知識,要真正的掌握還是要在專案中去實踐。

oracle 更新前十條資料

只更新前十條資料 在專案中,我們可能會遇到只更新資料庫的前十條語句,這次我在專案中就遇到按條件更新表中的十條資料 下面是我的sql update table set machine zhangsan where token in select t.token from select token fr...

各種資料庫查詢前幾條資料

1.oracle資料庫 select from tablename where rownum n 2.infomix資料庫 select first n from tablename 3.db2資料庫 select from select row number over as rownum from...

資料庫 讀取前幾條資料

1.oracle資料庫 select from tablename where rownum n 2.infomix資料庫 select first n from tablename 3.db2資料庫 select from select row number over as rownum from...