jupyterlab資料處理

2022-07-28 15:48:22 字數 1507 閱讀 4291

目錄

jupyterlab是jupyter主打的最新資料科學生產工具,某種意義上,它的出現是為了取代jupyter notebook。不過不用擔心jupyter notebook會消失,jupyterlab包含了jupyter notebook所有功能。

你可以把jupyterlab當作一種究極進化版的jupyter notebook。原來的單兵作戰,現在是空陸空聯合協作。

jupyterlab有以下特點:

互動模式:python互動式模式可以直接輸入**,然後執行,並立刻得到結果,因此python互動模式主要是為了除錯python**用的

模組化介面:可以在同乙個視窗同時開啟好幾個notebook或檔案(html, txt, markdown等等),都以標籤的形式展示,更像是乙個ide

映象notebook輸出:讓你可以輕易地建立儀表板

支援多種資料格式:你可以檢視並處理多種資料格式,也能進行豐富的視覺化輸出或者markdown形式輸出

雲服務:使用jupyter lab連線google drive等服務,極大得提公升生產力

pip可能是大多數人使用包管理工具,如果使用pip安裝,請在命令列執行:

pip install jupyterlab

你是anaconda使用者,那麼可以直接用conda安裝,請在命令列執行:

conda install -c conda-forge jupyterlab

在命令列使用jupyter-lab或jupyter lab命令,然後預設瀏覽器會自動開啟jupyter lab。

-->http://localhost:8888/lab 網頁(預設)

啟動器:

右側的選項卡稱為啟動器,你可以新建notebook、console、teminal或者text文字。

當你建立新的notebook或其他專案時,啟動器會消失。 如果您想新建文件,只需單擊左側紅圈裡的「 +」按鈕。

開啟文件:

在啟動器中點選你想要開啟的文件型別,即可以開啟相應文件

使用頂部的選單欄建立新專案,步驟:file->new,然後選擇要建立的文件型別。這和jupyter notebook一樣

可以開啟多個文件後,任何排版組合,只需按住選項卡拖移即可

檔案瀏覽器:

左側一欄是檔案瀏覽器,顯示從jupyterlab啟動的位置可以使用的檔案

可以建立資料夾、上傳檔案並、新檔案列表

開啟學習文件:

jupyter lab支援開啟pandas、numpy、matplotlib、scipy、python、ipython、scipy、markdown、notebook等官方文件。步驟:help->選擇相應文件

切換背景主題:

jupyter lab支援兩種背景主題,白色和黑色。步驟:settings->jupyterlab theme

資料處理 流資料處理利器

流處理 stream processing 是一種計算機程式設計正規化,其允許給定乙個資料序列 流處理資料來源 一系列資料操作 函式 被應用到流中的每個元素。同時流處理工具可以顯著提高程式設計師的開發效率,允許他們編寫有效 乾淨和簡潔的 流資料處理在我們的日常工作中非常常見,舉個例子,我們在業務開發...

爬蟲 資料處理 pandas資料處理

使用duplicated 函式檢測重複的行,返回元素為布林型別的series物件,每個元素對應一行,如果該行不是第一次出現,則元素為true keep引數 指定保留哪一重複的行資料 dataframe替換操作 使用df.std 函式可以求得dataframe物件每一列的標準差 資料清洗清洗重複值 清...

資料處理 pandas資料處理優化方法小結

資料處理時使用最多的就是pandas庫,pandas在資料處理方面很強大,整合了資料處理和資料視覺化。pandas的視覺化使用的是matplotlib。回到主題 計算資料的某個欄位的所有值,對其欄位所有值進行運算 處理的字段資料為時間戳,需要計算該時間戳距離現在的時間,單位為天。一般方法 使用現在的...