電影票房案例分析

2021-08-23 14:38:33 字數 1589 閱讀 5172

import pandas as pd

#載入資料

def read_data(file_root):

dataframe=pd.read_csv(file_root)

print("資料的基本資訊:")

print(dataframe.info())

print("資料的行是%i,列是%i"%(dataframe.shape[0],dataframe.shape[1]))

print("資料預覽:")

print(dataframe.head())

return dataframe

#處理缺失資料

def processing_missing_data(dataframe):

if dataframe.isnull().values.any():

dataframe=dataframe.dropna()

return dataframe

#分析票房資料

def analyze_data(dataframe,groupby_attribution):

grouped_data=dataframe.groupby(groupby_attribution,as_index=false)["gross"].sum()

sorted_grouped_data=grouped_data.sort_values(by="gross",ascending=false)

sorted_grouped_data.to_csv("h:/pythonfigure/gross.csv",index=none)

#重新構造電影型別

def reget_data(dataframe):

df_genres=pd.dataframe(columns=["genre","budget","gross","year"])

for i, row in dataframe.iterrows():

if i%100==0:

print("共%i記錄,已處理%i"%(dataframe.shape[0],i))

genres=row["genres"].split("|")

num_genres=len(genres)

dict={}

dict["budget"]=[row["budget"]]*num_genres

dict["gross"]=[row["gross"]]*num_genres

dict["year"] = [row["title_year"]] * num_genres

dict["genre"]=genres

df_genres.to_csv("h:/pythonfigure/movie_metad.csv")

return df_genres

#載入資料

dataframe=read_data("h:/pythonfigure/movie_metadata.csv")

#處理缺失資料

dataf=processing_missing_data(dataframe)

#重新構造電影型別

t=reget_data(dataf)

print(t)

Python貓眼電影最近上映的電影票房資訊

前言 ps 如程式設計客棧有需要python學習資料的小夥伴可以加點選下方鏈結自行獲取 基本環境配置 相關模組pip安裝即可 目標 資料介面 請求網頁獲取資料 import requests url params cookies headers response requests.get url u...

Tushare原學習文件(九 電影票房)

轉tushare原 import tushare as ts 1.實時票房 ts.realtime boxoffice 2.每日票房 ts.day boxoffice 獲取上一日票房 ts.day boxoffice 2018 10 10 獲取指定工作日票房引數說明 返回值說明 3.月度票房 ts....

python爬取電影票房網並儲存csv

目標 電影票房網 目標 目標資料 1 名次 2 電影名稱 3 日期 4 票房 5 總場次 6 廢場 7 人次 8 上座率 9 票價 任務要求 1 使用urllib或requests庫實現該 網頁源 的獲取,並將源 進行儲存 2 自主選擇re bs4 lxml中的一種解析方法對儲存的的源 讀取並進行解...