電商 生意參謀 抓取 訪客資料 Python版

2022-02-25 07:32:41 字數 1853 閱讀 6848

import requests

import json

import pandas as pd

import time

# getrtvisitor.json

session = requests.session() # 建立乙個session物件

headers =

def loadpage(page):

strpage=str(page)

strtoken='6f5921e86'

strlastpara='1584581855701'

url = ''+strpage+'&token='+strtoken+'&type=y&_='+strlastpara

# 2&token=97890b4c6&type=y&_=1584409617907

req = session.get(url, headers=headers) #發起get請求

text = req.text

with open(str(page)+".txt", "w") as f:

f.write(text)

return json.loads(text)

def getvaluefromdic(item, key, defaultvalue=none):

if key in item:

return item[key]

if defaultvalue is none:

return ''

return defaultvalue

list_res = json_res['data']['data']['list']

for item in list_res:

arr=

if item['pagetypeid'] == 5:# 商品分類頁

else:

# list集合

list_excel=

# 資料來源

json_res = loadpage(1)

# 解析資料

totalpage = json_res['data']['data']['totalpage']

curpage = json_res['data']['data']['page']

print('總頁數:', totalpage, '當前頁:', curpage)

# 追加資料

for i in range(totalpage-1):

page = i + 2

print('當前頁:', page)

json_res = loadpage(page)

# 轉換為dataframe

#df = pd.dataframe(list_excel, columns=['visittime', 'srcgrpname', 'presekeyword', 'title', 'cityname', 'oid'])

df = pd.dataframe(list_excel, columns=['訪問時間', '入店**', '搜尋關鍵字', '被訪頁面', '訪客位置', '訪客編號'])

# 儲存到本地excel

curtime = time.strftime('%y-%m-%d %h%m%s',time.localtime(time.time()))

df.to_excel('訪客-'+curtime+'.xlsx', index=false)

pagetypeid:訪客訪問頁面的型別

具體看這裡:item['pagetypeid'] == 5:# 商品分類頁

pagetypeid==5,表示使用者是從商品分類頁來的,或者點了商品分類頁頁

電商大資料分析

運用不同行業中,專門從事行業資料蒐集 整理 分析,並依據資料做出行業研究 評估和 的專業人員。熟悉行業知識 公司業務及流程,最好有自己獨到的見解,若脫離行業認知和公司業務背景,分析結果就沒有太大的使用價值。一方面是搭建資料分析框架的要求,比如確定分析思路就需要用到營銷 管理等理論知識來指導 另一方面...

電商推薦系統 資料載入

版本 scala2.11.8 spark 1.6.2 bin hadoop2.6 hadoop2.6 pom 4.0.0 com.kejin dataload 1.0 snapshot org.apache.spark spark core 2.11 org.apache.spark spark s...

電商交易資料分析

1.分析目的 根據過往電商成交資料進行資料分析發現規律和問題從而指導業務 2.資料 導入庫匯入資料 載入好資料之後,第一步先分別使用describe和info方法看下資料的大概分布 載入device type 3.資料清洗 orderid orderid在乙個系統裡是唯一值 先看下有沒有重複值 如果...