學習進度03

2022-07-27 08:03:11 字數 565 閱讀 8209

import

reimport

requests

def parse_page(url):

headers ={

resp =requests.get(url,headers)

text =resp.text

# re.dotall .也可以匹配換行符

titles = re.findall(r'.*?(.*?)', text, re.dotall)

print(titles)

def main():

# url =''

for x in range(1, 18):

url ='' %x

parse_page(url)

if __name__ == '__main__':

main()

古詩文**的爬取

為什麼呢?

request url:

但是你點開這個網頁是403錯誤,在網上查了一下,需要訪問這個網頁

點開是乙個json資料,今天還學習了python中json物件的解析。

學習進度03

今天繼續學習sparksql的核心程式設計 在 spark sql 中 sparksession 是建立 dataframe 和執行 sql 的入口,建立 dataframe 有三種方式 通過 spark 的資料來源進行建立 從乙個存在的 rdd 進行轉換 還可以從 hive table 進行查詢返...

學習進度筆記03

定義tensorflow的物件tf,通過tf呼叫相應的操作來定義陣列 該操作是定義乙個三行三列的數值為0數值型別為float32的二維陣列 該操作是已知乙個陣列x,然後定義乙個與x行數和列數都相同的所有值都為0的陣列 該操作是定義乙個值全都是1,4行4列的矩陣,且分隔符是空格 該操作是給出乙個開始數...

學習進度條03

星期日星期一 星期二星期三 星期四星期五 星期六所花時間 包括上課 8 30 11 00 08 00 10 00 15 00 17 00 15 53 17 42 18 30 21 32 18 00 21 15 17 30 18 00 19 23 21 30 09 35 12 30 量 行 75行45...