Python大規模資料插入Postgresql

2021-10-18 22:35:53 字數 995 閱讀 6776

## 需要owner許可權

alter table t_rs_standard_satellite_image add constraint unique_source_product_id unique(source_product_id)

;

# batchinsert批量插入

def batchinsert(self, image_sql, url_sql, image_data, url_data):

conn, cursor = self.getconnect()

try:

# 迴圈插入批image量提交

cursor.executemany(image_sql, image_data)

# 迴圈插入批量url提交

cursor.executemany(url_sql, url_data)

except exception as err:

conn.rollback() # 事務回滾

return

else:

conn.commit()

finally:

# 關閉連線放回連線池、防止連線耗盡

self.closeconnect(conn, cursor)

資料封裝方式
url_arr =

(url, url_status_id, image_id[0]

, expire_time,

priority, create_date,

source_code)

sql格式
# python

url_sql =

"insert into t_url(url,url_status_id,image_id,expire_time,priority,create_date,datasource)values(%s,%s,%s,%s,%s,%s,%s)"

大規模資料實戰

前後端處理分離解耦,前批處理 有向圖編譯,後端為有向圖優化 自動資源分配 自動監控 錯誤跟蹤 首先我們忘掉所有的框架,我們想做的業務設計其實是就是乙個count 乙個topk 衡量指標很簡單是sla 工程一致性模型,強一致性,弱一致性,最終一致性 cloud spanner 就是強一致性,業務級的資...

Bloom Filter 大規模資料處理利器

bloom filter 是由bloom 在1970 年提出的一種多雜湊函式對映的快速查詢演算法。通常應用在一些需要快速判斷某個元素是否屬於集合,但是並不嚴格要求 100 正確的場合。一.例項 為了說明 bloom filter 存在的重要意義,舉乙個例項 假設要你寫乙個網路蜘蛛 web crawl...

BloomFilter 大規模資料處理利器

bloom filter是由bloom在1970年提出的一種多雜湊函式對映的快速查詢演算法。通常應用在一些需要快速判斷某個元素是否屬於集合,但是並不嚴格要求100 正確的場合。一.例項 為了說明bloom filter存在的重要意義,舉乙個例項 假設要你寫乙個網路蜘蛛 web crawler 由於網...