神經網路優化 自定義損失函式

2021-08-21 21:24:56 字數 1993 閱讀 2126

神經網路優化中,自定義損失函式更靈活

例如酸奶銷售,生產多了損失成本,生產少了,損失利潤,假設生產成本cost為1元,利潤profit為9 元,實際生產數量為y,市場需求量為y_

則損失為分段函式,損失為 loss = ( y - y_ ) *cost  ( 條件為:y > y- ),loss = ( y_ - y ) * profit   (條件為: y_ > y )

python 裡可以通過這行**來完成這個計算 : 

loss = tf.reduce_sum(tf.where(tf.greater(y,y_),(y-y_)*cost,(y_-y)*profit))
下面是全部**:

#coding:utf-8

import tensorflow as tf

import numpy as np

#損失函式

batch_size=8

seed = 23455

cost = 1

profit = 9

#基於seed產生隨機數

rng = np.random.randomstate(seed)

#隨機數返回32行2列的矩陣,作為輸入資料集

x = rng.rand(32,2)

#從x矩陣中取出一行,求和後判斷結果,小於1給y賦值1,不大於1給y賦值0

#y作為輸入資料集的標籤(正確結果)

y = [[(x0 + x1+rng.rand()/10.0-0.05)] for (x0,x1) in x]

print("x:\n",x)

print("y:\n",y)

#定義神經網路的輸入、引數和輸出,定義向前傳播過程

x=tf.placeholder(tf.float32,shape=(none,2))

y_=tf.placeholder(tf.float32,shape=(none,1))

w1 = tf.variable(tf.random_normal([2,1],stddev=1,seed=1))

y = tf.matmul(x,w1)

#定義損失函式及反向傳播方法

#loss = tf.reduce_mean(tf.square(y-y_))

loss = tf.reduce_sum(tf.where(tf.greater(y,y_),(y-y_)*cost,(y_-y)*profit))

train_step = tf.train.gradientdescentoptimizer(0.001).minimize(loss)

#train_step = tf.train.momentumoptimizer(0.001,0.9).minimize(loss)

#train_step = tf.train.adamoptimizer(0.001).minimize(loss)

#生成會話,訓練steps輪

with tf.session() as sess :

init_op = tf.global_variables_initializer()

sess.run(init_op)

#訓練模型

steps = 60000

for i in range(steps):

start = (i*batch_size)%32

end = start + batch_size

sess.run(train_step,feed_dict=)

if i % 500 ==0:

print("after %d steps the w1 is: "%i)

print(sess.run(w1),"\n")

print("the last result w1 is :")

print(sess.run(w1),"\n")

執行截圖

神經網路損失函式

2018,aug 3 顧名思義,從標題就能知道損失函式 loss function 一定就是來計算神經網路在訓練中的損失的。說完了定義那到了舉例時間了 主要拿softmax loss來分析 這裡的k也就是我們分類的類別。然後這個函式是怎麼用的呢,我們可以簡單的舉乙個分類的例子來看下。假設我們輸入一張...

神經網路 損失函式

開始之前我們先進入數字識別這樣乙個場景 以識別數字1為例,神經網路模型的輸出結果越接近 0,1,0,0,0,0,0,0,0,0 越好。神經網路解決多分類的問題,最常見的方法是設定n個輸出節點,其中n類別個數,那麼上述數字判斷就應該有n 10個輸出。那麼如何判斷乙個輸出向量和期望向量的接近程度呢?交叉...

神經網路 損失函式

先上結論 在使用sigmoid作為啟用函式的時候,cross entropy相比於quadratic cost function,具有收斂速度快,更容易獲得全域性最優的特點 使用softmax作為啟用函式,log likelihood作為損失函式,不存在收斂慢的缺點。對於損失函式的收斂特性,我們期望...