minibatch是什么？

來源：千鋒教育

發(fā)布人：xqq

時間： 2023-11-22 19:11:35 1700651495

一、minibatch的概念

在機器學習算法的訓練過程中，大量的數(shù)據(jù)需要被處理和學習，而這些數(shù)據(jù)可能會非常大，如果一次性將全部數(shù)據(jù)送到計算系統(tǒng)中進行計算，不僅計算時間長，而且還會占用大量的存儲空間。為解決這個問題，就引入了minibatch這個概念。

簡言之，minibatch 就是一次訓練中且分批次處理的訓練數(shù)據(jù)集。每個批次包含了一定量的訓練數(shù)據(jù)，同時一次訓練中涉及的數(shù)據(jù)，就被分成若干個小批次進行處理和學習。

二、minibatch的優(yōu)勢

1、降低內(nèi)存壓力。

import numpy as np
from sklearn.datasets import load_boston
from sklearn.utils import resample

data = load_boston()
X, y = data.data, data.target

# 隨機采樣得到256個樣本點
X_, y_ = resample(X, y, n_samples=256, replace=False)

# 讀取全部的數(shù)據(jù)集開銷大
# X, y = data.data, data.target


由于計算機內(nèi)存的限制，如果使用梯度下降訓練神經(jīng)網(wǎng)絡(luò)的時候，通常只能一次輸入一個小批次數(shù)據(jù)，而不能一次性地輸入所有數(shù)據(jù)。minibatch 可以通過分批次處理訓練數(shù)據(jù)，解決內(nèi)存不足的問題，同時提高了訓練的效率。
2、有效提高計算速度。
當數(shù)據(jù)增大時，迭代次數(shù)越多，訓練越耗時。minibatch的應(yīng)用可以提高計算速度，提升訓練效率。

三、minibatch的實現(xiàn)方式
1、手動生成minibatch。
import numpy as np

def gen_minibatch(inputs, targets, batch_size):
    '''
    inputs和targets為輸入的數(shù)據(jù)和對應(yīng)的數(shù)據(jù)標簽
    batch_size為每個batch的大小
    '''
    input_batches = inputs.reshape(-1, batch_size, inputs.shape[1])
    target_batches = targets.reshape(-1, batch_size, targets.shape[1])
        
    for i in range(len(input_batches)):
        yield input_batches[i], target_batches[i]

# 輸入數(shù)據(jù)和標記
X = np.random.rand(40, 4)
y = np.random.randint(0, 2, 40)

# 批大小
batch_size = 10

for minibatch in gen_minibatch(X, y, batch_size):
    input_data, target_data = minibatch
    # do something

手動生成minibatch是一種非常基礎(chǔ)的方式。該方式是根據(jù)batch_size將訓練數(shù)據(jù)集手動分割成小批次，然后將小批次輸入到深度神經(jīng)網(wǎng)絡(luò)中進行訓練。
2、使用深度學習框架進行數(shù)據(jù)處理和訓練。
import torch
from torch.utils.data import DataLoader, TensorDataset

# 定義數(shù)據(jù)集并轉(zhuǎn)化為 DataLoader
train_dataset = TensorDataset(torch.Tensor(X_train), torch.Tensor(y_train))
train_dataloader = DataLoader(train_dataset, batch_size=batch_size, shuffle=True)

# 訓練模型
for i, (X_batch, y_batch) in enumerate(train_dataloader):
    # do something with X_batch and y_batch

Pytorch是一個常用的深度學習框架，可以幫我們自動生成數(shù)據(jù)批次，并且加速訓練任務(wù)。在使用Pytorch進行模型訓練時，我們可以使用DataLoader類結(jié)合TensorDataset自動生成minibatch。

四、minibatch的使用建議
1、合理設(shè)置批次大小。
我們通常需要根據(jù)計算機性能、模型復(fù)雜度、訓練數(shù)據(jù)大小等因素來確定合適的batch_size參數(shù)。批次大小的不同，可能會影響模型性能，因此我們需要選擇適當?shù)?batch_size。
2、打亂數(shù)據(jù)集。
在進行訓練之前，建議將訓練數(shù)據(jù)集打亂，以減少訓練誤差，提高模型的性能。同時還可以避免所選取的訓練集的先后順序帶來的影響。
shuffled_X, shuffled_y = shuffle(X_train, y_train)
train_dataset = TensorDataset(torch.Tensor(shuffled_X), torch.Tensor(shuffled_y))
train_dataloader = DataLoader(train_dataset, batch_size=batch_size, shuffle=True)


小結(jié)
minibatch 是一種非常常用的深度學習訓練技巧，它通過分批次進行數(shù)據(jù)處理和訓練，不僅可以降低內(nèi)存壓力，還可以提高計算速度。我們需要注意批次大小、打亂數(shù)據(jù)集等一些細節(jié)信息，才能在深度學習模型的訓練過程中更好地應(yīng)用 minibatch 技術(shù)。


              
                tags:                mybatisplus模糊查詢like
                              
              
                聲明：本站稿件版權(quán)均屬千鋒教育所有，未經(jīng)許可不得擅自轉(zhuǎn)載。
              
              
                
                  10年以上業(yè)內(nèi)強師集結(jié)，手把手帶你蛻變精英
                  
                    
                    
                  
                  
                    
                    
                  
                  請您保持通訊暢通，專屬學習老師24小時內(nèi)將與您1V1溝通
                  
                    免費領(lǐng)取

                  
                
                
                  今日已有369人領(lǐng)取成功
                  
                    
                      
                        劉同學 138****2860 剛剛成功領(lǐng)取
                      
                      
                        王同學 131****2015 剛剛成功領(lǐng)取
                      
                      
                        張同學 133****4652 剛剛成功領(lǐng)取
                      
                      
                        李同學 135****8607 剛剛成功領(lǐng)取
                      
                      
                        楊同學 132****5667 剛剛成功領(lǐng)取
                      
                      
                        岳同學 134****6652 剛剛成功領(lǐng)取
                      
                      
                        梁同學 157****2950 剛剛成功領(lǐng)取
                      
                      
                        劉同學 189****1015 剛剛成功領(lǐng)取
                      
                      
                        張同學 155****4678 剛剛成功領(lǐng)取
                      
                      
                        鄒同學 139****2907 剛剛成功領(lǐng)取
                      
                      
                        董同學 138****2867 剛剛成功領(lǐng)取
                      
                      
                        周同學 136****3602 剛剛成功領(lǐng)取


            
                            
                
                上一篇
                詳解contextpath
              
                            
                
                下一篇
                AXContainer詳解
              
                          
            
              
                免費打包獲取
              
            
            
            
              
                
                  相關(guān)推薦HOT
                
                
              
              
                                
                  
                    
                  
                  
                    torch.add函數(shù)詳解
                    
                      一、torch.add()介紹torch.add是PyTorch中重要的數(shù)學函數(shù)之一，該函數(shù)用于將兩個張量的元素相加。使用add可以用于在模型的正向傳播過程中將兩個...詳情>>
                    
                    2023-11-22 21:28:23
                  
                
                                
                  
                    
                  
                  
                     SQL 一行拆分成多行
                    
                       SQL 語言是訪問和處理關(guān)系型數(shù)據(jù)的一種標準語言，SQL 一行拆分成多行常見于一些需要用到多行的sql查詢。 一、將一行數(shù)據(jù)轉(zhuǎn)換成多行  在實際的...詳情>>
                    
                    2023-11-22 20:45:11
                  
                
                                
                  
                    
                  
                  
                    CKEditor5中文文檔
                    
                      一、簡介CKEditor5是一種適用于現(xiàn)代瀏覽器的Web富文本編輯器，它是CKEditor的新版本。CKEditor5提供了更現(xiàn)代化的架構(gòu)以及一個全新的插件化API來...詳情>>
                    
                    2023-11-22 20:27:11
                  
                
                                
                  
                    
                  
                  
                    .NetCore 下載文件
                    
                      一、下載文件的方式在.NetCore中下載文件最常見的方式是使用HttpResponse類的WriteFile方法。WriteFile方法將一個文件發(fā)送到響應(yīng)，并將文件的內(nèi)...詳情>>
                    
                    2023-11-22 20:19:59
                  
                
                                
                  
                    
                  
                  
                    echartsy軸刻度詳解
                    
                      一、echartsy軸刻度線刻度線是指在y軸上的短橫線，用于標記每一刻度的位置。在echarts中，可以通過以下代碼設(shè)置y軸刻度線的樣式：option = {   ...詳情>>
                    
                    2023-11-22 19:43:59


				
            
              
                熱門推薦
              
              
                                
                                    
                                    xlsread函數(shù)用法詳解
                  沸
                                  
                                
                                    
                                    linux安裝latex命令，linuxlatex安裝
                  熱
                                  
                                
                                    
                                    Markdown代碼塊詳解
                  熱
                                  
                                
                                    
                                    torch.add函數(shù)詳解
                  新
                                  
                                
                                    
                    4                  
                                    ORA-06550錯誤詳解
                                  
                                
                                    
                    5                  
                                    使用axios解決跨域問題
                                  
                                
                                    
                    6                  
                                    Vue中try catch
                                  
                                
                                    
                    7                  
                                    如何將linux虛擬機文件拷貝到本機，把文件虛擬機linux服務(wù)器上
                                  
                                
                                    
                    8                  
                                    IDEA安裝Maven插件
                                  
                                
                                    
                    9                  
                                    解析dict_values
                                  
                              
              
            
            

            
              
            
              
              
                技術(shù)干貨
                更多>>
              
              
                 
                  
                    
                      
                    
                    
                      如何實現(xiàn)服務(wù)器負載均衡
                      2023-12-06
                    
                  
                  
                  
                    
                      
                    
                    
                      linux有哪些優(yōu)勢和劣勢
                      2023-12-06
                    
                  
                  
                  
                    
                      
                    
                    
                      linux需要驅(qū)動嗎
                      2023-12-06
                    
                  
                  
                  
                    
                      
                    
                    
                      android與linux的區(qū)別
                      2023-12-06
                    
                  
                  
                  
                    
                      
                    
                    
                      如何搭建基于容器的深度學習環(huán)境
                      2023-12-06
                    
                  
                                
            

            
              
              
                職場就業(yè)
                更多>>
              
              
                 
                  
                    
                      
                    
                    
                      網(wǎng)絡(luò)安全軟件開發(fā)的就業(yè)前景
                      2023-12-09
                    
                  
                  
                  
                    
                      
                    
                    
                      學會python工程師后的就業(yè)前景
                      2023-12-09
                    
                  
                  
                  
                    
                      
                    
                    
                      學會java工程師后的就業(yè)前景
                      2023-12-09
                    
                  
                  
                  
                    
                      
                    
                    
                      云計算技術(shù)就業(yè)前景以及發(fā)展方向怎樣？
                      2023-08-07
                    
                  
                                
            
			            
            
              
                快速通道
              
                
                  培訓機構(gòu)
                  了解培訓相關(guān)
                
                
                  就業(yè)前景
                  查看就業(yè)前景
                
                
                  培訓門檻
                  了解學習門檻
                
                
                  應(yīng)聘面試
                  常見面試考題
                
                
                  就業(yè)服務(wù)
                  畢業(yè)推薦就業(yè)
                
                
                  師資團隊
                  了解師資團隊