基于云計算技術的圖書館借閱量建模與預測分析
「為了提高圖書館借閱量預測精度,針對當前圖書館借閱量預測過程存在的一些問題,提出基于云計算技術的圖書館借閱量建模與預測方法。首先,對國內外圖書館借閱量預測研究現狀進行分析,找到引起圖書館借閱量預測效果不理想的原因;然后,采用云計算技術搭建圖書館借閱量預測平臺,并采用多個最小二乘支持向量機同時進行圖書館借閱量建模與預測;最后,與其他方法進行圖書館借閱量預測仿真測試對比實驗。結果表明,所提方法不僅圖書館借閱量預測精度高,而且減少了圖書館借閱量預測時間,加快了圖書館借閱量預測速度,且實際應用價值更高。(2023-2-25)」
關鍵詞: 云計算技術; 圖書館借閱量; 建模方法; 預測模型; 云平臺; 預測精度
中圖分類號: TN911.1?34; TP311 文獻標識碼: A 文章編號: 1004?373X(2020)01?0111?03
Analysis on library′s book borrowing volume modeling and forecasting
based on cloud computing technology
LIU Chang’e
Abstract: In order to improve the prediction accuracy of book borrowing volume in library, a method of book borrowing volume modeling and prediction based on cloud computing technology is put forward in this paper to solve problems existing in the current prediction process of book borrowing volume in library. The research situation of current library′s book borrowing volume prediction at home and abroad is analyzed to find out the reasons that lead to the unsatisfactory effect of library′s book borrowing volume prediction. The cloud computing technology is adopted to build a book borrowing volume prediction platform. Several least squares support vector machines are used to perform book borrowing volume modeling and forecasting simultaneously. The simulation experiment for library′s book borrowing volume prediction of this method and that of other methods were conducted. The experiment results show that this method not only improves the prediction accuracy, but also reduces the prediction time of book borrowing volume in library, speeds up the prediction velocity of book borrowing volume, and has high practical application value.
Keywords: cloud computing technology; library′s book borrowing volume; modeling method; prediction model; cloud platform; prediction accuracy
0 引 言
隨著高校的人數不斷增加,高校的圖書館規模越來越大,每天圖書館借閱量也在不斷攀升,這給圖書館的管理帶來一定的困難。為了對圖書館進行高效管理,需要對圖書館借閱量進行建模與預測,因此如何設計高精度的圖書館借閱量建模與預測方法成為當前圖書館管理領域中的一個重要研究方向[1?3]。
針對圖書館借閱量建模與預測問題,國內外學者們進行了大量的研究,涌現了許多有效的圖書館借閱量建模與預測方法,圖書館借閱量建模與預測研究可以劃分為兩個階段:
1) 線性建模階段,主要包括時間序列分析法。將圖書館借閱量歷史數據看作是一種時間序列數據,通過分析數據之間的變化關系,建立圖書館借閱量預測模型,但是圖書館借閱量與多種影響因素相關,如:學生的學習習慣,學生感興趣的書籍,使得圖書館借閱量呈現一種非線性變化特點,這樣線性的圖書館借閱量預測結果不準確,圖書館借閱量預測錯誤大[4?6]。
2) 非線性的圖書館借閱量建模與預測方法,主要包括支持向量機的圖書館借閱量建模與預測方法、神經網絡的圖書館借閱量建模與預測方法[7?9],但是神經網絡要求的圖書館借閱量歷史數據比較大,這給數據的收集帶來困難[10]。支持向量機對圖書館借閱量的歷史數據要求不高,但是其建模速度很慢,這樣影響圖書館借閱量建模與預測效果[11?13]。 最小二乘支持向量機是一種新型的非線性建模方法,建模效率比支持向量機的建模效率更高,同時克服了神經網絡的缺陷。為了提高圖書館借閱量預測精度,針對當前圖書館借閱量預測過程存在的一些問題,提出基于云計算技術的圖書館借閱量建模與預測方法。采用多個最小二乘支持向量機通過云計算技術對圖書館借閱量進行建模與預測,并與其他圖書館借閱量預測方法進行對比實驗。結果表明,相對于對比方法,本文方法提高了圖書館借閱量預測精度,減少了圖書館借閱量預測時間,提升了圖書館借閱量預測效率,具有十分明顯的優越性。
1 基于云計算技術的圖書館借閱量建模和預測方法
1.1 云計算技術
云計算技術是一種針對單機運行速度達到瓶頸的并行處理技術,其集成了大數據處理技術、物聯網技術、分布式技術,主要針對大規模數據處理問題,采用Map/Reduce工作框架,將一個大規模問題劃分為Map和Reduce模塊,工作原理如圖1所示。
1.2 最小二乘支持向量機
對于圖書館借閱量歷史樣本數據[{(xi,yi)}],支持向量采用函數[?(x)]將其進行映射,轉換到高維空間,然后在高維空間進行建模,從而得到如下形式的方程:
[f(x)=ωT?(x)+b] (1)
對式(1)問題進行變換,得到相應等價形式,具體為:
[minω2+12γi=1nξ2i s.t. yi-ωT?(x)+b=eii=1,2,…,n] (2)
式中[γ]為正則化參數。
引入拉格朗日乘子[αi]對式(2)進行變換,得到其對偶形式,即有:
[L(ω,b,ζ,α)=minω2+12γi=1nξ2i+i=1nαi(ωT?(x)-b+ei-yi)] (3)
根據Mercer條件,采用核函數替代內積操作,即:
[K(xi,xj)=?T(xi)?(xj)] (4)
采用RBF函數,具體為:
[k(xi,xj)=exp-xi-xj22σ2 ] (5)
式中[σ]為寬度參數。
基于最小二乘支持向量機的圖書館借閱量回歸方程為
[f(x)=i=1Nαiexp-xi-xj22σ2+b] (6)
1.3 基于云計算的圖書館借閱量預測具體實現
當前圖書館借閱量數據呈海量形式存在,傳統單機處理技術不能滿足圖書館借閱量建模的預測要求,本文利用計算技術采用多個節點對圖書館借閱量進行并行建模和預測,各個節點采用最小支持向量機對圖書館借閱量進行學習,建立圖書館借閱量預測模型,具體如圖2所示。
云計算技術的圖書館借閱量預測步驟如下:
Step1:收集圖書館借閱量的歷史數據。
Step2:將圖書館借閱量數據進行劃分,得到多個圖書館借閱量子數據。
Step3:對于每一個圖書館借閱量的子數據,采用最小二乘支持向量機進行訓練,建立圖書館借閱量預測模型。
Step4:多個最小二乘支持向量機基于云計算,同時對圖書館借閱量進行建模與預測,得到多個圖書館借閱量預測結果。
Step5:將多個圖書館借閱量預測結果傳輸到Reduce。
Step6:確定每一個最小二乘支持向量機的圖書館借閱量預測結果的權重,然后基于權值計算圖書館借閱量的最終預測結果。
2 圖書館借閱量的預測算例分析
2.1 云平臺搭建
為了分析基于云計算技術的圖書館借閱量建模與預測方法的有效性,搭建一個云平臺,該平臺共包括50個節點,其基本結構可以用圖3描述。
2.2 圖書館借閱量歷史數據
對一個大學的圖書館借閱量一段時間的數據進行采集,共得到300個圖書館借閱量樣本,變化曲線如圖4所示。
2.3 結果與分析
2.3.1 圖書館借閱量預測精度比較
選擇支持向量機的圖書館借閱量建模與預測方法、神經網絡的圖書館借閱量建模與預測方法進行對比測試,均進行5次仿真測試,選擇最后200個樣本作為驗證樣本,其他為訓練樣本,統計它們的圖書館借閱量預測精度,結果如圖5所示。從圖5可以看出:支持向量機的圖書館借閱量預測精度均值為92.18%;神經網絡的圖書館借閱量預測精度均值為87.02%;本文方法的圖書館借閱量預測精度均值為95.72%,本文方法的圖書館借閱量預測精度最高,從而減少了圖書館借閱量預測誤差,驗證了本文方法的圖書館借閱量預測結果的優越性。
2.3.2 圖書館借閱量預測效率比較
統計圖書館借閱量建模與預測方法的訓練時間和預測時間,如表1所示。從表1可知,本文方法的圖書館借閱量訓練時間和預測時間的均值分別為6.03 s和1.11 s;支持向量機的圖書館借閱量訓練時間和預測時間的均值分別為27.49 s和3.62 s;神經網絡的圖書館借閱量訓練時間和預測時間的均值為13.10 s和2.51 s。本文方法減少了圖書館借閱量建模時間,加快了圖書館借閱量預測速度,獲得了更高的圖書館借閱量預測效率。
3 結 語
為了提高圖書館借閱量預測精度,針對當前圖書館借閱量預測過程存在的一些問題,提出了基于云計算技術的圖書館借閱量建模與預測方法。為了驗證本文方法的性能,與其他方法進行了圖書館借閱量預測仿真測試實驗。結果表明,本文方法不僅圖書館借閱量預測精度高,而且減少了圖書館借閱量預測時間,加快了圖書館借閱量預測速度,實際應用價值更高。
參考文獻
[1] 牛秀.基于多參數指數平滑的圖書借閱量預測[J].科技情報開發與經濟,2011,21(28):50?51.
[2] 于曦.基于Unicorn和SPSS的圖書借閱量周期性分析及預測[J].山東圖書館學刊,2011(1):52?56.
[3] 劉素兵,劉海明,苗佳晶,等.圖書借閱量的灰色回歸組合模型研究[J].云南民族大學學報(自然科學版),2010,19(3):170?172.
[4] 孫寶.圖書借閱量預測模型[J].華北科技學院學報,2006(3):121?124.
[5] 張東波,林永杰,盧凱,等.基于云計算的大規模交通路網的最短路徑算法[J].華南理工大學學報(自然科學版),2018,46(12):139?146.
[6] 葛凡.基于灰色系統模型的圖書借閱量預測分析:以青島科技大學圖書館為例[J].教育教學論壇,2018(46):106?109.
[7] 許志榮,陳倩,過榴曉.基于時間序列分析的高校圖書館借閱量研究:以江南大學圖書館為例[J].農業圖書情報學刊,2018,30(10):107?110.
[8] 陳明.一元線性回歸模型預測圖書借閱量[J].大學教育,2016(5):111?112.
[9] 陳英.圖書借閱量預測建模方法比較研究[J].科技視界,2014(23):222?223.
[10] 汪玉杰,劉智立.基于BP神經網絡對圖書借閱量的預測研究[J].科技創新與應用,2013(36):25?26.
[11] 鄒梅.利用神經網絡技術預測圖書借閱量[J].蘭臺世界,2013(20):135?136.
[12] 張囡,張永梅.基于灰色神經網絡的圖書館圖書借閱量預測[J].情報探索,2013(3):133?135.
[13] 劉雄飛,聶偉,陳浩,等.基于云計算平臺的室內環境監測系統設計與實現[J].傳感器與微系統,2019,38(3):92?95.
作者簡介:劉嫦娥(1983—),女,江西南昌人,中級職稱,圖書館館員,主要從事圖書館相關方面的研究。
(斯Hn)
中圖分類號: TN911.1?34; TP311 文獻標識碼: A 文章編號: 1004?373X(2020)01?0111?03
Analysis on library′s book borrowing volume modeling and forecasting
based on cloud computing technology
LIU Chang’e
Abstract: In order to improve the prediction accuracy of book borrowing volume in library, a method of book borrowing volume modeling and prediction based on cloud computing technology is put forward in this paper to solve problems existing in the current prediction process of book borrowing volume in library. The research situation of current library′s book borrowing volume prediction at home and abroad is analyzed to find out the reasons that lead to the unsatisfactory effect of library′s book borrowing volume prediction. The cloud computing technology is adopted to build a book borrowing volume prediction platform. Several least squares support vector machines are used to perform book borrowing volume modeling and forecasting simultaneously. The simulation experiment for library′s book borrowing volume prediction of this method and that of other methods were conducted. The experiment results show that this method not only improves the prediction accuracy, but also reduces the prediction time of book borrowing volume in library, speeds up the prediction velocity of book borrowing volume, and has high practical application value.
Keywords: cloud computing technology; library′s book borrowing volume; modeling method; prediction model; cloud platform; prediction accuracy
0 引 言
隨著高校的人數不斷增加,高校的圖書館規模越來越大,每天圖書館借閱量也在不斷攀升,這給圖書館的管理帶來一定的困難。為了對圖書館進行高效管理,需要對圖書館借閱量進行建模與預測,因此如何設計高精度的圖書館借閱量建模與預測方法成為當前圖書館管理領域中的一個重要研究方向[1?3]。
針對圖書館借閱量建模與預測問題,國內外學者們進行了大量的研究,涌現了許多有效的圖書館借閱量建模與預測方法,圖書館借閱量建模與預測研究可以劃分為兩個階段:
1) 線性建模階段,主要包括時間序列分析法。將圖書館借閱量歷史數據看作是一種時間序列數據,通過分析數據之間的變化關系,建立圖書館借閱量預測模型,但是圖書館借閱量與多種影響因素相關,如:學生的學習習慣,學生感興趣的書籍,使得圖書館借閱量呈現一種非線性變化特點,這樣線性的圖書館借閱量預測結果不準確,圖書館借閱量預測錯誤大[4?6]。
2) 非線性的圖書館借閱量建模與預測方法,主要包括支持向量機的圖書館借閱量建模與預測方法、神經網絡的圖書館借閱量建模與預測方法[7?9],但是神經網絡要求的圖書館借閱量歷史數據比較大,這給數據的收集帶來困難[10]。支持向量機對圖書館借閱量的歷史數據要求不高,但是其建模速度很慢,這樣影響圖書館借閱量建模與預測效果[11?13]。 最小二乘支持向量機是一種新型的非線性建模方法,建模效率比支持向量機的建模效率更高,同時克服了神經網絡的缺陷。為了提高圖書館借閱量預測精度,針對當前圖書館借閱量預測過程存在的一些問題,提出基于云計算技術的圖書館借閱量建模與預測方法。采用多個最小二乘支持向量機通過云計算技術對圖書館借閱量進行建模與預測,并與其他圖書館借閱量預測方法進行對比實驗。結果表明,相對于對比方法,本文方法提高了圖書館借閱量預測精度,減少了圖書館借閱量預測時間,提升了圖書館借閱量預測效率,具有十分明顯的優越性。
1 基于云計算技術的圖書館借閱量建模和預測方法
1.1 云計算技術
云計算技術是一種針對單機運行速度達到瓶頸的并行處理技術,其集成了大數據處理技術、物聯網技術、分布式技術,主要針對大規模數據處理問題,采用Map/Reduce工作框架,將一個大規模問題劃分為Map和Reduce模塊,工作原理如圖1所示。
1.2 最小二乘支持向量機
對于圖書館借閱量歷史樣本數據[{(xi,yi)}],支持向量采用函數[?(x)]將其進行映射,轉換到高維空間,然后在高維空間進行建模,從而得到如下形式的方程:
[f(x)=ωT?(x)+b] (1)
對式(1)問題進行變換,得到相應等價形式,具體為:
[minω2+12γi=1nξ2i s.t. yi-ωT?(x)+b=eii=1,2,…,n] (2)
式中[γ]為正則化參數。
引入拉格朗日乘子[αi]對式(2)進行變換,得到其對偶形式,即有:
[L(ω,b,ζ,α)=minω2+12γi=1nξ2i+i=1nαi(ωT?(x)-b+ei-yi)] (3)
根據Mercer條件,采用核函數替代內積操作,即:
[K(xi,xj)=?T(xi)?(xj)] (4)
采用RBF函數,具體為:
[k(xi,xj)=exp-xi-xj22σ2 ] (5)
式中[σ]為寬度參數。
基于最小二乘支持向量機的圖書館借閱量回歸方程為
[f(x)=i=1Nαiexp-xi-xj22σ2+b] (6)
1.3 基于云計算的圖書館借閱量預測具體實現
當前圖書館借閱量數據呈海量形式存在,傳統單機處理技術不能滿足圖書館借閱量建模的預測要求,本文利用計算技術采用多個節點對圖書館借閱量進行并行建模和預測,各個節點采用最小支持向量機對圖書館借閱量進行學習,建立圖書館借閱量預測模型,具體如圖2所示。
云計算技術的圖書館借閱量預測步驟如下:
Step1:收集圖書館借閱量的歷史數據。
Step2:將圖書館借閱量數據進行劃分,得到多個圖書館借閱量子數據。
Step3:對于每一個圖書館借閱量的子數據,采用最小二乘支持向量機進行訓練,建立圖書館借閱量預測模型。
Step4:多個最小二乘支持向量機基于云計算,同時對圖書館借閱量進行建模與預測,得到多個圖書館借閱量預測結果。
Step5:將多個圖書館借閱量預測結果傳輸到Reduce。
Step6:確定每一個最小二乘支持向量機的圖書館借閱量預測結果的權重,然后基于權值計算圖書館借閱量的最終預測結果。
2 圖書館借閱量的預測算例分析
2.1 云平臺搭建
為了分析基于云計算技術的圖書館借閱量建模與預測方法的有效性,搭建一個云平臺,該平臺共包括50個節點,其基本結構可以用圖3描述。
2.2 圖書館借閱量歷史數據
對一個大學的圖書館借閱量一段時間的數據進行采集,共得到300個圖書館借閱量樣本,變化曲線如圖4所示。
2.3 結果與分析
2.3.1 圖書館借閱量預測精度比較
選擇支持向量機的圖書館借閱量建模與預測方法、神經網絡的圖書館借閱量建模與預測方法進行對比測試,均進行5次仿真測試,選擇最后200個樣本作為驗證樣本,其他為訓練樣本,統計它們的圖書館借閱量預測精度,結果如圖5所示。從圖5可以看出:支持向量機的圖書館借閱量預測精度均值為92.18%;神經網絡的圖書館借閱量預測精度均值為87.02%;本文方法的圖書館借閱量預測精度均值為95.72%,本文方法的圖書館借閱量預測精度最高,從而減少了圖書館借閱量預測誤差,驗證了本文方法的圖書館借閱量預測結果的優越性。
2.3.2 圖書館借閱量預測效率比較
統計圖書館借閱量建模與預測方法的訓練時間和預測時間,如表1所示。從表1可知,本文方法的圖書館借閱量訓練時間和預測時間的均值分別為6.03 s和1.11 s;支持向量機的圖書館借閱量訓練時間和預測時間的均值分別為27.49 s和3.62 s;神經網絡的圖書館借閱量訓練時間和預測時間的均值為13.10 s和2.51 s。本文方法減少了圖書館借閱量建模時間,加快了圖書館借閱量預測速度,獲得了更高的圖書館借閱量預測效率。
3 結 語
為了提高圖書館借閱量預測精度,針對當前圖書館借閱量預測過程存在的一些問題,提出了基于云計算技術的圖書館借閱量建模與預測方法。為了驗證本文方法的性能,與其他方法進行了圖書館借閱量預測仿真測試實驗。結果表明,本文方法不僅圖書館借閱量預測精度高,而且減少了圖書館借閱量預測時間,加快了圖書館借閱量預測速度,實際應用價值更高。
參考文獻
[1] 牛秀.基于多參數指數平滑的圖書借閱量預測[J].科技情報開發與經濟,2011,21(28):50?51.
[2] 于曦.基于Unicorn和SPSS的圖書借閱量周期性分析及預測[J].山東圖書館學刊,2011(1):52?56.
[3] 劉素兵,劉海明,苗佳晶,等.圖書借閱量的灰色回歸組合模型研究[J].云南民族大學學報(自然科學版),2010,19(3):170?172.
[4] 孫寶.圖書借閱量預測模型[J].華北科技學院學報,2006(3):121?124.
[5] 張東波,林永杰,盧凱,等.基于云計算的大規模交通路網的最短路徑算法[J].華南理工大學學報(自然科學版),2018,46(12):139?146.
[6] 葛凡.基于灰色系統模型的圖書借閱量預測分析:以青島科技大學圖書館為例[J].教育教學論壇,2018(46):106?109.
[7] 許志榮,陳倩,過榴曉.基于時間序列分析的高校圖書館借閱量研究:以江南大學圖書館為例[J].農業圖書情報學刊,2018,30(10):107?110.
[8] 陳明.一元線性回歸模型預測圖書借閱量[J].大學教育,2016(5):111?112.
[9] 陳英.圖書借閱量預測建模方法比較研究[J].科技視界,2014(23):222?223.
[10] 汪玉杰,劉智立.基于BP神經網絡對圖書借閱量的預測研究[J].科技創新與應用,2013(36):25?26.
[11] 鄒梅.利用神經網絡技術預測圖書借閱量[J].蘭臺世界,2013(20):135?136.
[12] 張囡,張永梅.基于灰色神經網絡的圖書館圖書借閱量預測[J].情報探索,2013(3):133?135.
[13] 劉雄飛,聶偉,陳浩,等.基于云計算平臺的室內環境監測系統設計與實現[J].傳感器與微系統,2019,38(3):92?95.
作者簡介:劉嫦娥(1983—),女,江西南昌人,中級職稱,圖書館館員,主要從事圖書館相關方面的研究。
(斯Hn)