用戶(hù)名: 密碼: 驗(yàn)證碼:

IBM實(shí)驗(yàn)室:集成光子神經(jīng)網(wǎng)絡(luò)的新機(jī)遇

摘要:瑞士蘇黎世IBM研究中心的Bert Jan Offrein等人在Nanophotonics期刊上發(fā)表綜述:評(píng)述了集成光學(xué)解決方案在加速推理和人工神經(jīng)網(wǎng)絡(luò)訓(xùn)練方面的前景。

  近日,來(lái)自瑞士蘇黎世IBM研究中心的Bert Jan Offrein等人在Nanophotonics期刊上發(fā)表綜述:評(píng)述了集成光學(xué)解決方案在加速推理和人工神經(jīng)網(wǎng)絡(luò)訓(xùn)練方面的前景。

  計(jì)算突觸功能,在計(jì)算上是非常昂貴的,并且不能很好的在先進(jìn)的計(jì)算平臺(tái)上規(guī)?;?。利用集成光學(xué)器件的線(xiàn)性和非線(xiàn)性來(lái)進(jìn)行模擬信號(hào)處理,可以大幅度提高這些人工智能工作負(fù)載的性能和功率效率。集成光子學(xué)的高速運(yùn)行能力為時(shí)間實(shí)時(shí)應(yīng)用提供了機(jī)會(huì),而芯片級(jí)集成為制造和封裝成本效益的鋪平了道路。

  集成光學(xué)器件為神經(jīng)形態(tài)計(jì)算提供了一些性能優(yōu)勢(shì),如:形狀因素、可制造性、成本、機(jī)械穩(wěn)定性和可高速調(diào)制。

  集成光子神經(jīng)網(wǎng)絡(luò)有哪些新機(jī)遇?

  一、集成光子學(xué)RC系統(tǒng)

  儲(chǔ)備池計(jì)算(reservoir computing,RC)是其中一種非常適合順序數(shù)據(jù)處理的計(jì)算概念(圖2)。輸入數(shù)據(jù)流被耦合到一個(gè)庫(kù),它由遞歸鏈接的神經(jīng)元組成。輸入信號(hào)和存儲(chǔ)信號(hào)之間以及存儲(chǔ)信號(hào)內(nèi)部的突觸連接是隨機(jī)分配并保持固定的。因此RC系統(tǒng)構(gòu)成了一種特殊類(lèi)型的遞歸神經(jīng)網(wǎng)絡(luò)(RNN)。

圖2. 儲(chǔ)備池計(jì)算方法

圖源:Nanophotonics / 圖譯:Fortuner(撰稿人)

  為了避免信號(hào)在庫(kù)中的指數(shù)增長(zhǎng),對(duì)庫(kù)中的權(quán)值進(jìn)行了縮放,使系統(tǒng)滿(mǎn)足回波狀態(tài)特性。在訓(xùn)練過(guò)程中,只學(xué)習(xí)輸出層的權(quán)值。

  RC系統(tǒng)因其相比于一般的RNNs大大簡(jiǎn)化了訓(xùn)練而引起人們的興趣。雖然簡(jiǎn)單的訓(xùn)練方法仍然是有益的,但在過(guò)去的幾年里,深度學(xué)習(xí)方法取得了巨大的進(jìn)步,使得RNNs在RC系統(tǒng)難以解決的復(fù)雜任務(wù)上得到了非常有效的應(yīng)用。然而,RC對(duì)于神經(jīng)形態(tài)系統(tǒng)仍然是一個(gè)有趣的概念,因?yàn)楣潭?quán)重很好的映射到各種馮諾依曼器件的實(shí)現(xiàn)。

  從電子到光學(xué),機(jī)械以及生物,作者對(duì)塊體,光纖以及集成光子RC系統(tǒng)進(jìn)行了詳細(xì)的研究。在本文,作者對(duì)集成系統(tǒng)進(jìn)行概述。

  集成光子存儲(chǔ)系統(tǒng),它的一些早期概念是圍繞半導(dǎo)體光放大器(SOAs)所開(kāi)展的。每個(gè)SOAs由于其功率飽和行為展現(xiàn)了一個(gè)光學(xué)非線(xiàn)性的性質(zhì),并具有豐富的內(nèi)部動(dòng)態(tài)行為。改進(jìn)的體系結(jié)構(gòu)在各種任務(wù)的數(shù)值模擬中展現(xiàn)出比傳統(tǒng)軟件更佳的性能。然而,由于SOA的功耗較大,因此這些網(wǎng)絡(luò)的功率效率有限。

  多年來(lái),研究人員對(duì)架構(gòu)進(jìn)行了各種改進(jìn),通過(guò)向多個(gè)節(jié)點(diǎn)注入輸入信號(hào),優(yōu)化輸入方案,實(shí)現(xiàn)了更好的網(wǎng)絡(luò)功率分配(圖3)。然而,儲(chǔ)層內(nèi)的非線(xiàn)性,在電子域內(nèi)檢測(cè)和加權(quán)輸出信號(hào)所帶來(lái)的帶寬限制和延遲,以及并行操作所需的大量光電探測(cè)器,將極大的限制這些系統(tǒng)的實(shí)際適用性。

圖3. 兩種集成的光子儲(chǔ)層計(jì)算架構(gòu)

圖源:Nanophotonics / 圖譯:Fortuner(撰稿人 )

  二、用于神經(jīng)網(wǎng)絡(luò)訓(xùn)練的集成光子設(shè)備

  集成光學(xué)技術(shù)的第二個(gè)令人興奮的機(jī)會(huì)與人工神經(jīng)網(wǎng)絡(luò)訓(xùn)練有關(guān),建立一個(gè)增強(qiáng)的神經(jīng)網(wǎng)絡(luò)訓(xùn)練技術(shù)平臺(tái)是非常重要的。最近的出版物顯示了當(dāng)今技術(shù)在神經(jīng)網(wǎng)絡(luò)訓(xùn)練中的巨大環(huán)境進(jìn)展。

  優(yōu)化光子神經(jīng)網(wǎng)絡(luò)的訓(xùn)練有兩種基本方法:1. 訓(xùn)練方法適應(yīng)匹配系統(tǒng)兼容性。2. 在一般的訓(xùn)練方法中,如隨機(jī)梯度和反向傳播的運(yùn)算是通過(guò)光硬件來(lái)加速的。

  將兩個(gè)神經(jīng)層間突觸連接的推理計(jì)算擴(kuò)展到一個(gè)技術(shù)平臺(tái),其中反向傳播和權(quán)值更新步驟也通過(guò)光信號(hào)處理以完全并行的方式進(jìn)行。

  在基于馬赫-曾德?tīng)柛缮嬗?jì)的向量矩陣乘法概念中,矩陣元素值由外部子系統(tǒng)設(shè)置。因此,在優(yōu)化過(guò)程中改變這些值將需要信號(hào)從神經(jīng)網(wǎng)絡(luò)輸出流到控制系統(tǒng)。針對(duì)這種結(jié)構(gòu)人們提出了一種支持反向傳播算法的訓(xùn)練算法。

  它基于在該器件中進(jìn)行強(qiáng)度測(cè)量并存儲(chǔ)所獲得的值以供后續(xù)步驟處理。該通信路徑仍然會(huì)帶來(lái)信息流瓶頸,從而限制了訓(xùn)練算法的性能和功耗。需要一種局部權(quán)值更新機(jī)制,直接在網(wǎng)絡(luò)中獲取信號(hào)。

  為了訓(xùn)練前饋的DNN,可以使用隨機(jī)梯度下降和反向傳播,作者對(duì)反向傳播算法的訓(xùn)練方法步驟進(jìn)行了總結(jié),以幫助讀者理解隨后提出的光信號(hào)處理器的優(yōu)點(diǎn):步驟1:用目標(biāo)響應(yīng)tk正向傳播訓(xùn)練輸入樣本xk,并存儲(chǔ)相應(yīng)輸出y。步驟 2:對(duì)于每個(gè)訓(xùn)練樣本,使用一個(gè)損耗函數(shù)計(jì)算目標(biāo)輸出和獲得的輸出之間的損失。通常,平方誤差用作損耗函數(shù)。步驟3:對(duì)于每一個(gè)訓(xùn)練樣本,找到錯(cuò)誤信號(hào),錯(cuò)誤信號(hào)代表在一個(gè)神經(jīng)元上的輸入對(duì)總損耗的影響有多大。這種誤差信號(hào)可以通過(guò)權(quán)值矩陣轉(zhuǎn)置后通過(guò)網(wǎng)絡(luò)向后傳播,并使用激活函數(shù)的導(dǎo)數(shù)來(lái)獲得。步驟4:利用(步驟3)中得到的誤差信號(hào),更新權(quán)重使損耗最小化。

  最后,反復(fù)重復(fù)(1-4)的步驟,直到損耗達(dá)到最小值。

圖4. 利用具有兩層隱含層的前饋神經(jīng)網(wǎng)絡(luò)進(jìn)行前向和后向傳播,用于網(wǎng)絡(luò)權(quán)重訓(xùn)練。

圖源:Nanophotonics/圖譯:Fortuner(撰稿人 )

  早在20世紀(jì)90年代,一個(gè)光子系統(tǒng)就已經(jīng)被證明,在這個(gè)系統(tǒng)中,加權(quán)元素被存儲(chǔ)在一個(gè)光折變材料的體材料中。MAC操作是通過(guò)兩束光折變晶體中形成的折射率光柵的衍射效率來(lái)實(shí)現(xiàn)的。圖5描述了單個(gè)權(quán)重和兩個(gè)突出權(quán)重的形成和工作原理。

圖5. 權(quán)重的形成和工作原理

圖源:Nanophotonics

  硅光子學(xué)的可用性和像鈦酸鋇,Ⅲ-Ⅴ族薄層材料等材料的整合性為實(shí)現(xiàn)模擬芯片級(jí)光子突觸處理單元提供了機(jī)會(huì)。作者展示了一個(gè)基于光折變效應(yīng)實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)操作的器件布局(圖6)。

  圖6. 用于推理和訓(xùn)練的集成光子突觸處理器的示意圖

  圖源:Nanophotonics / 圖譯:Fortuner(撰稿人)

  將一薄層光折邊材料鍵合在硅光芯片上。電光調(diào)制器將電輸入矢量轉(zhuǎn)換為光束所需的功率和相位。探測(cè)器陣列將矢量矩陣輸出信號(hào)轉(zhuǎn)換回電域。

  從本質(zhì)上講,光折變效果可以很好地控制和調(diào)整權(quán)重值。這對(duì)于有效的訓(xùn)練很重要,為定期更新矩陣元素的模擬矢量矩陣乘法提供了機(jī)會(huì)。

  總結(jié)

  神經(jīng)形態(tài)計(jì)算技術(shù)催生的光子發(fā)展在帶寬、處理速度和可控性方面展現(xiàn)了出色特性。集成光子學(xué)在神經(jīng)網(wǎng)絡(luò)推理和訓(xùn)練中的潛力巨大。訓(xùn)練人工神經(jīng)網(wǎng)絡(luò)的新概念等仍舊需要進(jìn)一步的技術(shù)發(fā)展。將光子神經(jīng)形態(tài)計(jì)算的結(jié)果與其他平臺(tái)技術(shù)進(jìn)行比較,這對(duì)于將研究工作導(dǎo)向最有前景的應(yīng)用是很重要的。


  文章信息

  Pascal Stark, Folkert Horst, Roger Dangel, Jonas Weiss,Bert Jan Offrein,Opportunities for integrated photonic neural networks,Nanophotonics 2020; 9(13): 4221–4232

  文章地址

  https://doi.org/10.1515/nanoph-2020-0297



  來(lái)源|中國(guó)光學(xué)(ChineseOptics)

  撰稿|Fortuner(西湖大學(xué) 博士生)


內(nèi)容來(lái)自:中國(guó)光學(xué)
本文地址:http://huaquanjd.cn//Site/CN/News/2021/02/07/20210207010207995522.htm 轉(zhuǎn)載請(qǐng)保留文章出處
關(guān)鍵字: 集成光子
文章標(biāo)題:IBM實(shí)驗(yàn)室:集成光子神經(jīng)網(wǎng)絡(luò)的新機(jī)遇
【加入收藏夾】  【推薦給好友】 
1、凡本網(wǎng)注明“來(lái)源:訊石光通訊網(wǎng)”及標(biāo)有原創(chuàng)的所有作品,版權(quán)均屬于訊石光通訊網(wǎng)。未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對(duì)于經(jīng)過(guò)授權(quán)可以轉(zhuǎn)載我方內(nèi)容的單位,也必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和本站來(lái)源。
2、免責(zé)聲明,凡本網(wǎng)注明“來(lái)源:XXX(非訊石光通訊網(wǎng))”的作品,均為轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀(guān)點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。因可能存在第三方轉(zhuǎn)載無(wú)法確定原網(wǎng)地址,若作品內(nèi)容、版權(quán)爭(zhēng)議和其它問(wèn)題,請(qǐng)聯(lián)系本網(wǎng),將第一時(shí)間刪除。
聯(lián)系方式:訊石光通訊網(wǎng)新聞中心 電話(huà):0755-82960080-168   Right