ICCSZ訊 “雙十一”來到第11年,直播風(fēng)頭正勁?!八信边@句來自主播李佳琦的口頭禪,成為直播時(shí)代的宣言,無數(shù)人為之掏空口袋。今年“雙十一”期間,淘寶直播已經(jīng)成為商家標(biāo)配,服飾、美妝、食品等行業(yè)商家紛紛拿起了直播工具,有人甚至戲稱:現(xiàn)在還不開直播的店鋪,就跟沒有詳情頁一樣。
為了更好的觀看體驗(yàn),淘寶自主研發(fā)了全新的音視頻實(shí)時(shí)通信架構(gòu),實(shí)現(xiàn)了大規(guī)模低延時(shí)直播,從原先5秒至7秒的延時(shí)降低至2秒以內(nèi),提升了用戶和主播的互動(dòng)效率,此外,人工智能技術(shù)還可以實(shí)時(shí)識(shí)別主播正在講解的商品,陳列在直播頁面中。
沒錯(cuò),時(shí)代的風(fēng)吹到哪,技術(shù)先行抵達(dá)。直播、短視頻當(dāng)?shù)溃@類“雙十一”新玩法的背后,也有不斷進(jìn)步的AI。
AI助手為主播分憂
進(jìn)出直播間的剁手黨成千上萬,分分鐘形成刷屏之勢,主播分身乏術(shù)。這時(shí)候,他的AI秘書就登場了。給主播打下手,提供主播問答、商品問答、優(yōu)惠券問答等服務(wù)都不在話下,也就是說,你在直播間問的問題,大多都是AI助手在解答。
據(jù)阿里巴巴達(dá)摩院資深總監(jiān)、阿里巴巴集團(tuán)智能服務(wù)事業(yè)部總經(jīng)理趙昆介紹,AI秘書使用了自然語言理解和基于知識(shí)圖譜問答等技術(shù),能夠精確解析直播間觀眾對(duì)于商品和主播的多種復(fù)雜表達(dá)和問法,在直播場中實(shí)現(xiàn)多對(duì)一溝通的高效快速響應(yīng),大比例提高直播間的客戶問題的回復(fù)率、解決率。
除了基于文字,AI客服還可以進(jìn)行基于圖片的智能問答。趙昆表示,AI客服利用圖片解析算法理解圖片內(nèi)容,結(jié)合用戶的問題,自動(dòng)理解和識(shí)別截取可以回答用戶的圖片作為回答,并高亮圖片中的精確答案位置。目前,智能圖片問答已經(jīng)覆蓋了家電數(shù)碼、零食果蔬、母嬰洗護(hù)等多個(gè)行業(yè)。
方便了剁手黨,賣家同樣受惠于AI?!半p十一”期間,賣家需要在短時(shí)間內(nèi)制造大量宣傳圖、海報(bào)圖等,圖像智能生成技術(shù)就派上了用場。基于圖像智能生成技術(shù),AI設(shè)計(jì)師可以改變傳統(tǒng)的設(shè)計(jì)模式,在短時(shí)間內(nèi)完成大量橫幅廣告、海報(bào)圖和會(huì)場圖的設(shè)計(jì)。賣家只需要任意輸入想達(dá)成的風(fēng)格、尺寸,系統(tǒng)就能代替人工完成素材分析、摳圖、配色等耗時(shí)耗力的設(shè)計(jì)項(xiàng)目,實(shí)時(shí)生成多套符合要求的設(shè)計(jì)解決方案。
據(jù)阿里巴巴達(dá)摩院資深算法專家謝宣松介紹,目前該系統(tǒng)已經(jīng)達(dá)到了高級(jí)設(shè)計(jì)師的水準(zhǔn),每秒可以提供幾十種方案、可以設(shè)計(jì)8000張不同的海報(bào),去年“雙十一”期間,這位AI設(shè)計(jì)師就累計(jì)為20萬企業(yè)、商家設(shè)計(jì)了近600萬張圖片,消費(fèi)者在天貓網(wǎng)站看到的各種海報(bào)和活動(dòng)商品圖片幾乎都出自它手。
圖片之外,短視頻也成了標(biāo)配。謝宣松介紹,短視頻智能設(shè)計(jì)產(chǎn)品基于圖像智能識(shí)別技術(shù)和視頻智能生成技術(shù),幫助用戶在極短時(shí)間內(nèi)完成大量的商品營銷類短視頻的設(shè)計(jì)和制作?!坝脩糁恍枰斎肷唐吩斍轫撴溄踊蛘邚谋镜厣蟼鲌D片視頻素材,它就可以進(jìn)行圖片素材解析過濾、商品理解和定位、視頻素材剪裁準(zhǔn)備、視頻劇本導(dǎo)演、視頻渲染生成等一系列復(fù)雜的設(shè)計(jì)工作,并可以依據(jù)用戶的風(fēng)格尺寸等簡單的個(gè)性化要求進(jìn)行輸入,提供流媒體內(nèi)容生成視頻的解決方案?!敝x宣松解釋說。
機(jī)器翻譯幫助貨通全球
賣貨到全世界,語言不通怎么辦?“雙十一”之前,機(jī)器翻譯技術(shù)已經(jīng)經(jīng)歷了升級(jí),對(duì)話機(jī)器人可以幫助全世界中小賣家將產(chǎn)品詳情與評(píng)論自動(dòng)翻譯成當(dāng)?shù)卣Z言,還實(shí)現(xiàn)了實(shí)時(shí)AI語言翻譯的客戶服務(wù)與業(yè)務(wù)咨詢,涵蓋64種語言方向。當(dāng)然,獲取商品信息光靠看商家網(wǎng)頁還不夠,有問題找客服,海外消費(fèi)者也不例外。在國內(nèi),承擔(dān)客服職責(zé)的是對(duì)話機(jī)器人,這兩年,它還有了國際版,專門服務(wù)海外業(yè)務(wù)平臺(tái)。
據(jù)趙昆介紹,對(duì)話機(jī)器人精通英語、法語、泰語、西班牙語、阿拉伯語等11種語言,兩周就能學(xué)一門新外語。
“今年,對(duì)話機(jī)器人新學(xué)了阿拉伯語、法語和繁體中文,并且推出了馬來語—英語、泰語—英語等混合語言問答功能?!壁w昆說,“混合語言問答的情況在馬來西亞等地很常見,在當(dāng)?shù)氐目头鼍爸校蟛糠钟脩粲糜⒄Z咨詢,少數(shù)用戶用馬來語咨詢,并且常有英語、馬來語混用。對(duì)話機(jī)器人不僅要同時(shí)理解這兩種語言,還必須理解復(fù)雜的語言混用情況,并給出相應(yīng)的回答?!?
不過,它使用的并不是機(jī)器翻譯技術(shù),而是一種自然語言處理技術(shù)跨語言學(xué)習(xí)(Cross-lingual Learning)?!靶≌Z種缺乏大規(guī)模訓(xùn)練語料,很難通過過去的機(jī)器學(xué)習(xí)技術(shù)習(xí)得,跨語言學(xué)習(xí)能夠克服資源匱乏的瓶頸。”趙昆解釋說,跨語言學(xué)習(xí)是一種多語言的自然語言處理技術(shù),它通過語言之間的知識(shí)遷移,借助中文、英文等語料資源充足的語言,幫助算法模型提升理解小語種的能力,從而快速拓展機(jī)器人的多語種支持功能。借助跨語言學(xué)習(xí)技術(shù),對(duì)話機(jī)器人還能掌握更多語言,甚至包括土耳其語、烏爾都語等小語種。
“通俗地說,語言是符號(hào),不同的語言是不同的符號(hào)系統(tǒng)。想象語言所指的每個(gè)事物/知識(shí)都對(duì)應(yīng)一個(gè)確定的身份標(biāo)識(shí),后者在不同的語言中被不同的符號(hào)所代表,或者說,不同語言所用的符號(hào)映射到同一個(gè)語義空間??缯Z言學(xué)習(xí)做的是幫助機(jī)器理解語言所指的身份標(biāo)識(shí),并借助資源豐富的語言去學(xué)習(xí)資源匱乏的語言?!壁w昆進(jìn)一步解釋。
他表示,基于語言之間的交叉映射關(guān)系,對(duì)機(jī)器來說,在資源匱乏的情況下,通過將多種語言混合,學(xué)習(xí)語言間的共性,反而能比學(xué)習(xí)單一語言效果更好。2017年對(duì)話機(jī)器人初次在海外落地,用6個(gè)月學(xué)會(huì)了印尼語,又用6個(gè)月在智能客服崗位上達(dá)成堪比中文機(jī)器人的解決能力,而現(xiàn)在,多語機(jī)器人新學(xué)一門語言的時(shí)間已經(jīng)縮短到兩周。
聲紋識(shí)別開啟語音購元年
今年“雙十一”,語音購物千呼萬喚始出來:消費(fèi)者只要對(duì)天貓精靈說出想要購買的商品,就能直接下單;如果開通了“聲紋支付”功能,還可以直接語音付款。
“語音購元年”,聽起來科技感十足,據(jù)報(bào)道,已有數(shù)百萬人體驗(yàn)了語音購物,其中超過半數(shù)的用戶是首次嘗試。聲紋識(shí)別技術(shù)采用基于深度網(wǎng)絡(luò)的注意力嵌入式模型,通過網(wǎng)絡(luò)結(jié)構(gòu)的參數(shù)設(shè)計(jì),模擬了基于人耳感知的頻譜特征,可以在一定程度上消除同一人在不同場景發(fā)音下的頻譜特征差異干擾,顯著提升遠(yuǎn)場交互下的聲紋識(shí)別性能。
說話就能付錢,如何確保安全?阿里巴巴人工智能實(shí)驗(yàn)室語音技術(shù)首席科學(xué)家聶再清介紹,作為首個(gè)達(dá)到商用級(jí)別的聲紋識(shí)別技術(shù)智能音箱,天貓精靈的聲紋識(shí)別率已達(dá)99%,這是它支持聲紋支付功能的基礎(chǔ),在支付級(jí)應(yīng)用下,用戶只要通過3次不超過10秒的交互語音,聲紋識(shí)別技術(shù)就可以準(zhǔn)確刻畫用戶的魯棒性聲紋特征,實(shí)現(xiàn)超過99%的識(shí)別準(zhǔn)確度。
不僅如此,運(yùn)用中文識(shí)別的自然語言理解算法,語音設(shè)備可以準(zhǔn)確定位消費(fèi)者需要購買的商品,以平臺(tái)大數(shù)據(jù)為基礎(chǔ),依托聲紋推薦能力,為消費(fèi)者進(jìn)行個(gè)性化推薦?!霸谡Z音購場景,天貓精靈基于注意力記憶網(wǎng)絡(luò)可以自主學(xué)習(xí)各個(gè)行業(yè)導(dǎo)購員的經(jīng)驗(yàn),并結(jié)合用戶特點(diǎn)呈現(xiàn)最優(yōu)的導(dǎo)購流程,成為最懂用戶和最懂行業(yè)的智能導(dǎo)購員。”聶再清說。
此外,今年“雙十一”,消費(fèi)者還可以體驗(yàn)AR試妝產(chǎn)品,AR試妝通過標(biāo)準(zhǔn)化工具拿到彩妝色號(hào)、材質(zhì)等數(shù)字信息,通過AI+AR技術(shù)讓用戶看到同樣商品在自己臉上呈現(xiàn)出的不同效果。通過高效實(shí)時(shí)的精準(zhǔn)人臉識(shí)別技術(shù),即便在人臉晃動(dòng)和大角度偏轉(zhuǎn)時(shí),都能有很好的穩(wěn)定性表現(xiàn),以毫秒級(jí)別畫出商品在用戶臉上的逼真效果。新玩法背后是新技術(shù)。在屢屢刷新的成交額、令人瞠目的商業(yè)數(shù)字之外,不斷突破的技術(shù)正貼地而行。