
自主創(chuàng)新之路再立豐碑
日前,由同方鼎欣和清華大學(xué)信息技術(shù)研究院語(yǔ)言和語(yǔ)音實(shí)驗(yàn)室合作研發(fā)的『一種非漢語(yǔ)語(yǔ)音識(shí)別方法、系統(tǒng)及其構(gòu)造方法』榮獲國(guó)家發(fā)明專利權(quán)(專利號(hào):201710156620.8)。

該發(fā)明填補(bǔ)了國(guó)內(nèi)在語(yǔ)音識(shí)別系統(tǒng)領(lǐng)域的一項(xiàng)技術(shù)空白,這項(xiàng)技術(shù)具備深厚的人工智能信息技術(shù)的積淀和創(chuàng)新內(nèi)涵,并且有潛在較大的商業(yè)應(yīng)用前景,將持續(xù)產(chǎn)生顯著的社會(huì)和經(jīng)濟(jì)效益!
聊點(diǎn)專業(yè)的:專利內(nèi)容解析
『一種非漢語(yǔ)語(yǔ)音識(shí)別方法、系統(tǒng)及其構(gòu)造方法』基于跨語(yǔ)言因子對(duì)日語(yǔ)聲學(xué)模型進(jìn)行增強(qiáng),能夠高效地進(jìn)行大數(shù)據(jù)訓(xùn)練從而構(gòu)建基于神經(jīng)網(wǎng)絡(luò)的聲學(xué)模型;能夠?qū)φ_標(biāo)注的大量日語(yǔ)語(yǔ)音數(shù)據(jù)進(jìn)行解析,通過(guò)收集大量文本資源進(jìn)行語(yǔ)言處理,生成識(shí)別解碼器,從而對(duì)輸入語(yǔ)音進(jìn)行語(yǔ)音解碼結(jié)果評(píng)判。

本專利結(jié)合對(duì)于日語(yǔ)自然語(yǔ)言處理、日語(yǔ)詞庫(kù)建設(shè)、日語(yǔ)文本分詞手段等多種技術(shù)和非技術(shù)因素的綜合考慮,運(yùn)用了人工智能領(lǐng)域的主流成熟的深度學(xué)習(xí)和大數(shù)據(jù)處理等多項(xiàng)核心技術(shù),技術(shù)要素比較繁多,技術(shù)難度比較高。
l 在實(shí)施商業(yè)項(xiàng)目前期調(diào)研分析了科研和產(chǎn)業(yè)界的多種語(yǔ)音識(shí)別技術(shù)框架和多項(xiàng)技術(shù)手段,并比照分析研究了許多新的技術(shù)手法和算法;
l 采納語(yǔ)音領(lǐng)域主流框架Kaldi,廣泛消化和吸收了其所帶來(lái)的先進(jìn)概念、設(shè)計(jì)和算法,融合了業(yè)界一些有用的跨語(yǔ)言技術(shù);
l 借鑒現(xiàn)有中文語(yǔ)音識(shí)別的模型資源,利用跨語(yǔ)言因子技術(shù),對(duì)資源較為匱乏的日語(yǔ)語(yǔ)音語(yǔ)言資源所訓(xùn)練的聲學(xué)模型進(jìn)行增強(qiáng)。
從而實(shí)現(xiàn)可基于相對(duì)較少的日語(yǔ)數(shù)據(jù)資源可以有效地訓(xùn)練日語(yǔ)語(yǔ)音識(shí)別系統(tǒng)的神經(jīng)網(wǎng)絡(luò)模型,并繼承漢語(yǔ)模型對(duì)噪聲和口音的魯棒性,提升系統(tǒng)實(shí)用性能。

此專利應(yīng)用于提升既有機(jī)器人處理日語(yǔ)自然語(yǔ)言、語(yǔ)音、機(jī)器會(huì)話、自然語(yǔ)言對(duì)話系統(tǒng)等水準(zhǔn),升級(jí)現(xiàn)有產(chǎn)品的語(yǔ)音語(yǔ)言處理的人工智能技術(shù)水平。
課代表總結(jié):本發(fā)明提出并實(shí)現(xiàn)了一種利用既有的中文語(yǔ)音資源及其訓(xùn)練出的模型實(shí)現(xiàn)知識(shí)轉(zhuǎn)移,使得可以利用相對(duì)少量必須的日語(yǔ)數(shù)據(jù)資源就可以快捷地構(gòu)造出有效的日語(yǔ)語(yǔ)音識(shí)別系統(tǒng)的方法。以此為基礎(chǔ)進(jìn)一步可基于小數(shù)據(jù)資源和低算力資源條件下構(gòu)建特定語(yǔ)言的語(yǔ)音識(shí)別系統(tǒng),因而本項(xiàng)專利實(shí)現(xiàn)具有很高的技術(shù)價(jià)值和商用價(jià)值。
由于利用知識(shí)轉(zhuǎn)移手法采取既有的漢語(yǔ)語(yǔ)音識(shí)別技術(shù)的經(jīng)驗(yàn)和吸納有關(guān)技術(shù),研發(fā)團(tuán)隊(duì)在實(shí)施日語(yǔ)的語(yǔ)音識(shí)別項(xiàng)目研發(fā)時(shí),避免了很多不確定性因素和開(kāi)發(fā)彎路,有效運(yùn)用了寶貴的算力資源;在針對(duì)各個(gè)技術(shù)環(huán)節(jié)特別是模型參數(shù)選擇等的嘗試驗(yàn)證和組合驗(yàn)證的效率上有了極大的提升和改善。
一項(xiàng)專利 可觀效益
語(yǔ)音識(shí)別引擎系統(tǒng)的開(kāi)發(fā)是當(dāng)前人工智能領(lǐng)域熱門(mén)的技術(shù)話題之一,特別是國(guó)內(nèi)針對(duì)日語(yǔ)做語(yǔ)音識(shí)別的成功案例不多。任何一個(gè)人工智能項(xiàng)目的建設(shè)前期依賴于豐富的資源建設(shè),依賴于強(qiáng)大的算力資源支持從而訓(xùn)練生成高效的神經(jīng)網(wǎng)絡(luò)系統(tǒng),后期則是在良好和高效的模型引擎基礎(chǔ)上進(jìn)行業(yè)務(wù)系統(tǒng)的應(yīng)用開(kāi)發(fā)。

目前市面上還缺乏既被廣泛認(rèn)知又適用于特定語(yǔ)種語(yǔ)言,特定行業(yè)業(yè)務(wù)運(yùn)用的高度AI技術(shù)的語(yǔ)音識(shí)別商用系統(tǒng),因此本發(fā)明在實(shí)施過(guò)程中積累的技術(shù)經(jīng)驗(yàn)可以在未來(lái)持續(xù)帶動(dòng)符合用戶需求的語(yǔ)料資源建設(shè)加工,以及與同樣來(lái)源于語(yǔ)音信號(hào)的聲紋技術(shù)、自然語(yǔ)言的情感技術(shù)、多輪對(duì)話系統(tǒng)等結(jié)合起來(lái),通過(guò)這些技術(shù)的連動(dòng)和集成,相輔相成,進(jìn)一步推動(dòng)和開(kāi)拓技術(shù)的深度與廣度,靈活地運(yùn)用于產(chǎn)業(yè)和服務(wù)機(jī)器人等綜合性的應(yīng)用系統(tǒng)和產(chǎn)品開(kāi)發(fā)中。
該發(fā)明在方興未艾、群雄紛爭(zhēng)的人工智能發(fā)展潮流中為同方鼎欣爭(zhēng)得了一席之地。既有利于為公司進(jìn)一步拓展海內(nèi)外市場(chǎng),帶來(lái)相應(yīng)的經(jīng)濟(jì)效益,更能為人工智能時(shí)代的信息產(chǎn)品增添亮眼的新技術(shù),助力行業(yè)和科技發(fā)展。
——·——
同方鼎欣將以此發(fā)明專利證書(shū)的獲得為契機(jī)和動(dòng)力,加大對(duì)人工智能相關(guān)技術(shù)的投入和開(kāi)拓,實(shí)施和語(yǔ)音有關(guān)的聲紋識(shí)別、計(jì)算機(jī)自然語(yǔ)言理解、智能會(huì)話以及從日語(yǔ)到中文等多語(yǔ)種的語(yǔ)音識(shí)別等技術(shù),實(shí)現(xiàn)在國(guó)內(nèi)外多業(yè)務(wù)上的應(yīng)用。
未來(lái),公司將進(jìn)一步完善知識(shí)產(chǎn)權(quán)保護(hù)體系,發(fā)揮自主知識(shí)產(chǎn)權(quán)優(yōu)勢(shì),并形成持續(xù)創(chuàng)新機(jī)制,提升公司的核心競(jìng)爭(zhēng)力,以自主創(chuàng)新技術(shù)為多領(lǐng)域客戶提供更高端、更專業(yè)的IT服務(wù)。
京公網(wǎng)安備 11010802024764號(hào)