SmartPlanet 的這則文章這樣寫道:用戶對著iPhone說話后,這些語音將立即被編碼,并轉(zhuǎn)換成一個(gè)壓縮數(shù)字文件,該文件包含了用戶語音的相關(guān)信息。由于用戶手機(jī)處于開機(jī)狀態(tài),這些語音信號將被轉(zhuǎn)入用戶所使用移動(dòng)運(yùn)營商的基站當(dāng)中,然后再通過一系列固定電線發(fā)送至用戶的互聯(lián)網(wǎng)服務(wù)供應(yīng)商(ISP),該ISP擁有云計(jì)算服務(wù)器。該服務(wù)器中的內(nèi)置系列模塊,將通過技術(shù)手段來識(shí)別用戶剛才說過的內(nèi)容。
與此同時(shí),用戶說過的語音內(nèi)容,也將在用戶手機(jī)當(dāng)中被加以識(shí)別和分析。安裝在用戶手機(jī)中的語音識(shí)別器,將同云計(jì)算服務(wù)器聯(lián)系,以了解指令是否適合通過本地方式 (即在用戶手機(jī)當(dāng)中)被處理。比如用戶指令可能要求手機(jī)播放一首歌曲,而其他一些指令則有可能需要手機(jī)與網(wǎng)絡(luò)連接,以尋求進(jìn)一步幫助。如果語音識(shí)別器認(rèn)為,手機(jī)內(nèi)部模塊完全有能力處理用戶的指令,那么手機(jī)將會(huì)告知云計(jì)算服務(wù)器,不需要云服務(wù)器的支持。
根據(jù)用戶說話的聲調(diào)和語序,云服務(wù)器將對語音加以靜態(tài)對比,以了解用戶所說語音中包含了哪些字母。在此期間,用戶手機(jī)的語音識(shí)別器也將對用戶語音進(jìn)行靜態(tài)對比。無論是在服務(wù)器端還是手機(jī)端,可能性最高的識(shí)別內(nèi)容都將獲得優(yōu)先處理權(quán)。
通過上述處理程序,被識(shí)別出的那部分用戶語音內(nèi)容,已經(jīng)包含一系列元音和輔音字母。隨后這些內(nèi)容將被發(fā)送至一個(gè)語言模塊,以分析用戶語音中可能包含了哪些詞匯。在此基礎(chǔ)上,計(jì)算機(jī)將根據(jù)所識(shí)別詞匯的可信度級別,而創(chuàng)建一個(gè)用戶所說內(nèi)容的列表,從而具體分析用戶語音表述中最有可能會(huì)表達(dá)何種意思。
如果上述分析和判斷結(jié)果已具有足夠的可信度,那么計(jì)算機(jī)將能理解用戶所說的內(nèi)容:比如計(jì)算機(jī)得出結(jié)論,用戶是要求手機(jī)發(fā)送短信或查找聯(lián)系人列表中的某個(gè)聯(lián)系人。在經(jīng)過上述一系列后臺(tái)處理后,用戶將會(huì)看到手機(jī)屏幕上出現(xiàn)所需的內(nèi)容,而不必進(jìn)行手動(dòng)操作。在此過程中,如果用戶的語音含義過于模糊,計(jì)算機(jī)就會(huì)詢問用戶,以了解用戶希望查找的聯(lián)系人究竟是埃里卡·奧爾森(Erica Olssen)還是埃里卡·施密特(Erica Schmidt)。
SmartPlanet網(wǎng)站上的原文還談到了搜索產(chǎn)業(yè)的發(fā)展史,其中包括谷歌、微軟以及其他科技公司在語音識(shí)別技術(shù)領(lǐng)域所作出的努力。
推薦閱讀
AMD宣布全球裁員10% 原因?yàn)镻C市場表現(xiàn)疲弱
AMD在周四宣布,公司將進(jìn)行重組以提高其競爭力,降低成本結(jié)購。在重組中最重要的便是裁減10%員工,原因是PC市場表現(xiàn)疲弱。此次裁員預(yù)計(jì)2012年第一季度完成。 AMD表示,這項(xiàng)裁員措施應(yīng)可幫助該公司在第四季度節(jié)省1000>>>詳細(xì)閱讀
本文標(biāo)題:本地語音識(shí)別加云計(jì)算 蘋果Siri工作原理詳解
地址:http://www.oumuer.cn/a/01/20121229/104805.html