本發(fā)明涉及車輛,特別涉及一種車載語音交互系統(tǒng)的參數(shù)管理方法及電子設(shè)備。
背景技術(shù):
1、語音活性檢測(voiceactivity?detection,vad)技術(shù)是一項用于語音處理的技術(shù),目的是檢測語音信號是否存在。當(dāng)前,車載語音交互系統(tǒng)的vad結(jié)束時間這一參數(shù)是固定的。因此,當(dāng)前車載語音交互系統(tǒng)采用固定的語音交互后端點策略來結(jié)束語音輸入。也即,車載語音交互系統(tǒng)若在固定的vad結(jié)束時間內(nèi)沒有檢測到新的用戶語音,則會結(jié)束語音交互。但在實際行車過程中,經(jīng)常存在用戶未及時完成語音指令的輸入的情況。因此,基于固定的vad結(jié)束時間,也即固定的語音交互后端點,結(jié)束語音交互,可能會存在語音交互被過早結(jié)束,影響用戶體驗的問題。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的在于解決車輛中采用固定的vad結(jié)束時間,也即固定的語音交互后端點策略,結(jié)束語音交互,可能會存在語音交互被過早結(jié)束,從而影響用戶體驗的問題。
2、為解決上述技術(shù)問題,第一方面,本發(fā)明的實施方式公開了一種車載語音交互系統(tǒng)的參數(shù)管理方法,該方法包括:獲取目標(biāo)信息,目標(biāo)信息包括車輛的行駛狀態(tài)信息和/或車輛中用戶的用戶狀態(tài)信息;根據(jù)目標(biāo)信息,調(diào)整車載語音交互系統(tǒng)的語音活性檢測結(jié)束時間。
3、采用上述方法時,可以基于獲得的車輛的行駛狀態(tài)信息和/或車輛中用戶的用戶狀態(tài)信息調(diào)整車載語音交互系統(tǒng)的語音活性檢測結(jié)束時間?;谲囕v的行駛狀態(tài)信息和/或用戶的用戶狀態(tài)信息調(diào)整車載語音交互系統(tǒng)的語音活性檢測結(jié)束時間,使得車載語音交互系統(tǒng)的語音活性檢測結(jié)束時間能夠被動態(tài)調(diào)整,可以減少或者避免語音交互被過早結(jié)束的情況,從而確保用戶能夠完整的完成語音輸入,提高語音交互的準(zhǔn)確性,以及提升用戶體驗。另外,還可以提升車輛語音控制的及時性和準(zhǔn)確性,提升車輛駕駛安全等。
4、根據(jù)上述權(quán)要及相關(guān)內(nèi)容,本發(fā)明的實施方式公開的一種車載語音交互系統(tǒng)的參數(shù)管理方法中,在目標(biāo)信息包括行駛狀態(tài)信息的情況下,根據(jù)目標(biāo)信息,調(diào)整車載語音交互系統(tǒng)的語音活性檢測結(jié)束時間,包括:將行駛狀態(tài)信息輸入至駕駛場景識別模型中,得到車輛的駕駛場景;根據(jù)車輛的駕駛場景,確定車載語音交互系統(tǒng)的語音活性檢測結(jié)束時間。
5、采用上述車載語音交互系統(tǒng)的參數(shù)管理方法時,根據(jù)車輛的駕駛場景,確定語音活性檢測結(jié)束時間,使得語音活性檢測結(jié)束時間與駕駛場景相對應(yīng),從而在不同駕駛場景下分別有對應(yīng)的語音活性檢測結(jié)束時間,可以有效的保證在車輛處于不同駕駛場景時,用戶依舊能夠完整的完成語音輸入,提高語音交互的準(zhǔn)確性,提高用戶的體驗感。
6、根據(jù)上述權(quán)要及相關(guān)內(nèi)容,本發(fā)明的實施方式公開的一種車載語音交互系統(tǒng)的參數(shù)管理方法中,在目標(biāo)信息包括用戶狀態(tài)信息的情況下,根據(jù)目標(biāo)信息,調(diào)整車載語音交互系統(tǒng)的語音活性檢測結(jié)束時間,包括:將用戶狀態(tài)信息輸入至用戶狀態(tài)識別模型中,得到用戶狀態(tài);根據(jù)用戶狀態(tài),確定車載語音交互系統(tǒng)的語音活性檢測結(jié)束時間。
7、采用上述車載語音交互系統(tǒng)的參數(shù)管理方法時,根據(jù)用戶狀態(tài),確定語音活性檢測結(jié)束時間,即語音活性檢測結(jié)束時間可以基于用戶狀態(tài)進(jìn)行變化。從而在用戶狀態(tài)不同時,使得語音交互系統(tǒng)的語音活性檢測結(jié)束時間也不同,以保證在用戶狀態(tài)不同時,用戶依舊能夠完整的完成語音輸入,提高語音交互的準(zhǔn)確性,提高用戶的體驗感。
8、根據(jù)上述權(quán)要及相關(guān)內(nèi)容,本發(fā)明的實施方式公開的一種車載語音交互系統(tǒng)的參數(shù)管理方法中,在目標(biāo)信息包括行駛狀態(tài)信息和用戶狀態(tài)信息的情況下,根據(jù)目標(biāo)信息,調(diào)整車載語音交互系統(tǒng)的語音活性檢測結(jié)束時間,包括:將行駛狀態(tài)信息輸入至駕駛場景識別模型中,得到車輛的駕駛場景;將用戶狀態(tài)信息輸入至用戶狀態(tài)識別模型中,得到用戶狀態(tài);根據(jù)駕駛場景以及用戶狀態(tài),確定車載語音交互系統(tǒng)的語音活性檢測結(jié)束時間。
9、采用上述車載語音交互系統(tǒng)的參數(shù)管理方法時,根據(jù)駕駛場景和用戶狀態(tài),確定語音活性檢測結(jié)束時間,即將駕駛場景和用戶狀態(tài)結(jié)合,確定語音活性檢測結(jié)束時間,以使得車載語音交互系統(tǒng)的語音活性檢測結(jié)束時間更加準(zhǔn)確。
10、根據(jù)上述權(quán)要及相關(guān)內(nèi)容,本發(fā)明的實施方式公開的一種車載語音交互系統(tǒng)的參數(shù)管理方法中,根據(jù)駕駛場景以及用戶狀態(tài),調(diào)整車載語音交互系統(tǒng)的語音活性檢測結(jié)束時間,包括:根據(jù)駕駛場景,確定初始語音活性檢測結(jié)束時間;根據(jù)用戶狀態(tài),調(diào)整初始語音活性檢測結(jié)束時間,得到語音活性檢測結(jié)束時間。
11、采用上述車載語音交互系統(tǒng)的參數(shù)管理方法時,根據(jù)駕駛場景確定初始語音活性檢測結(jié)束時間后,可以根據(jù)用戶狀態(tài),進(jìn)一步調(diào)整初始語音活性檢測結(jié)束時間,以確定當(dāng)前車載語音交互系統(tǒng)的語音活性檢測結(jié)束時間,使得得到的語音活性檢測結(jié)束時間更為準(zhǔn)確。
12、根據(jù)上述權(quán)要及相關(guān)內(nèi)容,本發(fā)明的實施方式公開的一種車載語音交互系統(tǒng)的參數(shù)管理方法中,用戶狀態(tài)包括用戶注意力狀態(tài),根據(jù)駕駛場景以及用戶狀態(tài),確定車載語音交互系統(tǒng)中的語音活性檢測結(jié)束時間,包括通過以下公式確定:
13、
14、其中,為語音活性檢測結(jié)束時間,tbase為預(yù)設(shè)的基礎(chǔ)語音活性檢測結(jié)束時間,為駕駛場景對應(yīng)的敏感系數(shù),z為fattention或者ascore,fattention為用戶注意力狀態(tài)對應(yīng)的用戶注意力系數(shù),ascore為所述用戶注意力狀態(tài)對應(yīng)的用戶注意力分?jǐn)?shù),i為所述駕駛場景的個數(shù)。
15、采用上述車載語音交互系統(tǒng)的參數(shù)管理方法時,可基于預(yù)設(shè)的基礎(chǔ)語音活性檢測結(jié)束時間、駕駛場景對應(yīng)的敏感系數(shù)和用戶注意力狀態(tài)對應(yīng)的用戶注意力系數(shù)或用戶注意力分?jǐn)?shù)準(zhǔn)確的計算得到車輛當(dāng)前的駕駛場景及用戶當(dāng)前的用戶狀態(tài)對應(yīng)的語音活性檢測結(jié)束時間,以保證用戶能夠完整的完成語音輸入,提高語音交互的準(zhǔn)確性。
16、根據(jù)上述權(quán)要及相關(guān)內(nèi)容,本發(fā)明的實施方式公開的一種車載語音交互系統(tǒng)的參數(shù)管理方法還包括,通過以下公式得到用戶注意力分?jǐn)?shù)ascore:
17、
18、其中,w為預(yù)設(shè)的權(quán)重,b為預(yù)設(shè)的偏置參數(shù),x為基于用戶狀態(tài)計算得到的特征向量。
19、采用上述車載語音交互系統(tǒng)的參數(shù)管理方法時,可以基于預(yù)設(shè)的權(quán)重和偏置參數(shù)以及基于用戶狀態(tài)信息計算得到的特征向量準(zhǔn)確的計算得到用戶注意力分?jǐn)?shù),基于用戶注意力分?jǐn)?shù)調(diào)整語音活性檢測結(jié)束時間,從而使得語音活性檢測結(jié)束時間更符合用戶當(dāng)前狀態(tài)下的語音交互所需的時間。
20、根據(jù)上述權(quán)要及相關(guān)內(nèi)容,本發(fā)明的實施方式公開的一種車載語音交互系統(tǒng)的參數(shù)管理方法中,行駛狀態(tài)信息包括車輛運動傳感器采集到的車輛運動狀態(tài)信息,車輛運動傳感器包括加速度計、陀螺儀和定位速度傳感器;用戶狀態(tài)信息包括車輛攝像頭采集到的用戶面部狀態(tài)信息,用戶面部狀態(tài)信息包括面部表情信息和/或眼動信息。
21、采用上述車載語音交互系統(tǒng)的參數(shù)管理方法時,可基于加速度計、陀螺儀和定位速度傳感器采集到車輛的多個車輛運動狀態(tài)信息,以更好的確定車輛的行駛狀態(tài)信息,以準(zhǔn)確的計算得到車輛當(dāng)前駕駛狀態(tài)對應(yīng)的語音活性檢測結(jié)束時間。
22、采用上述車載語音交互系統(tǒng)的參數(shù)管理方法時,可基于車輛攝像頭采集到的用戶面部狀態(tài)信息,準(zhǔn)確的獲得用戶狀態(tài)信息,以更好的調(diào)整語音活性檢測結(jié)束時間。
23、根據(jù)上述權(quán)要及相關(guān)內(nèi)容,本發(fā)明的實施方式公開的一種車載語音交互系統(tǒng)的參數(shù)管理方法還包括:獲得車載語音交互系統(tǒng)對應(yīng)的語音完整率;在語音完整率與語音活性檢測結(jié)束時間的比值低于預(yù)設(shè)閾值的情況下,根據(jù)目標(biāo)信息,調(diào)整車載語音交互系統(tǒng)的語音活性檢測結(jié)束時間。
24、采用上述車載語音交互系統(tǒng)的參數(shù)管理方法時,可以基于車載語音交互系統(tǒng)對應(yīng)的語音完整率與語音活性檢測結(jié)束時間的比值與預(yù)設(shè)閾值的比較,以進(jìn)一步調(diào)整車載語音交互系統(tǒng)中的語音活性檢測結(jié)束時間,使得車載語音交互系統(tǒng)中語音活性檢測結(jié)束時間能夠保證在車輛當(dāng)前的駕駛狀態(tài)和車內(nèi)用戶的當(dāng)前用戶狀態(tài)下,用戶輸入語音的時間在語音活性檢測結(jié)束時間內(nèi)。
25、第二方面,本發(fā)明的實施方式還公開了一種電子設(shè)備,電子設(shè)備包括:處理器,與處理器通信連接的存儲器,存儲器存儲計算機(jī)執(zhí)行指令;處理器執(zhí)行存儲器存儲的計算機(jī)執(zhí)行指令,以使電子設(shè)備實現(xiàn)如上述任意一項的車載語音交互系統(tǒng)的參數(shù)管理方法。
26、采用上述電子設(shè)備時,處理器可基于車輛的行駛狀態(tài)信息和/或車輛中用戶的用戶狀態(tài)信息調(diào)整車載語音交互系統(tǒng)中的語音活性檢測結(jié)束時間,以避免語音交互過程過早結(jié)束,從而確保用戶能夠完整的完成語音輸入,提高語音交互的準(zhǔn)確性,提高用戶的體驗感。