国产亚洲亚洲精品777,97se亚洲国产综合自在线图片,一本大道东京热无码中字,国产精品美女久久久久久2018,国产精品白浆视频免费观看,伊人影院综合在线,日本欧美在线播放,国产自精品,色综合自拍,国产精品半夜

<strike id="6uago"></strike>

車載語音交互系統(tǒng)的參數(shù)管理方法及電子設(shè)備與流程

文檔序號：42101943發(fā)布日期：2025-06-06 19:27閱讀：13來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

本發(fā)明涉及車輛，特別涉及一種車載語音交互系統(tǒng)的參數(shù)管理方法及電子設(shè)備。

背景技術(shù)：

1、語音活性檢測(voiceactivity?detection，vad)技術(shù)是一項用于語音處理的技術(shù)，目的是檢測語音信號是否存在。當(dāng)前，車載語音交互系統(tǒng)的vad結(jié)束時間這一參數(shù)是固定的。因此，當(dāng)前車載語音交互系統(tǒng)采用固定的語音交互后端點策略來結(jié)束語音輸入。也即，車載語音交互系統(tǒng)若在固定的vad結(jié)束時間內(nèi)沒有檢測到新的用戶語音，則會結(jié)束語音交互。但在實際行車過程中，經(jīng)常存在用戶未及時完成語音指令的輸入的情況。因此，基于固定的vad結(jié)束時間，也即固定的語音交互后端點，結(jié)束語音交互，可能會存在語音交互被過早結(jié)束，影響用戶體驗的問題。

技術(shù)實現(xiàn)思路

1、本發(fā)明的目的在于解決車輛中采用固定的vad結(jié)束時間，也即固定的語音交互后端點策略，結(jié)束語音交互，可能會存在語音交互被過早結(jié)束，從而影響用戶體驗的問題。

2、為解決上述技術(shù)問題，第一方面，本發(fā)明的實施方式公開了一種車載語音交互系統(tǒng)的參數(shù)管理方法，該方法包括：獲取目標(biāo)信息，目標(biāo)信息包括車輛的行駛狀態(tài)信息和/或車輛中用戶的用戶狀態(tài)信息；根據(jù)目標(biāo)信息，調(diào)整車載語音交互系統(tǒng)的語音活性檢測結(jié)束時間。

3、采用上述方法時，可以基于獲得的車輛的行駛狀態(tài)信息和/或車輛中用戶的用戶狀態(tài)信息調(diào)整車載語音交互系統(tǒng)的語音活性檢測結(jié)束時間?；谲囕v的行駛狀態(tài)信息和/或用戶的用戶狀態(tài)信息調(diào)整車載語音交互系統(tǒng)的語音活性檢測結(jié)束時間，使得車載語音交互系統(tǒng)的語音活性檢測結(jié)束時間能夠被動態(tài)調(diào)整，可以減少或者避免語音交互被過早結(jié)束的情況，從而確保用戶能夠完整的完成語音輸入，提高語音交互的準(zhǔn)確性，以及提升用戶體驗。另外，還可以提升車輛語音控制的及時性和準(zhǔn)確性，提升車輛駕駛安全等。

4、根據(jù)上述權(quán)要及相關(guān)內(nèi)容，本發(fā)明的實施方式公開的一種車載語音交互系統(tǒng)的參數(shù)管理方法中，在目標(biāo)信息包括行駛狀態(tài)信息的情況下，根據(jù)目標(biāo)信息，調(diào)整車載語音交互系統(tǒng)的語音活性檢測結(jié)束時間，包括：將行駛狀態(tài)信息輸入至駕駛場景識別模型中，得到車輛的駕駛場景；根據(jù)車輛的駕駛場景，確定車載語音交互系統(tǒng)的語音活性檢測結(jié)束時間。

5、采用上述車載語音交互系統(tǒng)的參數(shù)管理方法時，根據(jù)車輛的駕駛場景，確定語音活性檢測結(jié)束時間，使得語音活性檢測結(jié)束時間與駕駛場景相對應(yīng)，從而在不同駕駛場景下分別有對應(yīng)的語音活性檢測結(jié)束時間，可以有效的保證在車輛處于不同駕駛場景時，用戶依舊能夠完整的完成語音輸入，提高語音交互的準(zhǔn)確性，提高用戶的體驗感。

6、根據(jù)上述權(quán)要及相關(guān)內(nèi)容，本發(fā)明的實施方式公開的一種車載語音交互系統(tǒng)的參數(shù)管理方法中，在目標(biāo)信息包括用戶狀態(tài)信息的情況下，根據(jù)目標(biāo)信息，調(diào)整車載語音交互系統(tǒng)的語音活性檢測結(jié)束時間，包括：將用戶狀態(tài)信息輸入至用戶狀態(tài)識別模型中，得到用戶狀態(tài)；根據(jù)用戶狀態(tài)，確定車載語音交互系統(tǒng)的語音活性檢測結(jié)束時間。

7、采用上述車載語音交互系統(tǒng)的參數(shù)管理方法時，根據(jù)用戶狀態(tài)，確定語音活性檢測結(jié)束時間，即語音活性檢測結(jié)束時間可以基于用戶狀態(tài)進(jìn)行變化。從而在用戶狀態(tài)不同時，使得語音交互系統(tǒng)的語音活性檢測結(jié)束時間也不同，以保證在用戶狀態(tài)不同時，用戶依舊能夠完整的完成語音輸入，提高語音交互的準(zhǔn)確性，提高用戶的體驗感。

8、根據(jù)上述權(quán)要及相關(guān)內(nèi)容，本發(fā)明的實施方式公開的一種車載語音交互系統(tǒng)的參數(shù)管理方法中，在目標(biāo)信息包括行駛狀態(tài)信息和用戶狀態(tài)信息的情況下，根據(jù)目標(biāo)信息，調(diào)整車載語音交互系統(tǒng)的語音活性檢測結(jié)束時間，包括：將行駛狀態(tài)信息輸入至駕駛場景識別模型中，得到車輛的駕駛場景；將用戶狀態(tài)信息輸入至用戶狀態(tài)識別模型中，得到用戶狀態(tài)；根據(jù)駕駛場景以及用戶狀態(tài)，確定車載語音交互系統(tǒng)的語音活性檢測結(jié)束時間。

9、采用上述車載語音交互系統(tǒng)的參數(shù)管理方法時，根據(jù)駕駛場景和用戶狀態(tài)，確定語音活性檢測結(jié)束時間，即將駕駛場景和用戶狀態(tài)結(jié)合，確定語音活性檢測結(jié)束時間，以使得車載語音交互系統(tǒng)的語音活性檢測結(jié)束時間更加準(zhǔn)確。

10、根據(jù)上述權(quán)要及相關(guān)內(nèi)容，本發(fā)明的實施方式公開的一種車載語音交互系統(tǒng)的參數(shù)管理方法中，根據(jù)駕駛場景以及用戶狀態(tài)，調(diào)整車載語音交互系統(tǒng)的語音活性檢測結(jié)束時間，包括：根據(jù)駕駛場景，確定初始語音活性檢測結(jié)束時間；根據(jù)用戶狀態(tài)，調(diào)整初始語音活性檢測結(jié)束時間，得到語音活性檢測結(jié)束時間。

11、采用上述車載語音交互系統(tǒng)的參數(shù)管理方法時，根據(jù)駕駛場景確定初始語音活性檢測結(jié)束時間后，可以根據(jù)用戶狀態(tài)，進(jìn)一步調(diào)整初始語音活性檢測結(jié)束時間，以確定當(dāng)前車載語音交互系統(tǒng)的語音活性檢測結(jié)束時間，使得得到的語音活性檢測結(jié)束時間更為準(zhǔn)確。

12、根據(jù)上述權(quán)要及相關(guān)內(nèi)容，本發(fā)明的實施方式公開的一種車載語音交互系統(tǒng)的參數(shù)管理方法中，用戶狀態(tài)包括用戶注意力狀態(tài)，根據(jù)駕駛場景以及用戶狀態(tài)，確定車載語音交互系統(tǒng)中的語音活性檢測結(jié)束時間，包括通過以下公式確定：

13、

14、其中，為語音活性檢測結(jié)束時間，tbase為預(yù)設(shè)的基礎(chǔ)語音活性檢測結(jié)束時間，為駕駛場景對應(yīng)的敏感系數(shù)，z為fattention或者ascore，fattention為用戶注意力狀態(tài)對應(yīng)的用戶注意力系數(shù)，ascore為所述用戶注意力狀態(tài)對應(yīng)的用戶注意力分?jǐn)?shù)，i為所述駕駛場景的個數(shù)。

15、采用上述車載語音交互系統(tǒng)的參數(shù)管理方法時，可基于預(yù)設(shè)的基礎(chǔ)語音活性檢測結(jié)束時間、駕駛場景對應(yīng)的敏感系數(shù)和用戶注意力狀態(tài)對應(yīng)的用戶注意力系數(shù)或用戶注意力分?jǐn)?shù)準(zhǔn)確的計算得到車輛當(dāng)前的駕駛場景及用戶當(dāng)前的用戶狀態(tài)對應(yīng)的語音活性檢測結(jié)束時間，以保證用戶能夠完整的完成語音輸入，提高語音交互的準(zhǔn)確性。

16、根據(jù)上述權(quán)要及相關(guān)內(nèi)容，本發(fā)明的實施方式公開的一種車載語音交互系統(tǒng)的參數(shù)管理方法還包括，通過以下公式得到用戶注意力分?jǐn)?shù)ascore：

17、

18、其中，w為預(yù)設(shè)的權(quán)重，b為預(yù)設(shè)的偏置參數(shù)，x為基于用戶狀態(tài)計算得到的特征向量。

19、采用上述車載語音交互系統(tǒng)的參數(shù)管理方法時，可以基于預(yù)設(shè)的權(quán)重和偏置參數(shù)以及基于用戶狀態(tài)信息計算得到的特征向量準(zhǔn)確的計算得到用戶注意力分?jǐn)?shù)，基于用戶注意力分?jǐn)?shù)調(diào)整語音活性檢測結(jié)束時間，從而使得語音活性檢測結(jié)束時間更符合用戶當(dāng)前狀態(tài)下的語音交互所需的時間。

20、根據(jù)上述權(quán)要及相關(guān)內(nèi)容，本發(fā)明的實施方式公開的一種車載語音交互系統(tǒng)的參數(shù)管理方法中，行駛狀態(tài)信息包括車輛運動傳感器采集到的車輛運動狀態(tài)信息，車輛運動傳感器包括加速度計、陀螺儀和定位速度傳感器；用戶狀態(tài)信息包括車輛攝像頭采集到的用戶面部狀態(tài)信息，用戶面部狀態(tài)信息包括面部表情信息和/或眼動信息。

21、采用上述車載語音交互系統(tǒng)的參數(shù)管理方法時，可基于加速度計、陀螺儀和定位速度傳感器采集到車輛的多個車輛運動狀態(tài)信息，以更好的確定車輛的行駛狀態(tài)信息，以準(zhǔn)確的計算得到車輛當(dāng)前駕駛狀態(tài)對應(yīng)的語音活性檢測結(jié)束時間。

22、采用上述車載語音交互系統(tǒng)的參數(shù)管理方法時，可基于車輛攝像頭采集到的用戶面部狀態(tài)信息，準(zhǔn)確的獲得用戶狀態(tài)信息，以更好的調(diào)整語音活性檢測結(jié)束時間。

23、根據(jù)上述權(quán)要及相關(guān)內(nèi)容，本發(fā)明的實施方式公開的一種車載語音交互系統(tǒng)的參數(shù)管理方法還包括：獲得車載語音交互系統(tǒng)對應(yīng)的語音完整率；在語音完整率與語音活性檢測結(jié)束時間的比值低于預(yù)設(shè)閾值的情況下，根據(jù)目標(biāo)信息，調(diào)整車載語音交互系統(tǒng)的語音活性檢測結(jié)束時間。

24、采用上述車載語音交互系統(tǒng)的參數(shù)管理方法時，可以基于車載語音交互系統(tǒng)對應(yīng)的語音完整率與語音活性檢測結(jié)束時間的比值與預(yù)設(shè)閾值的比較，以進(jìn)一步調(diào)整車載語音交互系統(tǒng)中的語音活性檢測結(jié)束時間，使得車載語音交互系統(tǒng)中語音活性檢測結(jié)束時間能夠保證在車輛當(dāng)前的駕駛狀態(tài)和車內(nèi)用戶的當(dāng)前用戶狀態(tài)下，用戶輸入語音的時間在語音活性檢測結(jié)束時間內(nèi)。

25、第二方面，本發(fā)明的實施方式還公開了一種電子設(shè)備，電子設(shè)備包括：處理器，與處理器通信連接的存儲器，存儲器存儲計算機(jī)執(zhí)行指令；處理器執(zhí)行存儲器存儲的計算機(jī)執(zhí)行指令，以使電子設(shè)備實現(xiàn)如上述任意一項的車載語音交互系統(tǒng)的參數(shù)管理方法。

26、采用上述電子設(shè)備時，處理器可基于車輛的行駛狀態(tài)信息和/或車輛中用戶的用戶狀態(tài)信息調(diào)整車載語音交互系統(tǒng)中的語音活性檢測結(jié)束時間，以避免語音交互過程過早結(jié)束，從而確保用戶能夠完整的完成語音輸入，提高語音交互的準(zhǔn)確性，提高用戶的體驗感。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：王夏鳴
技術(shù)所有人：零束科技有限公司
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！