來源:科技日報(bào) 發(fā)布時間:2024-5-13 9:46
◎本報(bào)記者 都 芃
“關(guān)閉車窗、打開空調(diào)、降低音樂音量……”在不久前舉辦的2024(第十八屆)北京國際汽車展覽會上,有參觀者坐進(jìn)展臺上的一輛智能網(wǎng)聯(lián)汽車,對著智能車機(jī)連續(xù)發(fā)出多個指令。話音剛落,各項(xiàng)指令一一被車輛準(zhǔn)確響應(yīng)。
近年來,我國智能網(wǎng)聯(lián)汽車產(chǎn)業(yè)快速發(fā)展,汽車智能化程度不斷提升。語音控車正成為汽車產(chǎn)業(yè)發(fā)展中廣泛落地的智能場景。
在本次汽車展覽會上,新能源智能網(wǎng)聯(lián)汽車是絕對主角。不僅多家品牌展出了搭載最新智能成果的新車型,展會也專門開辟出智駕未來展區(qū),集中展示智能網(wǎng)聯(lián)汽車相關(guān)技術(shù)成果。
參觀體驗(yàn)了多款智能網(wǎng)聯(lián)汽車后,記者發(fā)現(xiàn),各家品牌車型雖然功能不盡相同,但乘客與汽車之間的交互均圍繞語音建立。在語音控車場景下,只需短短一句話,甚至幾個詞,汽車便可根據(jù)乘客指令快速作出相應(yīng)操作。
本次汽車展覽會參展商科大訊飛AI研究院副院長高建清介紹,目前,搭載科大訊飛語音技術(shù)的車型可以為海外車主提供對話快速響應(yīng)、問題回答準(zhǔn)確的語音交互服務(wù),已覆蓋23個主要語種,搭載車型銷往亞洲、歐洲、南美等地的60多個國家和地區(qū)。“我們已經(jīng)與中國汽車‘出海’十強(qiáng)企業(yè)中的8家展開合作,助力中國汽車走得更遠(yuǎn)。”他說。
除了語音控車場景,翻譯交流也是智能語音技術(shù)應(yīng)用最廣泛的場景之一。在不久前的第四屆中國國際消費(fèi)品博覽會上,有外國客商拿著國產(chǎn)品牌翻譯機(jī),與在場工作人員你一言我一語地暢聊起來。嘈雜的環(huán)境沒有影響翻譯效果的準(zhǔn)確性,不同語言得到了快速、準(zhǔn)確的翻譯傳達(dá),仿佛一名隨行翻譯就站在身邊。
同樣借助語音技術(shù)實(shí)現(xiàn)智能升級的還有會議場景。在數(shù)十人參加的會議討論中,只需拿出智能錄音筆,放在會議室一角,每個人的發(fā)言均可被精準(zhǔn)記錄并實(shí)現(xiàn)快速轉(zhuǎn)寫,甚至還可以一鍵生成會議總結(jié),大大減少了人工記錄工作量。除此以外,智能語音技術(shù)的典型應(yīng)用場景還包括智能家居、智慧教育、手機(jī)智能助手等。
多場景廣泛應(yīng)用的背后,是我國智能語音技術(shù)近年來的不斷突破。語音輸入最大的挑戰(zhàn)是場景復(fù)雜。用戶的輸入場景情況各異,無處不在的噪聲、混響直接影響著語音識別的準(zhǔn)確率,進(jìn)而影響用戶的語音交互體驗(yàn)。大模型的發(fā)展則給智能語音技術(shù)帶來了新的前進(jìn)動力。
高建清介紹,認(rèn)知大模型的出現(xiàn),讓自然語言處理類任務(wù)的上限大幅提升。結(jié)合大語言模型更精準(zhǔn)的語義理解和更精細(xì)的描述能力,各類語音任務(wù)也能快速突破效果上限。
“同時,我們也要結(jié)合語音屬性解耦預(yù)訓(xùn)練和語義語音互增強(qiáng)編碼等技術(shù),構(gòu)建起適用于各類場景的語音大模型,讓智能語音技術(shù)賦能更多場景。”高建清說。