<kbd id="ia2e8"><input id="ia2e8"></input></kbd><u id="ia2e8"></u>
  • <blockquote id="ia2e8"></blockquote>
  • <blockquote id="ia2e8"></blockquote>
  • <samp id="ia2e8"><label id="ia2e8"></label></samp>
  • 地址搜索方法、裝置、電子設備及存儲介質與流程

    文檔序號:26091210發布日期:2021-07-30 17:59
    地址搜索方法、裝置、電子設備及存儲介質與流程

    本發明涉及互聯網技術領域,特別是涉及一種地址搜索方法、裝置、電子設備及存儲介質。



    背景技術:

    地址搜索服務,是通過制定通用地名地址數據規范,構建標準地名地址數據庫,在通用標準地名地址模型與地名地址檢索算法基礎上構建地名地址檢索服務平臺,提供面向行業的地名地址檢索服務和調用接口。

    用戶可手動輸入文本形式的query(查詢信息),地圖搜索服務基于query搜索對應的目標地址,并展示給用戶。但是,由于用戶輸入的文本形式的query可能會出現錯別字、不完整、跨城、存在時空關系等情形,因此會導致地圖搜索服務無法基于query準確搜索出目標地址。



    技術實現要素:

    鑒于上述問題,本發明實施例提供一種克服上述問題或者至少部分地解決上述問題的地址搜索方法、裝置、電子設備及存儲介質。

    第一方面,本發明實施例公開了一種地址搜索方法,其特征在于,包括:

    接收用戶輸入的語音數據;

    將所述語音數據轉換為拼音序列;

    將所述拼音序列轉換為文本序列;

    對所述文本序列進行地址識別,提取所述文本序列中包含的地址信息;

    基于所述地址信息,搜索所述地址信息對應的目標地址。

    可選地,所述將所述語音數據轉換為拼音序列,包括:獲取所述語音數據對應的聲學特征向量;將所述聲學特征向量輸入預先訓練的聲學模型,得到所述聲學模型輸出的拼音標識序列;基于預設的拼音標識與拼音字母的對應關系,獲取所述拼音標識序列對應的所述拼音序列。

    可選地,所述聲學模型通過如下方式訓練:獲取包含地址信息的樣本語音數據對應的樣本聲學特征向量和實際拼音標識序列,將所述樣本聲學特征向量和所述實際拼音標識序列作為第一樣本數據;利用所述第一樣本數據對第一初始模型進行訓練;其中,所述第一初始模型的輸入為所述樣本聲學特征向量,輸出為預測拼音標識序列;在基于所述預測拼音標識序列和所述實際拼音標識序列確定出所述第一初始模型訓練完成后,得到訓練完成的所述聲學模型。

    可選地,所述將所述拼音序列轉換為文本序列,包括:將所述拼音序列輸入預先訓練的語言模型,得到所述語言模型輸出的所述文本序列。

    可選地,所述語言模型通過如下方式訓練:獲取包含地址信息的樣本興趣點poi文本數據對應的樣本拼音序列和實際文本序列,將所述樣本拼音序列和所述實際文本序列作為第二樣本數據;利用所述第二樣本數據對第二初始模型進行訓練;其中,所述第二初始模型的輸入為所述樣本拼音序列,輸出為預測文本序列;在基于所述預測文本序列和所述實際文本序列確定出所述第二初始模型訓練完成后,得到訓練完成的所述語言模型。

    可選地,所述對所述文本序列進行地址識別,提取所述文本序列中包含的地址信息,包括:將所述文本序列輸入預先訓練的地址識別模型,得到所述地址識別模型輸出的所述文本序列對應的bio標注序列;基于所述bio標注序列,從所述文本序列中提取標注為b和i的文本,將提取出的文本作為所述地址信息。

    可選地,所述地址識別模型通過如下方式訓練:獲取包含地址信息的樣本poi文本數據對應的樣本文本序列和實際bio標注序列,將所述樣本文本序列和所述實際bio標注序列作為第三樣本數據;利用所述第三樣本數據對第三初始模型進行訓練;其中,所述第三初始模型的輸入為所述樣本文本序列,輸出為預測bio標注序列;在基于所述預測bio標注序列和所述實際bio標注序列確定出所述第三初始模型訓練完成后,得到訓練完成的所述地址識別模型。

    第二方面,本發明實施例公開了一種地址搜索裝置,其特征在于,包括:

    接收模塊,用于接收用戶輸入的語音數據;

    第一轉換模塊,用于將所述語音數據轉換為拼音序列;

    第二轉換模塊,用于將所述拼音序列轉換為文本序列;

    識別模塊,用于對所述文本序列進行地址識別,提取所述文本序列中包含的地址信息;

    搜索模塊,用于基于所述地址信息,搜索所述地址信息對應的目標地址。

    可選地,所述第一轉換模塊包括:向量獲取單元,用于獲取所述語音數據對應的聲學特征向量;模型轉換單元,用于將所述聲學特征向量輸入預先訓練的聲學模型,得到所述聲學模型輸出的拼音標識序列;序列獲取單元,用于基于預設的拼音標識與拼音字母的對應關系,獲取所述拼音標識序列對應的所述拼音序列。

    可選地,所述聲學模型通過如下模塊訓練:第一獲取模塊,用于獲取包含地址信息的樣本語音數據對應的樣本聲學特征向量和實際拼音標識序列,將所述樣本聲學特征向量和所述實際拼音標識序列作為第一樣本數據;第一訓練模塊,用于利用所述第一樣本數據對第一初始模型進行訓練;其中,所述第一初始模型的輸入為所述樣本聲學特征向量,輸出為預測拼音標識序列;在基于所述預測拼音標識序列和所述實際拼音標識序列確定出所述第一初始模型訓練完成后,得到訓練完成的所述聲學模型。

    可選地,所述第二轉換模塊,具體用于將所述拼音序列輸入預先訓練的語言模型,得到所述語言模型輸出的所述文本序列。

    可選地,所述語言模型通過如下模塊訓練:第二獲取模塊,用于獲取包含地址信息的樣本興趣點poi文本數據對應的樣本拼音序列和實際文本序列,將所述樣本拼音序列和所述實際文本序列作為第二樣本數據;第二訓練模塊,用于利用所述第二樣本數據對第二初始模型進行訓練;其中,所述第二初始模型的輸入為所述樣本拼音序列,輸出為預測文本序列;在基于所述預測文本序列和所述實際文本序列確定出所述第二初始模型訓練完成后,得到訓練完成的所述語言模型。

    可選地,所述識別模塊包括:模型識別單元,用于將所述文本序列輸入預先訓練的地址識別模型,得到所述地址識別模型輸出的所述文本序列對應的bio標注序列;地址獲取單元,用于基于所述bio標注序列,從所述文本序列中提取標注為b和i的文本,將提取出的文本作為所述地址信息。

    可選地,所述地址識別模型通過如下模塊訓練:第三獲取單元,用于獲取包含地址信息的樣本poi文本數據對應的樣本文本序列和實際bio標注序列,將所述樣本文本序列和所述實際bio標注序列作為第三樣本數據;第三訓練單元,用于利用所述第三樣本數據對第三初始模型進行訓練;其中,所述第三初始模型的輸入為所述樣本文本序列,輸出為預測bio標注序列;在基于所述預測bio標注序列和所述實際bio標注序列確定出所述第三初始模型訓練完成后,得到訓練完成的所述地址識別模型。

    第三方面,本發明實施例公開了一種電子設備,包括:一個或多個處理器;和其上存儲有指令的一個或多個機器可讀介質;當所述指令由所述一個或多個處理器執行時,使得所述處理器執行如上任一項所述地址搜索方法。

    第四方面,本發明實施例公開了一種計算機可讀存儲介質,其上存儲有計算機程序,該程序被處理器執行時實現如上任一項所述的地址搜索方法。

    本發明實施例中,一方面,通過先將用戶輸入的語音數據轉換為拼音序列,再將拼音序列轉換為文本序列的方式,考慮到了上下文語境信息,相比于直接將語音數據轉換為文本序列的方式,本發明實施例得到的文本序列更加準確;另一方面,通過對文本序列進行地址識別,提取文本序列中包含的地址信息的方式,能夠去除文本序列中非地址信息的干擾,得到更加準確的地址信息。因此,基于提取出的地址信息,能夠更加準確地搜索出該地址信息對應的目標地址。

    附圖說明

    圖1是本發明實施例的一種地址搜索方法的步驟流程圖。

    圖2是本發明實施例的一種整體處理流程圖。

    圖3是本發明實施例的一種聲學模型的示意圖。

    圖4是本發明實施例的一種語言模型的示意圖。

    圖5是本發明實施例的一種地址識別模型的示意圖。

    圖6是本發明實施例的一種地址搜索裝置的結構框圖。

    具體實施方式

    為使本發明的上述目的、特征和優點能夠更加明顯易懂,下面結合附圖和具體實施方式對本發明作進一步詳細的說明。

    本發明實施例的地址搜索方法可以應用于配送、打車、公交等場景的搜索環節中,可以大幅度提升地圖搜索業務服務質量,有廣闊的應用空間,廣泛適用于垂直搜索領域。

    本發明實施例應用于用戶輸入語音數據進行地址搜索的場景。通過將語音信息轉化為文本序列,從中挖掘地址信息,將地址信息用于搜索過程中的召回和排序,從而從用戶方面增強特征,進而在空間維度增強對地址信息的限定和提權,更加準確地搜索出該地址信息對應的目標地址。

    參照圖1,示出了本發明實施例的一種地址搜索方法的步驟流程圖。

    如圖1所示,地址搜索方法可以包括以下步驟:

    步驟101,接收用戶輸入的語音數據。

    在實現中,本發明實施例的地址搜索方法可以應用于客戶端,也可以應用于服務器。其中,客戶端可以為能夠提供地址搜索服務的app(應用程序),比如各種地圖app等。服務器可以為上述app對應的后臺服務器??蛻舳怂诘慕K端設備能夠提供人機語音交互接口。

    如果本發明實施例的地址搜索方法應用于客戶端,則用戶通過終端設備上的人機語音交互接口輸入語音數據,客戶端接收用戶輸入的語音數據。

    如果本發明實施例的地址搜索方法應用于服務器,則用戶通過終端設備上的人機語音交互接口輸入語音數據,客戶端接收用戶輸入的語音數據,并將語音數據發送至服務器,服務器接收用戶輸入的語音數據。

    步驟102,將所述語音數據轉換為拼音序列。

    步驟103,將所述拼音序列轉換為文本序列。

    通常情況下,語音識別過程是直接將語音數據轉換為文本序列。但是,由于該種方式未考慮語音中的上下文語境信息,因此識別結果的準確性較低。本發明實施例中,先將接收到的語音數據轉換為拼音序列,再將拼音序列轉換為對應的文本序列的過程中,會考慮到拼音序列中的語境信息,從而使得到的文本序列更加準確。

    步驟104,對所述文本序列進行地址識別,提取所述文本序列中包含的地址信息。

    由于用戶輸入的語音數據中除了包含具體的地址信息,還可能會包含一些其他信息,而地址搜索主要是搜索與語音數據中包含的地址信息相關的目標地址,因此,如果直接基于轉換得到的文本序列搜索對應的目標地址,則可能會存在一些干擾信息。針對上述問題,本發明實施例中針對文本序列進行地址識別,提取出文本序列中包含的地址信息。

    步驟105,基于所述地址信息,搜索所述地址信息對應的目標地址。

    如果本發明實施例的地址搜索方法應用于客戶端,則客戶端在提取出文本序列中包含的地址信息后,基于所述地址信息,搜索所述地址信息對應的目標地址。在實現中,客戶端可以將所述地址信息發送給服務器,由服務器執行召回和排序過程,搜索所述地址信息對應的目標地址,并將目標地址返回給客戶端。

    如果本發明實施例的地址搜索方法應用于服務器,則服務器在提取出文本序列中包含的地址信息后,基于所述地址信息,執行召回和排序過程,搜索所述地址信息對應的目標地址,并將目標地址返回給客戶端。

    本發明實施例中,一方面,通過先將用戶輸入的語音數據轉換為拼音序列,再將拼音序列轉換為文本序列的方式,考慮到了上下文語境信息,相比于直接將語音數據轉換為文本序列的方式,本發明實施例得到的文本序列更加準確;另一方面,通過對文本序列進行地址識別,提取文本序列中包含的地址信息的方式,能夠去除文本序列中非地址信息的干擾,得到更加準確的地址信息。因此,基于提取出的地址信息,能夠更加準確地搜索出該地址信息對應的目標地址。

    參照圖2,示出了本發明實施例的一種整體處理流程圖。

    如圖2所示,整體處理流程圖可以包括:

    步驟201,獲取樣本語音數據。

    聲學模型是對聲音發聲的建模,能夠把語音數據轉換成聲學表示的輸出,更準確的說是給出語音屬于某個拼音標識的概率。步驟201~步驟204為聲學模型的訓練過程。

    本發明實施例中,由于聲學模型應用于地址搜索過程中,主要識別的是地址信息,因此,在步驟201中,獲取的是包含地址信息的樣本語音數據。其中,地址信息可以為poi(pointofinterest,興趣點)的名稱等。poi是地理信息系統發展到一定階段后,隨著用戶的個性化服務需求而出現的。一個poi可以是一個商鋪、一個商場、一個公交站、一個寫字樓、一個公園、一個小區,等等。

    步驟202,數據處理與特征提取。

    在步驟202中,對樣本語音數據進行數據處理與特征提取,獲取樣本語音數據對應的樣本聲學特征向量和實際拼音標識序列。具體過程可以包括以下步驟a1~a3:

    a1,將樣本語音數據轉換成樣本頻譜圖數據。

    在將樣本語音數據轉換成樣本頻譜圖數據的過程中,對音頻信號(也即樣本語音數據)進行預加重、分幀和加窗,然后對每幀信號進行stft(shorttimefouriertransform,短時傅里葉變換),得到短時幅度譜;對短時幅度譜通過mel(梅爾)濾波器組進行濾波,得到mel頻譜圖,將該mel頻譜圖作為樣本頻譜圖數據。

    a2,基于樣本頻譜圖數據,提取樣本語音數據對應的樣本聲學特征向量。

    在基于樣本頻譜圖數據,提取樣本語音數據對應的樣本聲學特征向量的過程中,可以利用具有圖片識別能力的cnn(convolutionalneuralnetworks,卷積神經網絡)模型,將樣本頻譜圖數據輸入cnn模型,經過cnn模型中卷積層和池化層的處理,得到cnn模型輸出的聲學特征向量,該聲學特征向量即為樣本語音數據對應的樣本聲學特征向量。

    a3,獲取樣本語音數據對應的實際拼音序列,并基于預設的拼音標識與拼音字母的對應關系,獲取實際拼音序列對應的拼音標識序列,作為樣本語音數據對應的實際拼音標識序列。

    預先設置拼音標識與拼音字母的對應關系。比如,1~26個拼音字母對應的拼音標識分別為數值1~26,則拼音字母a對應的拼音標識為1,拼音字母b對應的拼音標識為2,拼音字母c對應的拼音標識為3……

    將樣本語音數據轉換成實際拼音序列,基于上述對應關系,查找實際拼音序列中的各拼音字母對應的拼音標識,得到樣本語音數據對應的實際拼音標識序列。

    步驟203,聲學模型訓練。

    步驟204,獲得聲學模型。

    針對任意一個樣本語音數據,將該樣本語音數據對應的樣本聲學特征向量和實際拼音標識序列作為一個第一樣本數據。利用大量第一樣本數據訓練聲學模型。

    可選地,可以將第一樣本數據劃分為多個batch(批),針對每個batch,選擇該batch內最長的樣本聲學特征向量為基準,對其他樣本聲學特征向量進行padding(填充),比如填充0等。這樣一個batch內的樣本聲學特征向量長度都相同,可以進行并行訓練。

    第一初始模型是指還未進行訓練的具有聲學識別能力的模型。在聲學模型訓練過程中,利用第一樣本數據對第一初始模型進行訓練,其中,第一初始模型的輸入為第一樣本數據中的樣本聲學特征向量,輸出為預測拼音標識序列。

    在一種可選實施方式中,根據預測拼音標識序列和第一樣本數據中的實際拼音標識序列,可以計算第一損失。第一損失可以表示預測拼音標識序列與實際拼音標識序列的偏差程度,第一損失越小,模型的魯棒性越好。因此,可以在第一損失小于預設的損失閾值時,確定訓練完成,得到訓練完成的所述聲學模型。對于損失閾值的具體數值,本領域技術人員根據實際經驗選用任意適用的值均可,比如可以設置為0.1、0.2、0.3,等等。在另一種可選實施方式中,可以設置在達到預設的迭代次數時,確定訓練完成,得到訓練完成的所述聲學模型。對于迭代次數的具體數值,本領域技術人員根據實際經驗選用任意適用的值均可。

    可選地,聲學模型可以選用ctc(connectionisttemporalclassification,聯結主義時間分類)模型等。在語音識別中,希望語音中的音素和翻譯后的字符可以一一對應,ctc模型能夠解決時序類數據的分類問題,保證識別的準確性。

    圖3是本發明實施例的一種聲學模型的示意圖。如圖3所示,其中最左側的圖片即為樣本語音數據對應的樣本頻譜圖數據,中間的多個卷積層和池化層屬于cnn模型,cnn模型后面連接的即為ctc模型。將樣本頻譜圖數據作為cnn模型的輸入,經過cnn模型進行特征提取,得到cnn模型輸出的樣本頻譜圖數據對應的樣本聲學特征向量,將樣本聲學特征向量作為ctc模型的輸入,得到ctc模型輸出的預測拼音標識序列。

    步驟205,獲取樣本文本數據。

    語言模型的作用之一是消除多音字的問題,在聲學模型(am)給出拼音序列之后,從候選的文本序列中找到概率最大的文本序列。語言模型(lm)可以對am的解碼做約束和重打分,讓最終的識別結果符合語法規則。步驟205~步驟208為語言模型的訓練過程。

    本發明實施例中,由于語言模型應用于地址搜索過程中,主要識別的是地址信息,因此,在步驟205中,獲取的是包含地址信息的樣本poi文本數據。在實現中,可以從數據庫中獲取poi數據(比如poi名稱、地址等)作為樣本poi文本數據。

    步驟206,數據處理與特征提取。

    在步驟206中,對樣本poi文本數據進行數據處理與特征提取,獲取樣本poi文本數據對應的樣本拼音序列和實際文本序列。在實現中,將樣本poi文本數據轉換為樣本拼音序列,將樣本poi文本數據自身作為實際文本序列。

    步驟207,語言模型訓練。

    步驟208,獲得語言模型。

    針對任意一個樣本poi文本數據,將該樣本poi文本數據對應的樣本拼音序列和實際文本序列作為一個第二樣本數據。利用大量第二樣本數據訓練語言模型。

    第二初始模型是指還未進行訓練的具有語言識別能力的模型。在語言模型訓練過程中,利用所述第二樣本數據對第二初始模型進行訓練。其中,所述第二初始模型的輸入為第二樣本數據中的樣本拼音序列,輸出為預測文本序列。

    在一種可選實施方式中,根據預測文本序列和實際文本序列,可以計算第二損失。第二損失可以表示預測文本序列和實際文本序列的偏差程度。因此,可以在第二損失小于預設的損失閾值時,確定訓練完成,得到訓練完成的所述語言模型。對于損失閾值的具體數值,本領域技術人員根據實際經驗選用任意適用的值均可。在另一種可選實施方式中,可以設置在達到預設的迭代次數時,確定訓練完成,得到訓練完成的所述語言模型。對于迭代次數的具體數值,本領域技術人員根據實際經驗選用任意適用的值均可。

    可選地,語言模型可以選用transformer模型等。transformer模型中采用了encoder(編碼)-decoder(解碼)架構。對于encoder,包含兩層,一個self-attention(自注意力機制)層和一個前饋神經網絡,self-attention能幫助當前節點不僅僅只關注當前的詞,從而能獲取到上下文的語義。對于decoder,也包含encoder提到的兩層網絡,但是在這兩層中間還有一層attention(注意力機制)層,幫助當前節點獲取到當前需要關注的重點內容。因此,語言模型能夠結合上下文語境信息對拼音序列進行識別,得到對應的文本序列。

    圖4是本發明實施例的一種語言模型的示意圖。如圖4所示,語言模型的輸入為拼音序列,拼音序列輸入語言模型后,經過encoder的處理,得到拼音屬于每個文本的分數,然后經過decoder的處理,選出最優的文本序列作為輸出。比如,圖4中輸入的拼音序列為“wodemianshizaitaijidasha”,輸出的文本序列為“我的面試在太極大廈”。

    步驟209,獲取樣本文本數據。

    針對前面獲取到的文本序列,需要從中提取有價值的地址信息,作用在召回層。因此構建地址識別模型程,對文本序列進行地址信息提取。步驟209~步驟212為地址識別模型的訓練過程。

    本發明實施例中,由于地址識別模型應用于地址搜索過程中,主要識別的是地址信息,因此,在步驟209中,獲取的是包含地址信息的樣本poi文本數據。在實現中,可以從數據庫中獲取poi數據(比如poi名稱、地址等)作為樣本poi文本數據。

    步驟210,bio標注。

    在步驟210中,對樣本poi文本數據進行bio標注,獲取樣本poi文本數據對應的實際bio標注序列,樣本poi文本數據對應的樣本文本序列可以為樣本poi文本數據自身。

    在bio(begin開頭,inside中間,outside無效)標注過程中,對樣本poi文本數據中屬于地址相關實體的開頭文字標注為b,對屬于地址相關實體的中間文字標注為i,對不屬于地址相關實體的文字標注為o。比如,對于文本數據“我的面試在太極大廈”,其中的“太極大廈”為地址相關實體,因此,將其中的“我”、“的”、“面”、“試”、“在”均標注為o,將其中的“太”標注為b,將其中的“極”、“大”、“廈”均標注為i。

    步驟211,地址識別模型訓練。

    步驟212,獲得地址識別模型。

    針對任意一個樣本poi文本數據,將該樣本poi文本數據對應的樣本文本序列和實際bio標注序列作為一個第三樣本數據。利用大量第三樣本數據訓練地址識別模型。

    第三初始模型是指還未進行訓練的具有地址識別識別能力的模型。在地址識別模型訓練過程中,利用所述第三樣本數據對第三初始模型進行訓練。其中,所述第三初始模型的輸入為地兒樣本數據中的樣本文本序列,輸出為預測bio標注序列。

    在一種可選實施方式中,根據預測bio標注序列和實際bio標注序列,可以計算第三損失。第三損失可以表示預測bio標注序列和實際bio標注序列的偏差程度。因此,可以在第三損失小于預設的損失閾值時,確定訓練完成,得到訓練完成的所述地址識別模型。對于損失閾值的具體數值,本領域技術人員根據實際經驗選用任意適用的值均可。在另一種可選實施方式中,可以設置在達到預設的迭代次數時,確定訓練完成,得到訓練完成的所述地址識別模型。對于迭代次數的具體數值,本領域技術人員根據實際經驗選用任意適用的值均可。

    可選地,地址識別模型可以選用bilstm(bi-directionallongshort-termmemory,雙向循環神經網絡)+crf(conditionalrandomfield,條件隨機場)模型等poi-ner(namedentityrecognition,命名實體識別)模型。其中,bilstm層的輸出是文本屬于每個標注的分數。這些分數將作為crf層的輸入,在crf層中選擇預測得分最高的標注序列作為最佳標注結果。

    圖5是本發明實施例的一種地址識別模型的示意圖。如圖5所示,其中w1、w2表示樣本文本序列,tag1和tag2表示實際bio標注序列。首先對輸入進行embedding(嵌入)處理,embedding簡單的說是將高維空間中的表示word(詞)的高維向量映射到低維連續空間中的向量,映射后的向量稱為詞向量。然后對embedding得到的結果進行concat(連接)處理。之后將處理后的數據輸入bilstm層,bilstm層輸出文本屬于每個標注的分數,這些分數作為crf層的輸入,在crf層中選擇預測得分最高的標注序列作為最佳標注結果。

    經過上述過程訓練得到聲學模型、語言模型、地址識別模型后,即可基于這些模型進行地址搜索操作,以下具體說明。

    步驟213,接收語音數據。

    步驟214,特征處理。

    在接收到用戶輸入的語音數據后,對語音數據進行特征處理。特征處理過程可以包括:將語音數據轉換成頻譜圖數據;基于頻譜圖數據,提取語音數據對應的聲學特征向量。對于具體的處理過程,可以參照上述步驟a1和a2的具體描述,本發明實施例在此不再詳細論述。

    當然,還可以對語音數據進行其他處理,比如去除噪音處理等。

    步驟215,解碼器語音解碼。

    在解碼器語音解碼過程中,可以利用聲學模型和語言模型進行識別。

    首先,利用聲學模型進行處理。具體可以包括:獲取所述語音數據對應的聲學特征向量;將所述聲學特征向量輸入預先訓練的聲學模型,得到所述聲學模型輸出的拼音標識序列;基于預設的拼音標識與拼音字母的對應關系,獲取所述拼音標識序列對應的所述拼音序列。比如,將語音數據對應的聲學特征向量輸入聲學模型,得到聲學模型輸出的拼音序列為“wodemianshizaitaijidasha”。

    然后,利用語言模型進行處理。具體可以包括:將所述拼音序列輸入預先訓練的語言模型,得到所述語言模型輸出的所述文本序列。比如,將拼音序列“wodemianshizaitaijidasha”輸入語言模型,得到語言模型輸出的文本序列為“我的面試在太極大廈”。

    步驟216,輸出文本序列。

    步驟217,地址識別得到地址信息。

    利用地址識別模型對文本序列進行地址識別,提取所述文本序列中包含的地址信息。具體可以包括:將所述文本序列輸入預先訓練的地址識別模型,得到所述地址識別模型輸出的所述文本序列對應的bio標注序列;基于所述bio標注序列,從所述文本序列中提取標注為b和i的文本,將提取出的文本作為所述地址信息。

    比如,將文本序列“我的面試在太極大廈”輸入地址識別模型,得到地址識別模型輸出的bio標注序列為ooooobiii。從bio標注序列中提取出標注為b的文本為“太”,標注為i的文本為“極”、“大”、“廈”,則提取出的地址信息為“太極大廈”。

    步驟218,地址搜索。

    基于提取出的地址信息,搜索所述地址信息對應的目標地址。

    搜索過程可以包括召回和排序。在召回過程中,將提取出的地址信息作為召回源,輸入到召回模型中,得到召回模型召回的與地址信息相關的地址。在排序過程中,針對召回的地址,利用距離、熱度、文本相似度等特征進行排序,提取排序在前的部分地址作為目標地址。召回的目標地址可以為poi名稱、地址等。

    本發明實施例中,采用聲學模型、語言模型、地址識別模型對用戶輸入的語音數據做綜合處理。語言模型采用翻譯模型進行訓練,解決了文本匹配未考慮上下文語境的問題,提升了模型的準確性。地址識別模型對文本序列進行地址識別,提升了模型的泛化能力。采用深度學習離線訓練模型,線上預測的手段,不僅提升服務性能,還能優化模型泛化能力,從而提升搜索業務服務質量。在用戶輸入query之前,可以冷啟動預測用戶需求,同時提取的地址信息作為召回源,實現擴召回,提升了搜索召回能力。

    參照圖6,示出了本發明實施例的一種地址搜索裝置的結構框圖。

    如圖6所示,地址搜索裝置可以包括以下模塊:

    地址搜索裝置,其特征在于,包括:

    接收模塊601,用于接收用戶輸入的語音數據;

    第一轉換模塊602,用于將所述語音數據轉換為拼音序列;

    第二轉換模塊603,用于將所述拼音序列轉換為文本序列;

    識別模塊604,用于對所述文本序列進行地址識別,提取所述文本序列中包含的地址信息;

    搜索模塊605,用于基于所述地址信息,搜索所述地址信息對應的目標地址。

    可選地,所述第一轉換模塊602包括:向量獲取單元,用于獲取所述語音數據對應的聲學特征向量;模型轉換單元,用于將所述聲學特征向量輸入預先訓練的聲學模型,得到所述聲學模型輸出的拼音標識序列;序列獲取單元,用于基于預設的拼音標識與拼音字母的對應關系,獲取所述拼音標識序列對應的所述拼音序列。

    可選地,所述聲學模型通過如下模塊訓練:第一獲取模塊,用于獲取包含地址信息的樣本語音數據對應的樣本聲學特征向量和實際拼音標識序列,將所述樣本聲學特征向量和所述實際拼音標識序列作為第一樣本數據;第一訓練模塊,用于利用所述第一樣本數據對第一初始模型進行訓練;其中,所述第一初始模型的輸入為所述樣本聲學特征向量,輸出為預測拼音標識序列;在基于所述預測拼音標識序列和所述實際拼音標識序列確定出所述第一初始模型訓練完成后,得到訓練完成的所述聲學模型。

    可選地,所述第二轉換模塊603,具體用于將所述拼音序列輸入預先訓練的語言模型,得到所述語言模型輸出的所述文本序列。

    可選地,所述語言模型通過如下模塊訓練:第二獲取模塊,用于獲取包含地址信息的樣本興趣點poi文本數據對應的樣本拼音序列和實際文本序列,將所述樣本拼音序列和所述實際文本序列作為第二樣本數據;第二訓練模塊,用于利用所述第二樣本數據對第二初始模型進行訓練;其中,所述第二初始模型的輸入為所述樣本拼音序列,輸出為預測文本序列;在基于所述預測文本序列和所述實際文本序列確定出所述第二初始模型訓練完成后,得到訓練完成的所述語言模型。

    可選地,所述識別模塊604包括:模型識別單元,用于將所述文本序列輸入預先訓練的地址識別模型,得到所述地址識別模型輸出的所述文本序列對應的bio標注序列;地址獲取單元,用于基于所述bio標注序列,從所述文本序列中提取標注為b和i的文本,將提取出的文本作為所述地址信息。

    可選地,所述地址識別模型通過如下模塊訓練:第三獲取單元,用于獲取包含地址信息的樣本poi文本數據對應的樣本文本序列和實際bio標注序列,將所述樣本文本序列和所述實際bio標注序列作為第三樣本數據;第三訓練單元,用于利用所述第三樣本數據對第三初始模型進行訓練;其中,所述第三初始模型的輸入為所述樣本文本序列,輸出為預測bio標注序列;在基于所述預測bio標注序列和所述實際bio標注序列確定出所述第三初始模型訓練完成后,得到訓練完成的所述地址識別模型。

    本發明實施例中,一方面,通過先將用戶輸入的語音數據轉換為拼音序列,再將拼音序列轉換為文本序列的方式,考慮到了上下文語境信息,相比于直接將語音數據轉換為文本序列的方式,本發明實施例得到的文本序列更加準確;另一方面,通過對文本序列進行地址識別,提取文本序列中包含的地址信息的方式,能夠去除文本序列中非地址信息的干擾,得到更加準確的地址信息。因此,基于提取出的地址信息,能夠更加準確地搜索出該地址信息對應的目標地址。

    對于裝置實施例而言,由于其與方法實施例基本相似,所以描述的比較簡單,相關之處參見方法實施例的部分說明即可。

    在本發明的實施例中,還提供了一種電子設備。該電子設備可以包括一個或多個處理器,以及其上存儲有指令的一個或多個機器可讀介質,指令例如應用程序。當所述指令由所述一個或多個處理器執行時,使得所述處理器執行上述的地址搜索方法。

    在本發明的實施例中,還提供了一種非臨時性計算機可讀存儲介質,其上存儲有計算機程序,該程序可由電子設備的處理器執行,以完成上述的地址搜索方法。例如,所述非臨時性計算機可讀存儲介質可以是rom、隨機存取存儲器(ram)、cd-rom、磁帶、軟盤和光數據存儲設備等。

    本說明書中的各個實施例均采用遞進的方式描述,每個實施例重點說明的都是與其他實施例的不同之處,各個實施例之間相同相似的部分互相參見即可。

    本領域內的技術人員應明白,本發明實施例的實施例可提供為方法、裝置、或計算機程序產品。因此,本發明實施例可采用完全硬件實施例、完全軟件實施例、或結合軟件和硬件方面的實施例的形式。而且,本發明實施例可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質(包括但不限于磁盤存儲器、cd-rom、光學存儲器等)上實施的計算機程序產品的形式。

    本發明實施例是參照根據本發明實施例的方法、終端設備(系統)、和計算機程序產品的流程圖和/或方框圖來描述的。應理解可由計算機程序指令實現流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結合??商峁┻@些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數據處理終端設備的處理器以產生一個機器,使得通過計算機或其他可編程數據處理終端設備的處理器執行的指令產生用于實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。

    這些計算機程序指令也可存儲在能引導計算機或其他可編程數據處理終端設備以特定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產生包括指令裝置的制造品,該指令裝置實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。

    這些計算機程序指令也可裝載到計算機或其他可編程數據處理終端設備上,使得在計算機或其他可編程終端設備上執行一系列操作步驟以產生計算機實現的處理,從而在計算機或其他可編程終端設備上執行的指令提供用于實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。

    盡管已描述了本發明實施例的優選實施例,但本領域內的技術人員一旦得知了基本創造性概念,則可對這些實施例做出另外的變更和修改。所以,所附權利要求意欲解釋為包括優選實施例以及落入本發明實施例范圍的所有變更和修改。

    最后,還需要說明的是,在本文中,諸如第一和第二等之類的關系術語僅僅用來將一個實體或者操作與另一個實體或操作區分開來,而不一定要求或者暗示這些實體或操作之間存在任何這種實際的關系或者順序。而且,術語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者終端設備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者終端設備所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,并不排除在包括所述要素的過程、方法、物品或者終端設備中還存在另外的相同要素。

    以上對本發明所提供的一種地址搜索方法、裝置、電子設備及存儲介質,進行了詳細介紹,本文中應用了具體個例對本發明的原理及實施方式進行了闡述,以上實施例的說明只是用于幫助理解本發明的方法及其核心思想;同時,對于本領域的一般技術人員,依據本發明的思想,在具體實施方式及應用范圍上均會有改變之處,綜上所述,本說明書內容不應理解為對本發明的限制。

    再多了解一些
    當前第1頁1 2 
    網友詢問留言 已有0條留言
    • 還沒有人留言評論。精彩留言會獲得點贊!
    1
    中文字幕一区在线观看视频_国产偷v国产偷v_西西人体44rt net毛最多_伊人久久大香线蕉综合网