<kbd id="ia2e8"><input id="ia2e8"></input></kbd><u id="ia2e8"></u>
  • <blockquote id="ia2e8"></blockquote>
  • <blockquote id="ia2e8"></blockquote>
  • <samp id="ia2e8"><label id="ia2e8"></label></samp>
  • 檢測音頻是否是純音樂音頻方法、終端及存儲介質與流程

    文檔序號:26091200發布日期:2021-07-30 17:59
    檢測音頻是否是純音樂音頻方法、終端及存儲介質與流程
    本申請涉及互聯網
    技術領域
    ,特別涉及一種檢測音頻是否是純音樂音頻方法、終端及存儲介質。
    背景技術
    :為了提高音頻的質量,往往需要檢測音頻是否是純音樂音頻,進而對音頻進行針對性處理。例如,對純音樂音頻進行混響處理。在相關技術中,將音頻輸入預先訓練的神經網絡模型,預先訓練的神經網絡模型對音頻進行多次迭代計算,進而檢測出該音頻是否是純音樂音頻。上述過程中神經網絡模型所需要的計算量大。技術實現要素:本申請實施例提供了一種檢測音頻是否是純音樂音頻方法、終端及存儲介質,相比于神經網絡模型,可以簡單快速的檢測音頻是否是純音樂音頻。該技術方案如下:第一方面,本申請實施例提供了一種檢測音頻是否是純音樂音頻方法,該方法包括:根據目標音頻中每個音頻幀中每個采樣頻率點的頻率和每個音級對應的多個頻段單元,確定每個音頻幀中每個音級對應的所有采樣頻率點;根據每個音頻幀中每個音級對應的所有采樣頻率點的幅值,確定每個音頻幀中每個音級的總能量;對于每個音頻幀,在所述音頻幀的每個音級的總能量中,確定最大總能量和次大總能量,根據所述次大總能量與所述最大總能量的比值,確定所述音頻幀是否為純音樂音頻幀;根據非純音樂音頻幀或純音樂音頻幀的數目與所述目標音頻中音頻幀的總數目的比值,確定所述目標音頻是否是純音樂音頻??蛇x的,所述根據目標音頻中每個音頻幀中每個采樣頻率點的頻率和每個音級對應的多個頻段單元,確定每個音頻幀中每個音級對應的所有采樣頻率點,包括:獲取每個音級對應的帶通濾波器,其中,所述帶通濾波器的多個通過頻段分別為對應的音級所包含的多個頻段單元;對于每個音頻幀,通過每個音級對應的帶通濾波器,分別對所述音頻幀中的每個采樣頻率點的頻率進行篩選,得到每個音級對應的所有采樣頻率點??蛇x的,所述音級對應的帶通濾波器為濾波器組,所述濾波器組由多個單通帶帶通濾波器組成,每個單通帶帶通濾波器對應的通過頻段分別為所述音級的一個頻段單元??蛇x的,所述音級對應的帶通濾波器為濾波器,所述濾波器為多通帶帶通濾波器,所述帶通濾波器上的每個通過頻段分別為所述帶通濾波器對應的音級的一個頻段單元??蛇x的,所述根據每個音頻幀中每個音級對應的所有采樣頻率點的幅值,確定每個音頻幀中每個音級的總能量,包括:根據每個音頻幀中每個音級對應的所有采樣頻率點的幅值,確定每個音頻幀中每個音級對應的所有采樣頻率點的幅值的平方和,作為每個音頻幀中每個音級的總能量??蛇x的,所述根據每個音頻幀中每個音級對應的所有采樣頻率點的幅值,確定每個音頻幀中每個音級的總能量,包括:根據每個音頻幀中每個音級對應的所有采樣頻率點的幅值,確定每個音頻幀中每個音級對應的所有采樣頻率點的幅值和,作為每個音頻幀中每個音級的總能量??蛇x的,所述方法還包括:確定第h個八度第c個音級對應的中心音分值;根據每個頻點索引對應的頻率以及音分值和頻率之間的轉換公式,確定每個頻點索引對應的音分值;根據第h個八度第c個音級對應的中心音分值以及每個索引頻點對應的音分值,構造第h個八度第c個音級的帶通濾波器的增益特性曲線??蛇x的,所述第h個八度第c個音級的帶通濾波器的增益特性曲線描述公式為:其中,wh,c(k)表示第h個八度第c個音級的帶通濾波器在第k個頻點索引處對應的增益,fc(k)表示第k個頻點索引對應的音分值,fcent(p)表示第h個八度第c個音級對應的中心音分值,p表示第h個八度第c個音級對應的半音標識。第二方面,本申請實施例提供了一種檢測音頻是否是純音樂音頻裝置,該裝置包括:第一確定模塊,被配置為根據目標音頻中每個音頻幀中每個采樣頻率點的幅值,確定每個音頻幀中各音級的總能量;第二確定模塊,被配置為根據每個音頻幀中每個音級對應的所有采樣頻率點的幅值,確定每個音頻幀中每個音級的總能量;第三確定模塊,被配置為對于每個音頻幀,在所述音頻幀的各音級的總能量中,確定最大總能量和次大總能量,根據所述次大總能量與所述最大總能量的比值,確定所述音頻幀是否為純音樂音頻幀;第四確定模塊,被配置為根據非純音樂音頻幀或純音樂音頻幀的數目與所述目標音頻中音頻幀的總數目的比值,確定所述目標音頻是否是純音樂音頻??蛇x的,所述第一確定模塊,被配置為:獲取每個音級對應的帶通濾波器,其中,所述帶通濾波器的多個通過頻段分別為對應的音級所包含的多個頻段單元;對于每個音頻幀,通過每個音級對應的帶通濾波器,分別對所述音頻幀中的每個采樣頻率點的頻率進行篩選,得到每個音級對應的所有采樣頻率點??蛇x的,所述音級對應的帶通濾波器為濾波器組,所述濾波器組由多個單通帶帶通濾波器組成,每個單通帶帶通濾波器對應的通過頻段分別為所述音級的一個頻段單元??蛇x的,所述音級對應的帶通濾波器為濾波器,所述濾波器為多通帶帶通濾波器,所述帶通濾波器上的每個通過頻段分別為所述帶通濾波器對應的音級的一個頻段單元??蛇x的,所述第二確定模塊,被配置為:根據每個音頻幀中每個音級對應的所有采樣頻率點的幅值,確定每個音頻幀中每個音級對應的所有采樣頻率點的幅值的平方和,作為每個音頻幀中每個音級的總能量??蛇x的,所述第二確定模塊,被配置為:根據每個音頻幀中每個音級對應的所有采樣頻率點的幅值,確定每個音頻幀中每個音級對應的所有采樣頻率點的幅值和,作為每個音頻幀中每個音級的總能量??蛇x的,所述裝置還包括帶通濾波器構建模塊,所述帶通濾波器構建模塊被配置為:確定第h個八度第c個音級對應的中心音分值;根據每個頻點索引對應的頻率以及音分值和頻率之間的轉換公式,確定每個頻點索引對應的音分值;根據第h個八度第c個音級對應的中心音分值以及每個索引頻點對應的音分值,構造第h個八度第c個音級的帶通濾波器的增益特性曲線??蛇x的,所述第h個八度第c個音級的帶通濾波器的增益特性曲線描述公式為:其中,wh,c(k)表示第h個八度第c個音級的帶通濾波器在第k個頻點索引處對應的增益,fc(k)表示第k個頻點索引對應的音分值,fcent(p)表示第h個八度第c個音級對應的中心音分值,p表示第h個八度第c個音級對應的半音標識。第三方面,本申請實施例提供了一種終端,該終端包括處理器和存儲器,該存儲器中存儲有至少一條程序代碼,該至少一條程序代碼由該處理器加載并執行以實現上述的檢測音頻是否是純音樂音頻方法。第四方面,本申請實施例提供了一種計算機可讀存儲介質,該計算機可讀存儲介質中存儲有至少一條程序代碼,該至少一條程序代碼由處理器加載并執行以實現上述的檢測音頻是否是純音樂音頻方法。第五方面,本申請實施例提供了一種計算機程序產品或計算機程序,該計算機程序產品或計算機程序包括計算機程序代碼,該計算機程序代碼存儲在計算機可讀存儲介質中,計算機設備的處理器從計算機可讀存儲介質讀取該計算機程序代碼,處理器執行該計算機程序代碼,使得該計算機設備執行上述的檢測音頻是否是純音樂音頻方法。本申請實施例提供的技術方案是根據最大能量值和最小能量值的比值來確定目標音頻是否為純音樂音頻,而確定最大能量值和最小能量值是可以是根據幅值直接確定的,而這種處理方法相比于基于神經網絡模型確定目標音頻是否為純音樂的方法所需的計算量小,可以快速檢測目標音頻是否是純音樂音頻。應當理解的是,以上的一般描述和后文的細節描述僅是示例性和解釋性的,并不能限制本發明。附圖說明為了更清楚地說明本申請實施例中的技術方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本申請的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。圖1是本申請實施例提供的一種檢測音頻是否是純音樂音頻方法的實施環境的示意圖;圖2是本申請實施例提供的一種檢測音頻是否是純音樂音頻方法的流程圖;圖3是本申請實施例提供的一種檢測音頻是否是純音樂音頻方法的示意圖;圖4是本申請實施例提供的一種檢測音頻是否是純音樂音頻方法的示意圖;圖5是本申請實施例提供的一種檢測音頻是否是純音樂音頻裝置的結構示意圖;圖6是本申請實施例提供的一種終端的結構示意圖;圖7是本申請實施例提供的一種服務器的結構示意圖。具體實施方式為使本申請的目的、技術方案和優點更加清楚,下面將結合附圖對本申請實施方式作進一步地詳細描述。圖1是本申請實施例提供的一種檢測音頻是否是純音樂音頻方法的實施環境的示意圖。如圖1所示,該方法可以由終端101或服務器102實現。終端101可以包括處理器、存儲器等部件。處理器,可以為cpu(centralprocessingunit,中央處理單元)等,可以用于確定每個音頻幀每個音級對應的總能量、確定每個音頻幀對應的最大總能量和次大總能量、確定音頻幀是否為純音樂音頻幀、確定音頻是否是純音樂音頻等處理。存儲器,可以為ram(randomaccessmemory,隨機存取存儲器),flash(閃存)等,可以用于存儲接收到的數據、處理過程所需的數據、處理過程中生成的數據等,如目標音頻、每個音頻幀對應的最大能量值和最小能量值、目標音頻中音頻幀的總數目、非純音樂音頻幀的數目、純音樂音頻幀的數目等。終端101還可以包括收發器、圖像檢測部件、屏幕、音頻輸出部件和音頻輸入部件等。收發器,可以用于與其它設備進行數據傳輸,例如,向其它設備發送目標音頻是否是純音樂音頻的結果等,可以包括天線、匹配電路、調制解調器等。圖像檢測部件可以是攝像頭等。屏幕可以是觸控屏,可以用于顯示目標音頻是否是純音樂音頻的結果等。音頻輸出部件可以是音箱、耳機等。音頻輸入部件可以是麥克風等。服務器102可以包括處理器、存儲器等部件。處理器,可以為cpu(centralprocessingunit,中央處理單元)等,可以用于確定每個音頻幀每個音級對應的總能量、確定每個音頻幀對應的最大總能量和次大總能量、確定音頻幀是否為純音樂音頻幀、確定音頻是否是純音樂音頻。存儲器,可以為ram(randomaccessmemory,隨機存取存儲器),flash(閃存)等,可以用于存儲接收到的數據、處理過程所需的數據、處理過程中生成的數據等,如目標音頻、每個音頻幀對應的最大能量值和最小能量值、目標音頻中音頻幀的總數目、非純音樂音頻幀的數目、純音樂音頻幀的數目等。圖2是本申請實施例提供的一種檢測音頻是否是純音樂音頻方法的流程圖。該實施例以電子設備為執行主體進行說明,電子設備可以是服務器或者終端,參見圖2,該實施例包括:步驟201、根據目標音頻中每個音頻幀中每個采樣頻率點的頻率和每個音級對應的多個頻段單元,確定每個音頻幀中每個音級對應的所有采樣頻率點。其中,目標音頻為待識別的音頻。目標音頻可以為整首歌曲音頻,也可以是歌曲音頻中的部分音頻。在本申請實施例中,通過每個音級對應的帶通濾波器來確定每個音級對應的所有采樣頻率點。具體步驟為:獲取每個音級對應的帶通濾波器,其中,帶通濾波器的多個通過頻段分別為對應的音級所包含的多個頻段單元。對于每個音頻幀,通過每個音級對應的帶通濾波器,分別對音頻幀中的每個采樣頻率點的頻率進行篩選,得到每個音級對應的所有采樣頻率點。在實施中,預先根據每個音級對應的多個頻段單元構造每個音級對應的帶通濾波器,并將每個音級對應的帶通濾波器存儲在電子設備中。對目標音頻進行分幀處理,獲取目標音頻包括的多個音頻幀以及每個音頻幀對應的幅度譜,其中該幅度譜中包括每個采樣頻率點的頻率和幅值。對于任意一個音頻幀,通過每個音級對應的帶通濾波器對音頻幀對應的采樣頻率點的頻率進行篩選,得到每個音級對應的所有頻率采樣點。其中,對目標音頻進行分幀處理,獲取目標音頻包括的多個音頻幀以及每個音頻幀對應的幅度譜的具體步驟為:以幀長256ms,幀移80ms對目標音頻進行分幀處理,并基于漢寧窗的表示公式對目標音頻的時域信號進行加窗處理,獲得加窗之后的時域信號。其中,漢寧窗的表示公式為w(i)表示樣本索引i對應的時域信號,i表示樣點索引的標識,n表示窗長,具體數值為n=4096。幀移之后的時域信號的表示公式為xwn(i)=x(l·n+i)·w(i),xwn(i)表示第n個音頻幀中第i個樣本索引對應的時域信號,l表示幀移長度,w(i)表示第i個樣本索引對應的時域信號。對上述幀移之后的時域信號進行傅里葉變換,得到加窗之后的頻域信號,該加窗之后的頻域信號的表示公式為其中,x(n,k)表示第n個音頻幀的第k個采樣頻率點的頻域信號,n表示音頻幀標識,i表示樣本索引的標識,k表示采樣頻率點的標識。對上述加窗之后的頻域信號進行取模計算,進而確定目標音頻中每個音頻幀中每個采樣頻率點對應的幅度值,其中,取模公式為a(n,k)=||x(n,k)||。上述過程涉及到的取模計算過程為:獲取頻域信號中的實部和虛部,并確定實部的平方值和虛部的平方值。將兩個平方值進行相加,得到平方和。對該平方和進行開方,得到該平方和對應開方值,將其作為該頻域信號對應的模??蛇x的,每個音級對應的帶通濾波器為濾波器組,濾波器組由多個單通帶帶通濾波器組成,每個單通帶帶通濾波器對應的通過頻段分別為音級的一個頻段單元。也就是說,每個音級對應多個單帶通濾波器,每個單帶通濾波器對應的通過頻段為該音級對應的一個頻段單元。其中,本申請實施例中的第1音級和第12音級分別對應8個頻段單元,即第1音級和第12音級分別對應8個單通帶帶通濾波器。而其他音級對應9個頻段單元,即其他音級對應9個單通帶帶通濾波器。在本申請實施例中,構建第h個八度第c個音級對應的單帶通帶通濾波器的過程如下所述:子步驟2011、確定第h個八度第c個音級對應的中心音分值。其中,八度用于衡量音和音之間在聽覺上的距離,是一種度量。對八度進行進一步劃分,得到12個音級。相同八度相鄰音級對應的中心音分值之差為100。相鄰八度相同音級對應的中心音分差為1200。在實施中,根據電子設備中預先存儲的公式fcent(h,c)=1200h+100(c-1),確定第h個八度第c個音級對應的中心音分值。其中,fcent(h,c)表示第h個八度第c個音級對應的中心音分值,h表示八度標識,c表示音級標識?;蛘?,預先將每個八度每個音級對應的中心音分值存儲在電子設備中,進而直接讀取出第h個八度第c個音級對應的中心音分值。其中,每個八度每個音級對應的中心音分值可以如表1所示。表10123456781/1200240036004800600072008400960021001300250037004900610073008500970032001400260038005000620074008600980043001500270039005100630075008700990054001600280040005200640076008800100006500170029004100530065007700890010100760018003000420054006600780090001020087001900310043005500670079009100103009800200032004400560068008000920010400109002100330045005700690081009300105001110002200340046005800700082009400106001211002300350047005900710083009500/在表2中,橫軸的0、1、2……8分別表示第0個八度、第1個八度、第2個八度……第8個八度,縱軸的1、2、3……12分別表示第1個音級、第2個音級、第3個音級……第12個音級。需要說明的是,在實際中,除第0個八度第1個音級和第8個八度第12個音級之外的其他頻段單元已經涵蓋了絕大多數音樂信號的頻率,因此播放音頻中的聲音的頻率一般不會在第0個八度第1個音級和第8個八度第12個音級對應的頻段單元內,這樣便不需要確定第0個八度第1個音級和第8個八度第12個音級分別對應的帶通濾波器,更不需要確定第0個八度第1個音級和第8個八度第12個音級分別對應的中心音分值。子步驟2012、根據每個頻點索引對應的頻率以及音分值和頻率之間的轉換公式,確定每個頻點索引對應的音分值。其中,在預設頻率范圍內每間隔預設頻率對頻率進行采樣,獲得每個頻點索引對應的頻率。其中,預設頻率范圍可以基于音分范圍(0,10600)得到的。在實施中,根據每個頻點索引對應的頻率以及音分和頻率之間的轉換公式確定每個頻點索引對應的音分值。其中,fcent為音分值,fhz為頻率值。子步驟2013、根據第h個八度第c個音級對應的中心音分值以及每個索引頻點對應的音分值,構造第h個八度第c個音級的帶通濾波器的增益特性曲線。其中,第h個八度第c個音級的帶通濾波器的增益特性曲線描述公式為:其中,wh,c(k)表示第h個八度第c個音級的帶通濾波器在第k個頻點索引處對應的增益,fc(k)表示第k個頻點索引對應的音分值,fcent(p)表示第h個八度第c個音級對應的中心音分值,p表示第h個八度第c個音級對應的半音標識,h表示八度標識,c表示音級標識。需要說明的是,fcent(p)=100*p,fcent(p+1)=100*(p+1),fcent(p-1)=100*(p-1)。也就是說,帶通濾波器可以過濾的索引頻點k所在的音分值范圍為(100*(p-1),100*(p-1)),即與帶通濾波器的通過頻段對應的音分值范圍為(100*(p-1),100*(p-1))。當然,在本申請實施例中,還可以通過以下步驟構建每個八度每個音級對應的帶通濾波器。步驟a、根據音分和頻率之間的轉換公式以及每個八度每個音級對應的音分單元,確定每個八度每個音級對應的頻段單元。確定每個八度每個音級對應的音分單元的方法為:在確定每個八度每個音級對應的中心音分值之后,對于每個八度每個音級而言,將該中心音分值與二分之一個半音的音分值相加,確定對應的音分單元中的最大音分值,將該中心音分值減去二分之一個半音的音分值,確定對應的音分單元中的最小音分值,根據最小音分值和最大音分值,確定對應的音分單元,進而得到每個八度每個音級對應的音分單元。其中,一個半音對應的音分值為100,二分之一個半音對應的音分值為50。例如,第0個八度第3個音級對應的中心音分值為200,二分之一個半音的音分值為50,這樣第0個八度第3個音級對應的音分單元中的最小音分值為150,對應的音分單元中的最大音分值為250。由此可知,第3個音級對應的音分范圍為150~250。需要說明的,為了保證每個音分值都存在對應的八度和音級,可以將每個八度每個音級對應的音分單元設為半開半閉區間,這樣基于可以保證每個音分值都存在對應的音級。例如,將第0個八度第3個音級對應的音分單元設置為(150,250],將第0個八度第4個音級對應的音分單元設置為(250,350]。在實施中,對于每個八度每個音級對應的音分單元,根據音分和頻率之間的轉換公式對該音分單元的最大音分值和最小音分值進行轉換,得到該頻段單元對應的最大頻率值和最小頻率值,進而得到該音分單元對應的頻段單元。通過這樣的方法,確定出每個八度每個音級對應的頻段單元。其中,音分和頻率之間的轉換公式為其中,fcent為音分值,fhz為頻率值。步驟b、根據每個八度每個c個音級對應的頻段單元,構造每個八度每個音級對應的帶通濾波器。在本申請實施例中,可以根據已有的構造帶通帶通濾波器的方法以及每個八度每個音級對應的頻段單元,構造每個八度每個音級對應的帶通濾波器。然而,根據步驟b確定出的每個八度每個音級對應的頻段單元適合構造沒有過濾帶的過濾器。而在實際過程設置的濾波器往往存在衰減頻段,衰減頻段的存在會影響到每個八度每個音級對應的采樣頻率點的數目和幅值,進而最終得到每個音級對應的總能量。為了避免這種影響,在本申請中,可以根據每個八度每個音級對應的中心音分值和半音對應的半音值,確定每個八度每個音級對應的音分單元。即將每個八度每個音級對應的中心音分值與半音對應的音分值進行相加,確定每個八度每個音級對應的音分單元中的最大音分值,將每個八度每個音級對應的中心音分值與半音對應的音分值進行相減,確定每個八度每個音級對應的音分單元中的最小音分值。根據每個八度每個半音對應的音分單元構造每個八度每個半音對應的帶通濾波器。這樣可以在一定程度上避免濾波器中的過濾帶對每個音級對應的總能量影響。需要說明的是,本申請還可以使用相關技術中的其他方法建立每個八度每個半音對應的帶通濾波器??蛇x的,每個音級對應的帶通濾波器為濾波器,濾波器為多通帶帶通濾波器,帶通濾波器上的每個通過頻段分別為帶通濾波器對應的音級的一個頻段單元。其中,本申請中的第1音級和第12音級分別對應8個頻段單元,即第1音級對應的帶通濾波器和第12音級對應的帶通濾波器只存在8個通過頻段。而其他音級對應9個頻段單元,即其他音級對應的帶通濾波器都存在9個通過頻段。上述涉及到的通過頻段為允許頻段單元內的頻率通過的頻段。在本申請實施例中,在確定出每個音級對應的至少一個頻段單元之后,可以通過相關技術中的其他方法建立每個音級對應的多通帶濾波器。步驟202、根據每個音頻幀中每個音級對應的所有采樣頻率點的幅值,確定每個音頻幀中每個音級的總能量。在實施中,在確定每個音頻幀中每個音級對應的所有采樣頻率點之后,確定每個音頻幀中每個音級對應的所有采樣頻率點的幅值。根據每個音頻幀中每個音級對應的所有采樣頻率點的幅值,確定每個音頻幀中每個音級的總能量??蛇x的,確定每個音級對應的所有采樣頻率點的幅值的平方和,作為每個音級的總能量。在實施中,對于每個音級而言,計算該音級對應的所有采樣頻率點的幅值的平方,進而將每個幅值的平方進行相加,確定出該音級對應的所有采樣頻率點的幅值的平方和。將這個平方和作為對應音級的總能量??蛇x的,確定每個音級對應的所有采樣頻率點的幅值和,作為每個音級的總能量。在實施中,對于每個音級而言,將音級對應的所有采樣頻率點的幅值進行相加,確定該音級對應的幅值和。將該幅值和作為每個音級的總能量。步驟203、對于每個音頻幀,在音頻幀的各音級的總能量中,確定最大總能量和次大總能量,根據次大總能量與最大總能量的比值,確定音頻幀是否為純音樂音頻幀。在實施中,對于每個音頻幀,在音頻幀的各音級的總能量中,確定最大總能量和次大總能量。之后,確定次大總能量與最大總能量的比值,將次大總能量與最大總能量的比值,確定為音頻幀是非純音樂音頻幀的概率。最后,當音頻幀為非純音樂音頻幀的概率大于第一預設數值時,確定該音頻幀是非純音樂音頻幀,當該音頻幀為非純音樂音頻幀的概率小于或者等于第一預設數值時,確定該音頻幀是純音樂音頻幀?;蛘?,根據預設公式確定音頻幀為純音樂音頻幀的概率,其中,v1(n)表示第n個音頻幀對應的最大總能量,v2(n)為表示第n個音頻幀對應的次大總能量,pi(n)表示第n個音頻幀為純音樂音頻幀的概率。當該音頻幀為純音樂音頻幀的概率大于或者等于第二預設數值時,確定該音頻幀為純音樂音頻幀。當該音頻幀為純音樂音頻幀的概率小于第二預設數值時,確定該音頻幀為非純音樂音頻幀。綜上可知,本申請實施例中確定音頻幀是否為純音樂音頻幀的方法存在兩種,第一種方法是當次大總能量與最大總能量的比值大于第一預設數值時,確定該音頻幀為非純音樂音頻幀。當次大總能量與最大總能量的比值小于或等于第一預設數值時,確定該音頻幀為純音樂音頻幀。第二種方法是當音頻幀為純音樂音頻幀的概率小于第二預設數值時,確定該音頻幀為非純音樂音頻幀。當音頻幀為純音樂音頻幀的概率大于或者等于第二預設數值時,確定該音頻幀為純音樂音頻幀。上述過程涉及到的第一預設數值和第二預設數值之間的關系為第一預設數值和第二預設數值的和為1。例如若第一預設數值設置為0.25,則將第二預設數值設置為0.75。步驟204、根據非純音樂音頻幀或純音樂音頻幀的數目與目標音頻中音頻幀的總數目的比值,確定目標音頻是否是純音樂音頻。在本申請實施例中,根據非純音樂音頻幀或純音樂音頻幀的數目與目標音頻中音頻幀的總數目的比值,確定目標音頻是否是純音樂音頻存在兩種方法,這兩種方法如下所述:第一種方法,當非純音樂音頻幀的數目與目標音頻中音頻幀的總數目的比值小于第一預設比值時,確定目標音頻是純音樂音頻;當非純音樂音頻幀的數目與目標音頻中音頻幀的總數目的比值大于或者等于第一預設比值時,確定目標音頻不是純音樂音頻。在實施中,統計非純音樂音頻幀的數目以及目標音頻中音頻幀的總數目,然后,計算非純音樂音頻幀的數目和總數目的比值,當該比值小于第一預設比值時,確定目標音頻是純音樂音頻,當該比值大于或者等于第一預設比值時,確定所述目標音頻不是純音樂音頻。第二種方法,當純音樂音頻幀的數目與目標音頻中音頻幀的總數目的比值大于或者等于第二預設比值時,確定目標音頻為純音樂音頻;當純音樂音頻幀的數目與目標音頻中音頻幀的總數目的比值小于第二預設比值時,確定目標音頻不是純音樂音頻。在實施中,統計純音樂音頻幀的數目以及目標音頻中音頻幀的總數目,然后,計算純音樂音頻幀的數目和總數目的比值,當該比值大于或者等于第二預設比值時,確定目標音頻是純音樂音頻,當該比值小于第一預設比值時,確定目標音頻不是純音樂音頻。在本申請實施例中,還可以通過純音樂音頻幀的數目和非純音樂音頻幀的數目來檢測音頻是否是純音樂音頻。具體的,當純音樂音頻幀的數目與非純音樂音頻幀的數目的比值大于或者等于第三預設比值時,確定目標音頻是純音樂音頻。當純音樂音頻幀的數目與非純音樂音頻幀的數目的比值小于第三預設比值時,確定目標音頻不是純音樂音頻。在實施中,統計目標音頻中的純音樂音頻幀的數目和非純音樂音頻幀的數目,然后,計算純音樂音頻幀的數目和非純音樂音頻幀的數目之間的比值。當該比值大于或者等于第三預設比值時,確定目標音頻是純音樂音頻,當該比值小于第三預設比值時,確定目標音頻不是純音樂音頻。在實際過程中,對于樂器來說,樂器發出的1000hz的聲音產生的頻譜圖如圖3所示,在1000hz、2000hz、3000hz……處會存在極窄的信號,而這種信號的寬度一般是小于每個音級對應的頻率寬度的,其中,1000hz對應的信號為基頻信號,2000hz、3000hz……對應的信號為倍頻信號。對于這樣的音頻信號,最大總能量是主要由1000hz對應的信號確定的,即最大總能量是主要由基頻信號確定的。次大總能量主要由2000hz對應的信號確定的,即次大總能量主要是由部分倍頻信號確定的。而基頻信號的幅值要遠遠大于倍頻信號,進而根據該特性確定音頻幀是否為樂器聲。而對于人聲而言,人物發出的1000hz的聲音產生的頻譜圖如圖3所示,其中,人聲發出的聲音大小和樂器聲發出的聲音大小相同。在圖3中可知,人聲在1000hz處的基頻信號是較寬的,而這種信號寬度一般大于每個音級對應的頻率寬度的,這樣確定的出最大總能量和次大總能量相差不大,進而可以根據該特性確定音頻幀是否包含人聲。需要說明的是,人聲之所以存在這種特性,是由于人聲引號會受到聲門齊聲以及聲道(口腔等)等影響,使得人聲信號的音調特性遠不如樂器清晰。在本申請實施例中,根據最大能量值和最小能量值的比值來確定目標音頻是否為純音樂音頻,而確定最大能量值和最小能量值是可以是根據幅值直接確定的,而這種處理方法相比于基于神經網絡模型確定目標音頻是否為純音樂的方法所需的計算量小,可以快速檢測目標音頻是否是純音樂音頻。圖5是本申請實施例提供的一種檢測音頻是否是純音樂音頻裝置的結構示意圖,參見圖5,該裝置包括:第一確定模塊510,被配置為根據目標音頻中每個音頻幀中每個采樣頻率點的幅值,確定每個音頻幀中各音級的總能量;第二確定模塊520,被配置為根據每個音頻幀中每個音級對應的所有采樣頻率點的幅值,確定每個音頻幀中每個音級的總能量;第三確定模塊530,被配置為對于每個音頻幀,在所述音頻幀的各音級的總能量中,確定最大總能量和次大總能量,根據所述次大總能量與所述最大總能量的比值,確定所述音頻幀是否為純音樂音頻幀;第四確定模塊540,被配置為根據非純音樂音頻幀或純音樂音頻幀的數目與所述目標音頻中音頻幀的總數目的比值,確定所述目標音頻是否是純音樂音頻??蛇x的,所述第一確定模塊510,被配置為:獲取每個音級對應的帶通濾波器,其中,所述帶通濾波器的多個通過頻段分別為對應的音級所包含的多個頻段單元;對于每個音頻幀,通過每個音級對應的帶通濾波器,分別對所述音頻幀中的每個采樣頻率點的頻率進行篩選,得到每個音級對應的所有采樣頻率點??蛇x的,所述音級對應的帶通濾波器為濾波器組,所述濾波器組由多個單通帶帶通濾波器組成,每個單通帶帶通濾波器對應的通過頻段分別為所述音級的一個頻段單元??蛇x的,所述音級對應的帶通濾波器為濾波器,所述濾波器為多通帶帶通濾波器,所述帶通濾波器上的每個通過頻段分別為所述帶通濾波器對應的音級的一個頻段單元??蛇x的,所述第二確定模塊520,被配置為:根據每個音頻幀中每個音級對應的所有采樣頻率點的幅值,確定每個音頻幀中每個音級對應的所有采樣頻率點的幅值的平方和,作為每個音頻幀中每個音級的總能量??蛇x的,所述第二確定模塊520,被配置為:根據每個音頻幀中每個音級對應的所有采樣頻率點的幅值,確定每個音頻幀中每個音級對應的所有采樣頻率點的幅值和,作為每個音頻幀中每個音級的總能量??蛇x的,所述裝置還包括帶通濾波器構建模塊,所述帶通濾波器構建模塊被配置為:確定第h個八度第c個音級對應的中心音分值;根據每個頻點索引對應的頻率以及音分值和頻率之間的轉換公式,確定每個頻點索引對應的音分值;根據第h個八度第c個音級對應的中心音分值以及每個索引頻點對應的音分值,構造第h個八度第c個音級的帶通濾波器的增益特性曲線??蛇x的,所述第h個八度第c個音級的帶通濾波器的增益特性曲線描述公式為:其中,wh,c(k)表示第h個八度第c個音級的帶通濾波器在第k個頻點索引處對應的增益,fc(k)表示第k個頻點索引對應的音分值,fcent(p)表示第h個八度第c個音級對應的中心音分值,p表示第h個八度第c個音級對應的半音標識。需要說明的是:上述實施例提供的檢測音頻是否是純音樂音頻裝置在檢測音頻是否是純音樂音頻時,僅以上述各功能模塊的劃分進行舉例說明,實際應用中,可以根據需要而將上述功能分配由不同的功能模塊完成,即將設備的內部結構劃分成不同的功能模塊,以完成以上描述的全部或者部分功能。另外,上述實施例提供的檢測音頻是否是純音樂音頻裝置與檢測音頻是否是純音樂音頻方法實施例屬于同一構思,其具體實現過程詳見方法實施例,這里不再贅述。圖6示出了本申請一個示例性實施例提供的終端600的結構框圖。該終端600可以是:智能手機、平板電腦、mp3播放器(movingpictureexpertsgroupaudiolayeriii,動態影像專家壓縮標準音頻層面3)、mp4(movingpictureexpertsgroupaudiolayeriv,動態影像專家壓縮標準音頻層面4)播放器、筆記本電腦或臺式電腦。終端600還可能被稱為用戶設備、便攜式終端、膝上型終端、臺式終端等其他名稱。通常,終端600包括有:處理器601和存儲器602。處理器601可以包括一個或多個處理核心,比如4核心處理器、8核心處理器等。處理器601可以采用dsp(digitalsignalprocessing,數字信號處理)、fpga(field-programmablegatearray,現場可編程門陣列)、pla(programmablelogicarray,可編程邏輯陣列)中的至少一種硬件形式來實現。處理器601也可以包括主處理器和協處理器,主處理器是用于對在喚醒狀態下的數據進行處理的處理器,也稱cpu(centralprocessingunit,中央處理器);協處理器是用于對在待機狀態下的數據進行處理的低功耗處理器。在一些實施例中,處理器601可以集成有gpu(graphicsprocessingunit,圖像處理器),gpu用于負責顯示屏所需要顯示的內容的渲染和繪制。一些實施例中,處理器601還可以包括ai(artificialintelligence,人工智能)處理器,該ai處理器用于處理有關機器學習的計算操作。存儲器602可以包括一個或多個計算機可讀存儲介質,該計算機可讀存儲介質可以是非暫態的。存儲器602還可包括高速隨機存取存儲器,以及非易失性存儲器,比如一個或多個磁盤存儲設備、閃存存儲設備。在一些實施例中,存儲器602中的非暫態的計算機可讀存儲介質用于存儲至少一個程序代碼,該至少一個程序代碼用于被處理器601所執行以實現本申請中方法實施例提供的檢測音頻是否是純音樂音頻方法。在一些實施例中,終端600還可選包括有:外圍設備接口603和至少一個外圍設備。處理器601、存儲器602和外圍設備接口603之間可以通過總線或信號線相連。各個外圍設備可以通過總線、信號線或電路板與外圍設備接口603相連。具體地,外圍設備包括:射頻電路604、顯示屏605、攝像頭組件606、音頻電路607、定位組件608和電源609中的至少一種。外圍設備接口603可被用于將i/o(input/output,輸入/輸出)相關的至少一個外圍設備連接到處理器601和存儲器602。在一些實施例中,處理器601、存儲器602和外圍設備接口603被集成在同一芯片或電路板上;在一些其他實施例中,處理器601、存儲器602和外圍設備接口603中的任意一個或兩個可以在單獨的芯片或電路板上實現,本實施例對此不加以限定。射頻電路604用于接收和發射rf(radiofrequency,射頻)信號,也稱電磁信號。射頻電路604通過電磁信號與通信網絡以及其他通信設備進行通信。射頻電路604將電信號轉換為電磁信號進行發送,或者,將接收到的電磁信號轉換為電信號??蛇x地,射頻電路604包括:天線系統、rf收發器、一個或多個放大器、調諧器、振蕩器、數字信號處理器、編解碼芯片組、用戶身份模塊卡等等。射頻電路604可以通過至少一種無線通信協議來與其它終端進行通信。該無線通信協議包括但不限于:城域網、各代移動通信網絡(2g、3g、4g及5g)、無線局域網和/或wifi(wirelessfidelity,無線保真)網絡。在一些實施例中,射頻電路604還可以包括nfc(nearfieldcommunication,近距離無線通信)有關的電路,本申請對此不加以限定。顯示屏605用于顯示ui(userinterface,用戶界面)。該ui可以包括圖形、文本、圖標、視頻及其它們的任意組合。當顯示屏605是觸摸顯示屏時,顯示屏605還具有采集在顯示屏605的表面或表面上方的觸摸信號的能力。該觸摸信號可以作為控制信號輸入至處理器601進行處理。此時,顯示屏605還可以用于提供虛擬按鈕和/或虛擬鍵盤,也稱軟按鈕和/或軟鍵盤。在一些實施例中,顯示屏605可以為一個,設置在終端600的前面板;在另一些實施例中,顯示屏605可以為至少兩個,分別設置在終端600的不同表面或呈折疊設計;在另一些實施例中,顯示屏605可以是柔性顯示屏,設置在終端600的彎曲表面上或折疊面上。甚至,顯示屏605還可以設置成非矩形的不規則圖形,也即異形屏。顯示屏605可以采用lcd(liquidcrystaldisplay,液晶顯示屏)、oled(organiclight-emittingdiode,有機發光二極管)等材質制備。攝像頭組件606用于采集圖像或視頻??蛇x地,攝像頭組件606包括前置攝像頭和后置攝像頭。通常,前置攝像頭設置在終端的前面板,后置攝像頭設置在終端的背面。在一些實施例中,后置攝像頭為至少兩個,分別為主攝像頭、景深攝像頭、廣角攝像頭、長焦攝像頭中的任意一種,以實現主攝像頭和景深攝像頭融合實現背景虛化功能、主攝像頭和廣角攝像頭融合實現全景拍攝以及vr(virtualreality,虛擬現實)拍攝功能或者其它融合拍攝功能。在一些實施例中,攝像頭組件606還可以包括閃光燈。閃光燈可以是單色溫閃光燈,也可以是雙色溫閃光燈。雙色溫閃光燈是指暖光閃光燈和冷光閃光燈的組合,可以用于不同色溫下的光線補償。音頻電路607可以包括麥克風和揚聲器。麥克風用于采集用戶及環境的聲波,并將聲波轉換為電信號輸入至處理器601進行處理,或者輸入至射頻電路604以實現語音通信。出于立體聲采集或降噪的目的,麥克風可以為多個,分別設置在終端600的不同部位。麥克風還可以是陣列麥克風或全向采集型麥克風。揚聲器則用于將來自處理器601或射頻電路604的電信號轉換為聲波。揚聲器可以是傳統的薄膜揚聲器,也可以是壓電陶瓷揚聲器。當揚聲器是壓電陶瓷揚聲器時,不僅可以將電信號轉換為人類可聽見的聲波,也可以將電信號轉換為人類聽不見的聲波以進行測距等用途。在一些實施例中,音頻電路607還可以包括耳機插孔。定位組件608用于定位終端600的當前地理位置,以實現導航或lbs(locationbasedservice,基于位置的服務)。定位組件608可以是基于美國的gps(globalpositioningsystem,全球定位系統)、中國的北斗系統、俄羅斯的格雷納斯系統或歐盟的伽利略系統的定位組件。電源609用于為終端600中的各個組件進行供電。電源609可以是交流電、直流電、一次性電池或可充電電池。當電源609包括可充電電池時,該可充電電池可以支持有線充電或無線充電。該可充電電池還可以用于支持快充技術。在一些實施例中,終端600還包括有一個或多個傳感器610。該一個或多個傳感器610包括但不限于:加速度傳感器611、陀螺儀傳感器612、壓力傳感器613、指紋傳感器614、光學傳感器615以及接近傳感器616。加速度傳感器611可以檢測以終端600建立的坐標系的三個坐標軸上的加速度大小。比如,加速度傳感器611可以用于檢測重力加速度在三個坐標軸上的分量。處理器601可以根據加速度傳感器611采集的重力加速度信號,控制顯示屏605以橫向視圖或縱向視圖進行用戶界面的顯示。加速度傳感器611還可以用于游戲或者用戶的運動數據的采集。陀螺儀傳感器612可以檢測終端600的機體方向及轉動角度,陀螺儀傳感器612可以與加速度傳感器611協同采集用戶對終端600的3d動作。處理器601根據陀螺儀傳感器612采集的數據,可以實現如下功能:動作感應(比如根據用戶的傾斜操作來改變ui)、拍攝時的圖像穩定、游戲控制以及慣性導航。壓力傳感器613可以設置在終端600的側邊框和/或顯示屏605的下層。當壓力傳感器613設置在終端600的側邊框時,可以檢測用戶對終端600的握持信號,由處理器601根據壓力傳感器613采集的握持信號進行左右手識別或快捷操作。當壓力傳感器613設置在顯示屏605的下層時,由處理器601根據用戶對顯示屏605的壓力操作,實現對ui界面上的可操作性控件進行控制??刹僮餍钥丶ò粹o控件、滾動條控件、圖標控件、菜單控件中的至少一種。指紋傳感器614用于采集用戶的指紋,由處理器601根據指紋傳感器614采集到的指紋識別用戶的身份,或者,由指紋傳感器614根據采集到的指紋識別用戶的身份。在識別出用戶的身份為可信身份時,由處理器601授權該用戶執行相關的敏感操作,該敏感操作包括解鎖屏幕、查看加密信息、下載軟件、支付及更改設置等。指紋傳感器614可以被設置在終端600的正面、背面或側面。當終端600上設置有物理按鍵或廠商logo時,指紋傳感器614可以與物理按鍵或廠商logo集成在一起。光學傳感器615用于采集環境光強度。在一個實施例中,處理器601可以根據光學傳感器615采集的環境光強度,控制顯示屏605的顯示亮度。具體地,當環境光強度較高時,調高顯示屏605的顯示亮度;當環境光強度較低時,調低顯示屏605的顯示亮度。在另一個實施例中,處理器601還可以根據光學傳感器615采集的環境光強度,動態調整攝像頭組件606的拍攝參數。接近傳感器616,也稱距離傳感器,通常設置在終端600的前面板。接近傳感器616用于采集用戶與終端600的正面之間的距離。在一個實施例中,當接近傳感器616檢測到用戶與終端600的正面之間的距離逐漸變小時,由處理器601控制顯示屏605從亮屏狀態切換為息屏狀態;當接近傳感器616檢測到用戶與終端600的正面之間的距離逐漸變大時,由處理器601控制顯示屏605從息屏狀態切換為亮屏狀態。本領域技術人員可以理解,圖6中示出的結構并不構成對終端600的限定,可以包括比圖示更多或更少的組件,或者組合某些組件,或者采用不同的組件布置。本申請實施例提供的計算機設備可提供為一種服務器。圖7是本申請實施例提供的一種服務器的結構示意圖,該服務器700可因配置或性能不同而產生比較大的差異,可以包括一個或一個以上處理器(centralprocessingunits,cpu)701和一個或一個以上的存儲器702,其中,該存儲器702中存儲有至少一條程序代碼,該至少一條程序代碼由該處理器701加載并執行以實現上述各個方法實施例提供的檢測音頻是否是純音樂音頻方法。當然,該服務器還可以具有有線或無線網絡接口、鍵盤以及輸入輸出接口等部件,以便進行輸入輸出,該服務器還可以包括其他用于實現設備功能的部件,在此不做贅述。在示例性實施例中,還提供了一種計算機可讀存儲介質,例如包括程序代碼的存儲器,上述程序代碼可由終端或服務器中的處理器執行以完成上述實施例中的檢測音頻是否是純音樂音頻方法。例如,所述計算機可讀存儲介質可以是只讀內存(read-onlymemory,rom)、隨機存取存儲器(randomaccessmemory),ram)、只讀光盤(compact-discread-onlymemory)、磁帶、軟盤和光數據存儲設備等。本領域普通技術人員可以理解實現上述實施例的全部或部分步驟可以通過硬件來完成,也可以通過程序來程序代碼相關的硬件完成,所述的程序可以存儲于一種計算機可讀存儲介質中,上述提到的存儲介質可以是只讀存儲器,磁盤或光盤等。以上所述僅為本申請的可選實施例,并不用以限制本申請,凡在本申請的精神和原則之內,所作的任何修改、等同替換、改進等,均應包含在本申請的保護范圍之內。當前第1頁12
    再多了解一些
    當前第1頁1 2 
    網友詢問留言 已有0條留言
    • 還沒有人留言評論。精彩留言會獲得點贊!
    1
    中文字幕一区在线观看视频_国产偷v国产偷v_西西人体44rt net毛最多_伊人久久大香线蕉综合网