<input id="i6gg6"><blockquote id="i6gg6"></blockquote></input>
  • <sup id="i6gg6"><rt id="i6gg6"></rt></sup>
    <blockquote id="i6gg6"></blockquote>
  • <blockquote id="i6gg6"></blockquote>
  • <dd id="i6gg6"><blockquote id="i6gg6"></blockquote></dd>
  • <blockquote id="i6gg6"><small id="i6gg6"></small></blockquote>

    一種基于邊緣計算的數據采集和人機協同標注方法與流程

    文檔序號:25494307發布日期:2021-06-15 22:27
    一種基于邊緣計算的數據采集和人機協同標注方法與流程

    本發明涉及邊緣計算技術領域,具體為一種基于邊緣計算的數據采集和人機協同標注方法。



    背景技術:

    邊緣計算是指在靠近物或數據源頭的一側,采用網絡、計算、存儲、應用核心能力為一體的開放平臺,就近提供最近端服務,其應用程序在邊緣側發起,產生更快的網絡服務響應,滿足行業在實時業務、應用智能、安全與隱私保護等方面的基本需求,邊緣計算處于物理實體和工業連接之間,或處于物理實體的頂端,而云端計算,仍然可以訪問邊緣計算的歷史數據,對數據進行標注則可以使數據更加方便分析和使用;

    但是目前邊緣計算的數據采集和標注對于數據采集時的分析不夠,使大量無用數據采集,不僅導致后期數據的處理較為麻煩,數據的標注耗時較長,而且浪費較多的存儲空間,導致數據采集和標注的效率低下。



    技術實現要素:

    本發明提供一種基于邊緣計算的數據采集和人機協同標注方法,可以有效解決上述背景技術中提出目前邊緣計算的數據采集和標注對于數據采集時的分析不夠,使大量無用數據采集,不僅導致后期數據的處理較為麻煩,數據的標注耗時較長,而且浪費較多的存儲空間,導致數據采集和標注的效率低下的問題。

    為實現上述目的,本發明提供如下技術方案:一種基于邊緣計算的數據采集和人機協同標注方法,包括如下步驟:

    s1、選定靠近數據源的邊緣設備,梳理設備基本信息,進行數據采集;

    s2、根據設備類型利用計算機進行標注模型的構建;

    s3、對邊緣設備的數據進行預處理,并估算不同數據的占比;

    s4、然后根據數據的類型對標注模型進行排序;

    s5、將數據輸入標注模型進行標注;

    s6、提取出標注用時較長和標注失敗的數據,人工進行標注、檢查和修改;

    s7、將人工標注后的數據重新輸入,并根據標注失敗原因對標注模型進行更新;

    s8、將標注的數據傳送至邊緣計算的數據處理終端和云端服務器。

    根據上述技術方案,所述s1中,邊緣設備的基本信息有邊緣設備的個數、數據采集范圍、數據傳輸路徑、數據傳輸終端和數據種類,邊緣設備的數據種類包括圖像數據、語音數據、文本數據和視頻數據;

    在數據采集時,利用時鐘進行時間記錄,并對數據變化進行監控,采集數據后,長時間內數據未監測到變化,則后續的數據不進行采集和傳輸,直至監測到數據變化時,再次進行數據實時采集,并記錄兩次數據采集之間的時間間隔;

    數據長期呈現出規律變化后,則對數據變化進行預測,對預測數據和實時數據進行對比監測,若預測數據與實時數據吻合,則對數據的變化規律進行記錄,間隔相同時間采集一次數據,直至監測到實際數據與預測數據存在差異變化,再次進行數據采集,重新分析規律。

    根據上述技術方案,所述s2中,標注模型中設置有標注數據庫,構建的標注模型中設置有輪廓線標注、文本標注、標框標注和描點標注四種標注方式;

    其中,輪廓線標注主要用于圖像數據和視頻數據中的目標輪廓進行線條繪制標注;

    文本標注主要用于語音數據和視頻數據中的語音部分進行文字轉換標注;

    標框標注主要用于文本數據和圖像數據中對的重要部分進行框選標注;

    描點標注主要用于圖像數據和視頻數據的目標輪廓進行描點標注;

    文本數據、語音數據和圖像數據為靜態標注,視頻數據為動態標注,視頻數據在標注時需要分割為多個圖像進行標注。

    根據上述技術方案,所述s3中,將邊緣數據中無效數據去除,將去除無用數據后的數據按照圖像數據、語音數據、文本數據和視頻數據進行分類,再對每種數據占總數據的比例進行估算。

    根據上述技術方案,所述s4中,為每種數據選擇對應的標注方式,然后根據每種數據占比從大到小的順序對標注方式進行排序。

    根據上述技術方案,所述s5中,先利用排序在第一的標注方式進行標注,然后利用排序第二的標注方式進行標注,每種方式進行標注時,自動跳過其他不能標注的數據,以此類推繼續進行標注,直至選擇的標注方式全部標注完成。

    根據上述技術方案,所述s6中,對于標注用時較長的數據進行提取,并將無法標注的數據進行提??;

    將標注失敗的數據進行人工標注,并對標注用時較長的數據進行人工檢查,進行標注修改。

    根據上述技術方案,所述s7中,將標注失敗的數據人工標注后輸入標注模型中,將模型標注后的錯誤數據人工修改后,輸入標注模型中,替換原來的標注。

    根據上述技術方案,所述人工標注時,對標注過程進行記錄,標注模型對人工標注過程進行分析和學習,并將數據和數據標注輸入標注模型中,方便后續進行相同的標注。

    根據上述技術方案,所述s8中,將標注后的數據進行分類,然后進行壓縮傳輸至數據處理終端進行數據處理。

    與現有技術相比,本發明的有益效果:

    1、數據采集時,通過將長時間未變化的數據進行監測,直至數據發生變化時才進行采集,記錄兩次變化的時間間隔,從而減少中間相同數據得到采集,簡化數據的采集和后續數據標注處理的繁瑣工作,并對規律性變化的數據進行預測,實施對比監測,定期采集,減少無用數據的大量采集,節省數據存儲空間。

    2、通過對數據進行分類和占比估算,使數據按照圖片、視頻、語音和文本進行分類,并對每種數據占總數據的比重進行估算,從而能夠清晰的了解數據的類型,方便進行后續的標注工作,占比的估算方便對標注方式的選擇。

    3、通過計算機構建標注模型,標注模型中設置有輪廓線標注、文本標注、標框標注和描點標注四種標注方式,通過數據種類選擇合適的標注方式,根據占比從大到小的順序進行數據標注,使數據標注更加有序,不易造成標注混亂,方便檢查。

    4、通過對標注數據中無法標注的數據和標注耗時較長的數據進行提取,對計算機無法標注的數據人工進行數據標注,對于標注耗時較長的數據進行檢查,對錯誤標注進行修改,人機結合進行數據標注,使標注更加全面,使人機協同標注的效率更高。

    5、通過將人工標注和修改的數據標注輸送至標注模型中,對標注模型進行增添和修改,使標注模型的數據庫積累越來越多,并且及時在實踐中進行更新,有利于后續對數據的標注,減少后續無法標注的數據,從而使計算機標注的效率更高,減少人工標注的工作量。

    綜上所述,通過對數據的提煉采集,減少重復數據和無用數據,使數據采集更加精準,采集關鍵數據進行標注和分析,不僅不會減少信息量,而且會使得數據處理更加便捷,數據標注時,計算機構建標注模型,先對數據進行分類分次標注,使數據標注更加清晰,不易混亂,且對計算機標注存在困難的數據進行人工標注,使人機協同標注的效率更高,將人工標注的過程輸入標注模型,標注模型對人工標注進行學習,從而不斷的完成人工標注模型,減少人工標注次數和時間。

    附圖說明

    附圖用來提供對本發明的進一步理解,并且構成說明書的一部分,與本發明的實施例一起用于解釋本發明,并不構成對本發明的限制。

    在附圖中:

    圖1是本發明方法的步驟流程圖。

    具體實施方式

    以下結合附圖對本發明的優選實施例進行說明,應當理解,此處所描述的優選實施例僅用于說明和解釋本發明,并不用于限定本發明。

    實施例:如圖1所示,本發明提供一種技術方案,一種基于邊緣計算的數據采集和人機協同標注方法,包括如下步驟:

    s1、選定靠近數據源的邊緣設備,梳理設備基本信息,進行數據采集;

    s2、根據設備類型利用計算機進行標注模型的構建;

    s3、對邊緣設備的數據進行預處理,并估算不同數據的占比;

    s4、然后根據數據的類型對標注模型進行排序;

    s5、將數據輸入標注模型進行標注;

    s6、提取出標注用時較長和標注失敗的數據,人工進行標注、檢查和修改;

    s7、將人工標注后的數據重新輸入,并根據標注失敗原因對標注模型進行更新;

    s8、將標注的數據傳送至邊緣計算的數據處理終端和云端服務器。

    根據上述技術方案,s1中,邊緣設備的基本信息有邊緣設備的個數、數據采集范圍、數據傳輸路徑、數據傳輸終端和數據種類,邊緣設備的數據種類包括圖像數據、語音數據、文本數據和視頻數據;

    在數據采集時,利用時鐘進行時間記錄,并對數據變化進行監控,采集數據后,長時間內數據未監測到變化,則后續的數據不進行采集和傳輸,直至監測到數據變化時,再次進行數據實時采集,并記錄兩次數據采集之間的時間間隔;

    數據長期呈現出規律變化后,則對數據變化進行預測,對預測數據和實時數據進行對比監測,若預測數據與實時數據吻合,則對數據的變化規律進行記錄,間隔相同時間采集一次數據,直至監測到實際數據與預測數據存在差異變化,再次進行數據采集,重新分析規律,通過將長時間未變化的數據進行監測,直至數據發生變化時才進行采集,記錄兩次變化的時間間隔,從而減少中間相同數據得到采集,簡化數據的采集和后續數據標注處理的繁瑣工作,并對規律性變化的數據進行預測,實施對比監測,定期采集,減少無用數據的大量采集,節省數據存儲空間。

    根據上述技術方案,s2中,標注模型中設置有標注數據庫,構建的標注模型中設置有輪廓線標注、文本標注、標框標注和描點標注四種標注方式;

    其中,輪廓線標注主要用于圖像數據和視頻數據中的目標輪廓進行線條繪制標注;

    文本標注主要用于語音數據和視頻數據中的語音部分進行文字轉換標注;

    標框標注主要用于文本數據和圖像數據中對的重要部分進行框選標注;

    描點標注主要用于圖像數據和視頻數據的目標輪廓進行描點標注;

    文本數據、語音數據和圖像數據為靜態標注,視頻數據為動態標注,視頻數據在標注時需要分割為多個圖像進行標注。

    根據上述技術方案,s3中,將邊緣數據中無效數據去除,將去除無用數據后的數據按照圖像數據、語音數據、文本數據和視頻數據進行分類,再對每種數據占總數據的比例進行估算,清晰的了解數據的類型,方便進行后續的標注工作,占比的估算方便對標注方式的選擇。

    根據上述技術方案,s4中,為每種數據選擇對應的標注方式,然后根據每種數據占比從大到小的順序對標注方式進行排序。

    根據上述技術方案,s5中,先利用排序在第一的標注方式進行標注,然后利用排序第二的標注方式進行標注,每種方式進行標注時,自動跳過其他不能標注的數據,以此類推繼續進行標注,直至選擇的標注方式全部標注完成,通過數據種類選擇合適的標注方式,根據占比從大到小的順序進行數據標注,使數據標注更加有序,不易造成標注混亂,方便檢查。

    根據上述技術方案,s6中,對于標注用時較長的數據進行提取,并將無法標注的數據進行提??;

    將標注失敗的數據進行人工標注,并對標注用時較長的數據進行人工檢查,進行標注修改,人機結合進行數據標注,使標注更加全面,使人機協同標注的效率更高。

    根據上述技術方案,s7中,將標注失敗的數據人工標注后輸入標注模型中,將模型標注后的錯誤數據人工修改后,輸入標注模型中,替換原來的標注。

    根據上述技術方案,人工標注時,對標注過程進行記錄,標注模型對人工標注過程進行分析和學習,并將數據和數據標注輸入標注模型中,方便后續進行相同的標注,使標注模型的數據庫積累越來越多,并且及時在實踐中進行更新,有利于后續對數據的標注,減少后續無法標注的數據,從而使計算機標注的效率更高,減少人工標注的工作量。

    根據上述技術方案,s8中,將標注后的數據進行分類,然后進行壓縮傳輸至數據處理終端進行數據處理。

    最后應說明的是:以上所述僅為本發明的優選實例而已,并不用于限制本發明,盡管參照前述實施例對本發明進行了詳細的說明,對于本領域的技術人員來說,其依然可以對前述各實施例所記載的技術方案進行修改,或者對其中部分技術特征進行等同替換。凡在本發明的精神和原則之內,所作的任何修改、等同替換、改進等,均應包含在本發明的保護范圍之內。

    再多了解一些
    當前第1頁1 2 3 
    網友詢問留言 已有0條留言
    • 還沒有人留言評論。精彩留言會獲得點贊!
    1
    色偷偷亚洲偷自拍视频_欧美色精品视频在线观看_欧美特黄特色三级视频在线观看_毛片免费全部播放无码