人工智能場景落地爆發(fā),AI應用如何利用數(shù)據(jù)突圍?
當前,不管是人工智能技術的研發(fā)以及行業(yè)應用的發(fā)展,“數(shù)據(jù)”都是一個不可或缺、位于重中之重的因素。作為人工智能基石的數(shù)據(jù),發(fā)揮出越來越重要的作用,影響著人工智能場景應用的最終效果。現(xiàn)階段,在各個行業(yè)細分應用場景的需求下,人工智能對數(shù)據(jù)的還原度、準確度提出了更高要求。
從細分結(jié)構(gòu)來看,隨著AI技術的不斷成熟,更多的場景和行業(yè)開始嵌入使用AI技術,比如教育、法律、智能駕駛、銀行金融等,這些AI行業(yè)應用場景逐漸趨于長尾和碎片化,產(chǎn)生了大量細分專業(yè)化的數(shù)據(jù)需求。對于人工智能應用來說,AI數(shù)據(jù)的精準度失之毫厘則差之千里,而在人工智能應用落地的過程中,AI數(shù)據(jù)精準度的差異會愈發(fā)的明顯。在這里以國內(nèi)頭部AI數(shù)據(jù)采集標注服務商云測數(shù)據(jù)為例,看看高質(zhì)量、場景化、精準化AI數(shù)據(jù)怎樣幫助人工智能加速商業(yè)化、落地化、產(chǎn)業(yè)化進程。
以智能駕駛汽車領域為例,AI算法訓練數(shù)據(jù)的“數(shù)量”與“質(zhì)量”非常重要——現(xiàn)實交通場景復雜、安全威脅多,非常重視數(shù)據(jù)分析的效率和敏捷,尤其是國內(nèi)路況的復雜性和相關智能應用豐富的使用場景,更需要高質(zhì)、更精準的數(shù)據(jù)來進行算法訓練。
目前云測數(shù)據(jù)為智能駕駛企業(yè)提供的提供的解決方案分三部分。一是基礎數(shù)據(jù)集,二是定制化數(shù)據(jù)采集和標注服務,三是包括數(shù)據(jù)采集標注、數(shù)據(jù)管理的全方位數(shù)據(jù)工具鏈。
“三個部分對應不同層階段的自動駕駛落地需求。”云測數(shù)據(jù)總經(jīng)理賈宇航在接受媒體采訪時介紹,“第一個階段解決場景識別等基礎問題的通用數(shù)據(jù),例如車輛識別、車道線識別,這個階段涉及多種傳感器,需要大量布局;第二階段基于選定的場景,根據(jù)深度神經(jīng)網(wǎng)絡引入特定的數(shù)據(jù),云測數(shù)據(jù)場景實驗室和標注基地有實力滿足相應數(shù)據(jù)的精度和規(guī)模;第三階段形成數(shù)據(jù)閉環(huán),云測數(shù)據(jù)可提供一整套成熟工具幫助完成數(shù)據(jù)采集、標注、管理一系列流程,幫助企業(yè)完成自身迭代。”
據(jù)了解,云測數(shù)據(jù)采集服務覆蓋智能駕駛主流應用場景,擁有DMS與ADAS場景搭建采集經(jīng)驗,比如支持駕駛員信息備采、多模及車載語音采集等眾多類型。憑借高質(zhì)量的數(shù)據(jù)交付實力,云測數(shù)據(jù)已和業(yè)內(nèi)包括自主、合資車企,大型Tier1、Tier2,以及無人出租車、自動駕駛公司等眾多企業(yè),建立了持久良好的合作關系。
根據(jù)iResearch發(fā)布的《2020年中國AI基礎數(shù)據(jù)服務行業(yè)發(fā)展報告》:一個新研發(fā)的計算機視覺算法需要上萬張到數(shù)十萬張不等的標注圖片訓練;一個用于智慧城市的算法應用,每年都有數(shù)十萬張圖片的穩(wěn)定需求;語音方面,頭部公司累計應用的標注數(shù)據(jù)集已達百萬小時以上,每年需求仍以20%-30%的增速上升,不僅如此,隨著IoT設備的普及,語音交互場景越來越豐富,每年都有更多的新增場景和新需求方出現(xiàn),對于標注數(shù)據(jù)的需求也是逐步增長。
隨著人工智能落地需求的場景和專業(yè)化程度的增加,AI訓練數(shù)據(jù)本身的復雜度和種類也將不斷提升,人工智能需要的將是定制化、專業(yè)化、精細化的AI場景訓練數(shù)據(jù)產(chǎn)品服務,具有相關工具、資源、能力的訓練數(shù)據(jù)服務商將發(fā)揮極大的競爭優(yōu)勢,成為發(fā)揮AI數(shù)據(jù)價值的“源泉之地”
免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據(jù)。