10倍杠杆配资什么意思-中航资本股票2021会涨到多少-【东方资本】,开通配资需要什么,文华财经随身行官网新版,炒股配资平台选择

訓練數(shù)據(jù)超20億 云從科技視覺大模型刷新四項世界紀錄

2023-07-19
back

近日,云從科技在視覺大模型上取得重要進展,行人基礎(chǔ)大模型在PA-100K、RAP V2、PETA、HICO-DET四個數(shù)據(jù)集上從阿里巴巴、日立等多家知名高校、企業(yè)與研究機構(gòu)脫穎而出,刷新了世界紀錄。


其中最高在PA100K上的Fine-tuning準確率達到92.89%,比SOTA高出5.2個點,四個數(shù)據(jù)集所涉及的范圍覆蓋人體全局屬性(性別、年齡),局部屬性(穿戴風格、配飾),攜帶屬性(手機、刀棍、手提包等)、人-物交互HOI(抽煙,持刀棍,手機拍屏幕)等。

表1:云從科技在PA-100K、RAP V2、PETA行人屬性數(shù)據(jù)集上的表現(xiàn)


作為“六感”之首的視覺,占據(jù)了人類吸收外部信息的70%以上。對于人工智能也一樣,行人基礎(chǔ)大模型讓人工智能如何識別關(guān)于人的一切信息,準確率的提高具有非常高的實用價值,本次突破意味著該技術(shù)首次達到大規(guī)模商用水平,也意味著計算機視覺已經(jīng)邁入「大模型時代」。


多模態(tài)結(jié)合自監(jiān)督學習 打造全球領(lǐng)先核心技術(shù)


以人為中心的感知任務(wù),一直是人工智能領(lǐng)域研究的熱點,大模型具有強大的表征能力,并且在多種數(shù)據(jù)模態(tài)(如語言、音頻、圖像、視頻、視覺語言)上得到驗證。行人基礎(chǔ)大模型已經(jīng)發(fā)展成為視覺大模型基礎(chǔ),云從科技結(jié)合實際業(yè)務(wù)落地需求,研發(fā)以人為中心的預訓練大模型,專注于以人為中心的各類下游任務(wù),實踐和貫徹“人機協(xié)同”理念。

表2:云從科技在HICO-DET人-物交互數(shù)據(jù)集上的表現(xiàn)


云從行人基礎(chǔ)大模型,使用了超過20億的數(shù)據(jù),包括大量無標簽數(shù)據(jù)集以及圖文多模態(tài)數(shù)據(jù)集,數(shù)據(jù)集的豐富多樣使得模型能夠提取到非常穩(wěn)健的特征,輕松應(yīng)用于多種行人任務(wù)。


基于自監(jiān)督學習范式,云從科技充分結(jié)合了對比學習和掩碼學習的優(yōu)點,使得模型包含豐富的語義信息,同時具有豐富的紋理細節(jié)提取能力。為了讓模型學習擁有更加豐富的行人語義信息,結(jié)合多模態(tài)繼續(xù)使用弱監(jiān)督訓練范式,進一步提升模型的效果。


在實際應(yīng)用場景中,大模型與針對單一任務(wù)的專用模型相比,表現(xiàn)出很強的泛化性,可以大大節(jié)約對真實數(shù)據(jù)的需求,甚至不需要額外收集真實數(shù)據(jù),極大節(jié)省了在下游任務(wù)上的遷移成本,可快速將大模型能力遷移到新的應(yīng)用場景之中,并且可廣泛應(yīng)用于能源、交通、制造、金融等行業(yè)領(lǐng)域,并為這些行業(yè)打造專屬的行業(yè)大模型,深度賦能。


基于基礎(chǔ)預訓練模型 大幅降低研發(fā)成本


傳統(tǒng)的行人檢測和分析存在諸多難點,包括缺乏對場景的理解,只能檢測出所有目標;其次行人的某些特征非常細微,需要模型具有細粒度的識別能力,各種大姿態(tài)和環(huán)境干擾容易造成影響;最后,對行人的檢測分析需求多變,層出不窮,大部分需要定制化開發(fā)。如何能夠降低開發(fā)成本,在技術(shù)產(chǎn)業(yè)化的過程中非常關(guān)鍵。

基于從容大模型平臺,開發(fā)者可以大幅降低對數(shù)據(jù)的依賴和提升訓練效率,僅需要1%的數(shù)據(jù)量即可達到與原場景定制化開發(fā)模型相接近的效果,適合獲取真實樣本代價非常高的特殊行業(yè)。


目前,該技術(shù)已廣泛應(yīng)用于礦山、建筑工地以及特殊場所的安全布控,監(jiān)控作業(yè)人員穿戴合規(guī),姿態(tài)行為等異常和違規(guī)行為。


此前,云從科技跨鏡追蹤技術(shù)于2018-2020連續(xù)三年三次打破世界紀錄,行人基礎(chǔ)大模型的突破,表明云從從容大模型已經(jīng)整合西部算力中心、聯(lián)合研發(fā)中心、行業(yè)數(shù)據(jù)等資源,打造出了更優(yōu)秀的人工智能視覺大模型,為實現(xiàn)人機協(xié)同操作系統(tǒng)和行業(yè)專用大模型在行業(yè)智能化升級領(lǐng)域的大規(guī)模實踐打下了堅實的基礎(chǔ)。

您可能感興趣

全國熱線電話

400-151-5992

周一到周五9:30-18:00(北京時間)

  • 商務(wù)合作:business@cloudwalk.com

  • 媒體合作:Media@cloudwalk.com

  • 渠道合作:business_partner@cloudwalk.com

  • 人才招聘:zhaopin@cloudwalk.com

Copyright?2025 粵公網(wǎng)安備 44011502001099號

粵ICP備15087156號 云從科技集團股份有限公司

AI開放平臺/云從logo/使用條款/法律聲明/防詐騙聲明
關(guān)注我們

掃描二維碼,關(guān)注云從科技
精彩一手掌握

留言咨詢

請?zhí)顚懸韵卤砀瘢覀兊匿N售代表會盡快與您聯(lián)系

  • 姓名 *
  • 工作郵箱
  • 電話 *
  • 城市 *
  • 公司名稱 *
  • 行業(yè)
  • 職位
  • 產(chǎn)品/解決方案
    AI定義設(shè)備
    場景定義設(shè)備
    機場專用產(chǎn)品
    刷臉支付終端
    活體模組
    智慧金融
    智慧治理
    智慧交通
    智慧商業(yè)
  • 預算
  • 請輸入需求描述 *

提交成功

我們的銷售代表會盡快與您聯(lián)系