OPPO在國(guó)際人工智能會(huì)議CVPR 2021獲多項(xiàng)佳績(jī),自研算法首次賦能智慧工廠

相關(guān)專題: 人工智能

2021年6月24日,中國(guó),深圳——一年一度的全球計(jì)算機(jī)視覺(jué)頂級(jí)會(huì)議CVPR(Conference on Computer Vision and Pattern Recognition國(guó)際計(jì)算機(jī)視覺(jué)與模式識(shí)別會(huì)議)落下帷幕,OPPO在六大賽道共十二項(xiàng)賽項(xiàng)中取得一項(xiàng)第一,七項(xiàng)第二,四項(xiàng)第三的優(yōu)異成績(jī),僅次于百度等國(guó)內(nèi)第一梯隊(duì)的參賽選手,再次展示了強(qiáng)勁的AI創(chuàng)新實(shí)力。

本次參加CVPR 2021競(jìng)賽的團(tuán)隊(duì)來(lái)自O(shè)PPO研究院智能感知與交互研究部和OPPO美國(guó)研究所,先后在多目標(biāo)行為分析、足球行為分析、長(zhǎng)視頻理解、時(shí)空行為檢測(cè)、跨模態(tài)分析及人機(jī)交互識(shí)別六大賽道上取得優(yōu)異的成績(jī)。他們通過(guò)對(duì)算法的優(yōu)化、訓(xùn)練,不斷強(qiáng)化OPPO 的AI能力,讓AI更好地為人類服務(wù)。

由OPPO智能感知首席科學(xué)家郭彥東與清華學(xué)者等共同發(fā)表的《View-Guided Point Cloud Completion》論文,被本次CVPR所收錄。該論文通過(guò)執(zhí)行有效的跨模態(tài)和跨級(jí)別融合框架,為點(diǎn)云補(bǔ)全任務(wù)提出了一套視圖引導(dǎo)的全新解決方案。

郭彥東表示:“非常高興OPPO研究院智能感知與交互研究部繼CVPR 2020的首次亮相后,再度取得佳績(jī)。去年我們奪得第一名的‘極端超級(jí)分辨率感知’技術(shù),將模糊的照片‘算’得更清晰,‘手持設(shè)備視覺(jué)定位’技術(shù)讓融合定位更精準(zhǔn)。而此次獲獎(jiǎng)的多目標(biāo)行為分析、時(shí)空行為檢測(cè)、基于多張2D圖片的3D人臉重建等技術(shù),涉及行為識(shí)別、時(shí)空動(dòng)作定位、人臉識(shí)別等更復(fù)雜、前沿的領(lǐng)域,能夠在智能制造、智能美顏、智能家居、智慧辦公、智慧健康、智慧出行等應(yīng)用場(chǎng)景發(fā)揮重要作用。我們希望通過(guò)不斷的努力,讓AI能夠真正地為人所用,為我們帶來(lái)更智能更便捷的生活!

值得一提的是,OPPO在多目標(biāo)行為分析(Multi-Agent Behavior)賽道中收獲頗豐,其所應(yīng)用的AI算法能基于特征點(diǎn)信息準(zhǔn)確判別、預(yù)測(cè)動(dòng)物及人在復(fù)雜交互內(nèi)容下的行為。OPPO憑借著領(lǐng)先的AI算法能力,從全球240多個(gè)頂尖參賽團(tuán)隊(duì)中脫穎而出,獲得子賽項(xiàng)少樣本行為分類任務(wù)(Learning New Behavior)第一,及傳統(tǒng)分類(Classical Classification)與標(biāo)注風(fēng)格遷移任務(wù)(Annotation Style Transfer)賽項(xiàng)的第二與第三名。目前,這項(xiàng)技術(shù)正在OPPO智慧工廠發(fā)揮著保護(hù)作用,工人們?cè)谶@套算法的輔助下,可以避免關(guān)鍵生產(chǎn)環(huán)節(jié)的錯(cuò)漏錯(cuò)放,令自身和產(chǎn)線更安全。

多目標(biāo)行為分析賽道

從計(jì)算智能到人本智能,OPPO讓AI更“懂”人

秉持著“科技為人 以善天下”的企業(yè)使命,OPPO正在圍繞“以人為本”不斷構(gòu)建自身AI能力。在基于多張2D圖片的3D人臉重建(3D Face Reconstruction From Multiple 2D Images)挑戰(zhàn)賽中,OPPO自研的AI算法所還原的三維人臉模型與真實(shí)人臉誤差僅為1mm左右,在主要指標(biāo)成績(jī)排名中取得第二名。該算法克服了在實(shí)際生活中,特別是動(dòng)態(tài)視頻拍攝時(shí),因?yàn)閯?dòng)作導(dǎo)致的人臉五官點(diǎn)不明晰、表情夸張、甚至圖片數(shù)據(jù)失真等問(wèn)題,

事實(shí)上,OPPO自研的人臉檢測(cè)算法已能夠識(shí)別635個(gè)人臉特征關(guān)鍵點(diǎn),并實(shí)現(xiàn)30次/秒的高速運(yùn)行。在不久前發(fā)布的OPPO Reno6上,依托于該算法架構(gòu)的AI煥采美妝視頻技術(shù)為用戶輕松打造了動(dòng)態(tài)的自然美妝效果。這項(xiàng)技術(shù)將推動(dòng)人像視頻技術(shù)“升維”進(jìn)化,以3D級(jí)的特征點(diǎn)識(shí)別、令“上妝”效果更服帖;也將在社交平臺(tái)上制作出更豐富更貼合的AR特效,讓用戶在日常生活中享受到技術(shù)帶來(lái)的美好瞬間。

基于多張2D圖片的3D人臉重建賽項(xiàng)

讓AI理解我們所處的時(shí)間和空間

目前,OPPO的AI能力已發(fā)展到可以識(shí)別人在時(shí)空環(huán)境中的行為狀態(tài)。在足球行為分析(SoccerNet)賽道中,OPPO取得動(dòng)作定位(Action Spotting)和回放定位(Replay Grounding)兩個(gè)賽項(xiàng)第二名,僅次于百度。這項(xiàng)挑戰(zhàn)需要在一段足球比賽視頻中辨別出十幾種關(guān)鍵動(dòng)作,包括越位、紅牌這類基礎(chǔ)規(guī)則復(fù)雜,動(dòng)作幅度小,人類都很難識(shí)別的行為。同時(shí)AI算法還需要排除攝影機(jī)位不同等干擾因素,準(zhǔn)確定位回放片段在原始比賽視頻中發(fā)生的時(shí)間點(diǎn)。不久的將來(lái),這項(xiàng)技術(shù)將為體育愛(ài)好者們帶來(lái)福利,在比賽后AI可以實(shí)時(shí)整理精彩集錦。在該技術(shù)的幫助下,手機(jī)相冊(cè)也可以自動(dòng)制作類似“精彩一周”的視頻集錦,讓用戶可以隨時(shí)回顧自己生活中的美好瞬間。

足球行為分析賽道

在跨模態(tài)行為分析(MMact)賽道上,OPPO分別在行為識(shí)別(Cross-Modal Action Recognition)與行為定位(Cross-Model Action Temporal Localization)兩個(gè)子賽項(xiàng)中取得第二名。OPPO強(qiáng)大的AI算法僅通過(guò)視覺(jué)信息便可準(zhǔn)確識(shí)別一段視頻中人物在特定空間內(nèi)發(fā)生的交談、屈膝、走動(dòng)等十余種動(dòng)作。該技術(shù)未來(lái)有望廣泛應(yīng)用在家居場(chǎng)景,為家中老人、小孩、寵物帶來(lái)更貼心的照料。即使父母不在身邊,AI也可以在寶寶下意識(shí)做出危險(xiǎn)性動(dòng)作的時(shí)候,及時(shí)提醒父母,避免寶寶受到傷害。

此外,OPPO還在時(shí)空行為定位(AVA-Kinetics)賽道獲得第三名。AVA數(shù)據(jù)集作為行業(yè)內(nèi)第一個(gè)開(kāi)辟時(shí)空行為檢測(cè)的數(shù)據(jù)集,使用該數(shù)據(jù)集的定位賽項(xiàng)歷來(lái)是人工智能的熱門賽道之一,每年不乏國(guó)際頂尖科技公司與院校的知名團(tuán)隊(duì)參與其中。時(shí)空行為定位算法不僅可以準(zhǔn)確識(shí)別視頻中人們的行為,還可以同步定位其所處的時(shí)間段和空間范圍。這也意味著,OPPO的AI技術(shù)不僅能理解你在做什么,還可以在時(shí)空中“找到”你。

OPPO正在向更高維度的AI技術(shù)探索

本次CVPR上,OPPO在學(xué)術(shù)界前沿領(lǐng)域長(zhǎng)視頻理解(LOVEU, Long-form Video Understanding)挑戰(zhàn)中,獲得兩大賽項(xiàng)第三名。該賽道需要AI在預(yù)先沒(méi)有特定分類標(biāo)準(zhǔn)的情況下,自行理解視頻的意義并分割出其邊界的時(shí)間段落。因此,對(duì)算法的泛化性提出了極大挑戰(zhàn),AI需要像人一樣思考,理解視頻中人類動(dòng)作、顏色、物品、乃至光源的變化,并對(duì)變化點(diǎn)進(jìn)行判斷。未來(lái),這項(xiàng)技術(shù)可以廣泛應(yīng)用在視頻領(lǐng)域,作為AI處理視頻的基礎(chǔ)工序,為后續(xù)包括人臉識(shí)別、行為識(shí)別等AI任務(wù)的選擇和執(zhí)行奠定基礎(chǔ)。

OPPO研究院美國(guó)研究所參與了稠密深度估計(jì)挑戰(zhàn)賽道,展示了能夠基于2D圖像輸出稠密3D深度信息的技術(shù),獲得自監(jiān)督學(xué)習(xí)賽項(xiàng)第二名的成績(jī),并獲得“最佳創(chuàng)意獎(jiǎng)”。該技術(shù)通過(guò)利用深度學(xué)習(xí)模型直接從普通圖像輸出深度信息,未來(lái)有可能替代ToF這樣的深度傳感器,帶來(lái)體驗(yàn)更好的室內(nèi)外導(dǎo)航。


微信掃描分享本文到朋友圈
掃碼關(guān)注5G通信官方公眾號(hào),免費(fèi)領(lǐng)取以下5G精品資料

本周熱點(diǎn)本月熱點(diǎn)

 

  最熱通信招聘

業(yè)界最新資訊


  最新招聘信息