激情婷婷六月天,不知火舞大战精子,肮脏的婚礼

設(shè)為首頁(yè) | 加為收藏 | 聯(lián)系我們 咨詢(xún)熱線(xiàn)：0632-5272123

快速導(dǎo)航

電話(huà)：0632-5272123
傳真：0632-5271123
地址：棗莊市文化西路23號(hào)
E-mail：zzint@zzint.com

技術(shù)咨詢(xún)：
業(yè)務(wù)咨詢(xún)：
客戶(hù)服務(wù)：
服務(wù)監(jiān)督：

詳細(xì)資料 您當(dāng)前的位置：網(wǎng)站首頁(yè)新聞動(dòng)態(tài)詳細(xì)資料

【AI創(chuàng)新者】小蟻首架張駿峰：讓圖像AI人盡可用

張駿峰，小蟻科技首席架構(gòu)師，負(fù)責(zé)小蟻AI圖像相關(guān)算法架構(gòu)。主要包括：小蟻智能攝像機(jī)的智能報(bào)警服務(wù)、小蟻智能行車(chē)記錄儀的輔助駕駛ADAS服務(wù)、小蟻運(yùn)動(dòng)相機(jī)App的圖像風(fēng)格遷移技術(shù)以及小蟻微單App的圖像視頻編輯技術(shù)。其團(tuán)隊(duì)包括移動(dòng)開(kāi)發(fā)、前端、后臺(tái)、算法，成員分布在北京及以色列。張駿峰于2015年加入小蟻，此前，張就職于微軟長(zhǎng)達(dá)14年，參與過(guò)Windows, .Net Framework, MSN, Office, Lync, Skype等產(chǎn)品的研發(fā)工作。

圖片描述

小蟻科技成立于2013年，是一家年輕的互聯(lián)網(wǎng)硬件企業(yè)。小蟻專(zhuān)注探索智能、可穿戴、移動(dòng)化的新型視頻類(lèi)智能電子產(chǎn)品的開(kāi)發(fā)，產(chǎn)品包括小蟻智能攝像機(jī)系列、小蟻行車(chē)記錄儀系列、小蟻運(yùn)動(dòng)相機(jī)系列、小蟻微單相機(jī)等智能硬件產(chǎn)品，以及和谷歌合作的YI Jump 360°3D VR拍攝設(shè)備。同時(shí)，小蟻還有一系列的移動(dòng)應(yīng)用和服務(wù)，幫助用戶(hù)更好地使用小蟻設(shè)備。

圖片描述

CSDN：駿峰您好，小蟻的產(chǎn)品主打視覺(jué)。那么首先請(qǐng)您向大家介紹一下，在小蟻智能攝像機(jī)上，與AI相關(guān)的技術(shù)有哪些？

張駿峰：我們?cè)谛∠佒悄軘z像機(jī)上提供了多種智能服務(wù)。

智能報(bào)警

大部分的智能攝像機(jī)都提供移動(dòng)偵測(cè)服務(wù)。當(dāng)攝像機(jī)檢測(cè)到畫(huà)面有大幅變動(dòng)的時(shí)候，服務(wù)器會(huì)向用戶(hù)推送一條報(bào)警消息。

小蟻智能攝像機(jī)提供了同樣的服務(wù)，同時(shí)，在報(bào)警的時(shí)候，向服務(wù)器上傳了一張圖片，和一段6秒鐘的視頻。這樣即使有人把攝像機(jī)拿走了，用戶(hù)還是可以看到發(fā)生了什么事。

傳統(tǒng)的移動(dòng)偵測(cè)方案，靈敏度是一個(gè)很難解決的問(wèn)題。如果靈敏度太高，用戶(hù)會(huì)收到過(guò)多的無(wú)效報(bào)警，可能會(huì)錯(cuò)過(guò)重要信息。如果靈敏度太低，會(huì)有重要事件發(fā)現(xiàn)而用戶(hù)收不到報(bào)警的情況。我們提供了一個(gè)拉桿，用戶(hù)可以在高，中，低靈敏度選擇。

我們還提供了一種人形檢測(cè)的升級(jí)方案。當(dāng)用戶(hù)把這個(gè)升級(jí)方案的開(kāi)關(guān)打開(kāi)后，如果檢測(cè)到畫(huà)面有大幅改動(dòng)，攝像機(jī)會(huì)繼續(xù)對(duì)畫(huà)面進(jìn)行進(jìn)一步檢測(cè)，只有在攝像機(jī)認(rèn)為畫(huà)面中有人，才會(huì)通知服務(wù)器給用戶(hù)推送報(bào)警信息。這樣可以大大減少誤報(bào)的情況。

小蟻智能攝像機(jī)還提供了寶寶哭聲檢測(cè)。如果攝像機(jī)檢測(cè)到持續(xù)的寶寶哭聲，也會(huì)向用戶(hù)推送報(bào)警。

手勢(shì)識(shí)別

小蟻智能攝像機(jī)還提供了手勢(shì)識(shí)別功能。當(dāng)用戶(hù)在攝像機(jī)面前做出“攤開(kāi)手掌-然后握拳”的組合動(dòng)作時(shí)，攝像機(jī)會(huì)自動(dòng)錄制10秒視頻，推送給手機(jī)App用戶(hù)。我家小孩特別喜歡這個(gè)功能，有事沒(méi)事他就會(huì)試一下這個(gè)功能，然后給我表演一段僵尸舞。

選擇“攤開(kāi)手掌-然后握拳”這樣一個(gè)組合，是為了減少誤觸發(fā)。

我們還在研究其他AI技術(shù)，比如人臉檢測(cè)，人臉識(shí)別，物體識(shí)別，如何經(jīng)濟(jì)實(shí)惠地讓這些新技術(shù)給用戶(hù)帶來(lái)價(jià)值。

圖片描述

CSDN：除智能攝像機(jī)之外，小蟻也發(fā)售行車(chē)記錄儀。那么在小蟻行車(chē)記錄儀上，與AI相關(guān)的技術(shù)有哪些？

張駿峰：我們?cè)谛∠佇熊?chē)記錄儀上為用戶(hù)提供ADAS智能安全提醒系統(tǒng)，有效提供安全提醒并實(shí)時(shí)糾正駕駛行為。主要是兩個(gè)功能：車(chē)道偏移預(yù)警，前車(chē)距離監(jiān)測(cè)

車(chē)道偏移預(yù)警

當(dāng)車(chē)輛在高速上行駛時(shí)，如果行車(chē)記錄儀檢測(cè)到車(chē)輛偏移道路時(shí)，會(huì)提醒用戶(hù)車(chē)輛已經(jīng)偏移道路。

前車(chē)距離監(jiān)測(cè)

行車(chē)時(shí)，如果行車(chē)記錄儀檢測(cè)到離前車(chē)距離越來(lái)越近，超過(guò)一定閾值時(shí)，會(huì)提醒用戶(hù)注意保持車(chē)輛距離。

CSDN：在上述兩種產(chǎn)品的模型訓(xùn)練過(guò)程中，訓(xùn)練集與測(cè)試集從何而來(lái)，采用何種網(wǎng)絡(luò)及框架，在系統(tǒng)調(diào)優(yōu)方面有何技巧？

張駿峰：開(kāi)源的數(shù)據(jù)集和開(kāi)源代碼提供了基礎(chǔ)的訓(xùn)練集和測(cè)試集。

但是這樣的數(shù)據(jù)集訓(xùn)練出來(lái)的模型，放在小蟻的產(chǎn)品上，出來(lái)的效果不是很滿(mǎn)意。

我們是有一批內(nèi)測(cè)攝像頭，免費(fèi)送給用戶(hù)。用戶(hù)看到有意思的情況，分享給我們。內(nèi)測(cè)用戶(hù)很多是小蟻員工。我們根據(jù)用戶(hù)提供的數(shù)據(jù)，調(diào)整模型，更新算法。

在實(shí)際產(chǎn)品上，我們采用的是一種“端+云”的混合方式。端上先做一部分篩選，云上再做進(jìn)一步的處理。

限于硬件的計(jì)算能力，端上目前是用傳統(tǒng)方法處理。

云上，我們現(xiàn)在使用的是YOLO模型，基于我們自己的情況，做了一些優(yōu)化。

圖片描述

CSDN：您認(rèn)為圖像分割、物體識(shí)別、目標(biāo)跟蹤這一系列技術(shù)的難點(diǎn)在哪里？

張駿峰：我們遇到的困難主要有兩點(diǎn)：1.數(shù)據(jù)，2.優(yōu)化

數(shù)據(jù)

雖然現(xiàn)在有很多開(kāi)源數(shù)據(jù)集，但是，這些數(shù)據(jù)集是被用于學(xué)術(shù)界創(chuàng)新和研究的benchmark數(shù)據(jù)集。這些數(shù)據(jù)和真實(shí)場(chǎng)景下的用戶(hù)數(shù)據(jù)差別很大，場(chǎng)景也不足夠豐富。用開(kāi)源數(shù)據(jù)訓(xùn)練出來(lái)的模型，識(shí)別率往往不夠理想。因此，真實(shí)場(chǎng)景下的海量標(biāo)注數(shù)據(jù)集是非常關(guān)鍵的。

小蟻產(chǎn)品的用戶(hù)量很大，用戶(hù)使用小蟻產(chǎn)品的場(chǎng)景各種各樣，環(huán)境也各不相同。有些用戶(hù)的使用場(chǎng)景也讓我們大開(kāi)腦洞。限于我們的人力物力，我們優(yōu)先處理主要用戶(hù)場(chǎng)景。

優(yōu)化

如前所述，小蟻采用的是一種“端+云”的混合方式。不管是端還是云，優(yōu)化始終是我們大的挑戰(zhàn)。

在端上，由于硬件限制，無(wú)法運(yùn)行深度神經(jīng)網(wǎng)絡(luò)，我們目前使用的是傳統(tǒng)方法。即使這樣，如何更快的處理視頻，也是很大的挑戰(zhàn)。

在云上，我們用GPU服務(wù)器運(yùn)行深度神經(jīng)網(wǎng)絡(luò)，費(fèi)用很高。小蟻的用戶(hù)量很大，用GPU服務(wù)器處理，成本壓力很大。

我們迫切需要技術(shù)的發(fā)展，能夠把不影響準(zhǔn)確率太多的前提下，把處理成本降下來(lái)。

CSDN：除了小蟻目前正在做的，您對(duì)圖像跟蹤、識(shí)別這一系列技術(shù)的落地方向還有何構(gòu)想？

張駿峰： AI技術(shù)現(xiàn)在已經(jīng)很強(qiáng)大了。AlphaGo顛覆了人們對(duì)AI的理解。人臉識(shí)別的準(zhǔn)確率不斷被刷新。但是，AI用到真正的場(chǎng)景上，還是非常困難的。首先是數(shù)據(jù)問(wèn)題。上面已經(jīng)討論過(guò)了。然后是模型的訓(xùn)練調(diào)參。這也是一個(gè)非常漫長(zhǎng)痛苦的過(guò)程。然后是模型的驗(yàn)證。周而復(fù)始。由于這些問(wèn)題，AI技術(shù)現(xiàn)在做好一個(gè)場(chǎng)景，需要花費(fèi)很大的精力。

期待有一天，AI技術(shù)可以做到像使用AWS API這樣簡(jiǎn)單。

圖片描述

CSDN：自從生成網(wǎng)絡(luò)火爆，圖像風(fēng)格遷移的APP便層出不窮，但似乎都還僅停留在娛樂(lè)層面，沒(méi)有向更深更實(shí)用的方向發(fā)展，那么小蟻?zhàn)鯝I藝術(shù)這個(gè)應(yīng)用的初衷是什么，下一步將踩在哪里？

張駿峰：小蟻除了硬件產(chǎn)品，還有很多相配套的移動(dòng)應(yīng)用配合硬件產(chǎn)品。其中，小蟻運(yùn)動(dòng)相機(jī)/小蟻微單App提供了完整的硬件控制，圖像視頻編輯，社區(qū)分享的流程。我們一直在思考如何讓用戶(hù)玩得更好。

2015年底我們已經(jīng)知道風(fēng)格遷移的論文，并且做了嘗試。那時(shí)候我們沒(méi)有GPU機(jī)器，用cpu來(lái)實(shí)現(xiàn)處理算法，處理速度非常慢。嘗試過(guò)一次后我們就放棄了。

Prisma的火爆，讓我們意識(shí)到在風(fēng)格遷移是可以有很好的移動(dòng)用戶(hù)體驗(yàn)的。我們開(kāi)始使用購(gòu)買(mǎi)GPU機(jī)器，用GPU來(lái)實(shí)現(xiàn)風(fēng)格遷移算法。幸運(yùn)的是，那時(shí)候已經(jīng)有好幾篇論文，把風(fēng)格轉(zhuǎn)換的速度提高了很多。我們?cè)谇叭说幕A(chǔ)上，實(shí)現(xiàn)了我們自己的風(fēng)格遷移算法，應(yīng)用到小蟻的移動(dòng)應(yīng)用上。

小蟻AI藝術(shù)上線(xiàn)的時(shí)候，正好趕上微信小程序即將上線(xiàn)的消息。我們立刻組織人員實(shí)現(xiàn)了小蟻AI藝術(shù)微信小程序版。由于時(shí)間緊迫，我們?cè)诤笠粋€(gè)星期六才提交審核。幸運(yùn)的是，我們的小程序一次審核通過(guò)，得以在小程序放開(kāi)的第一天，讓用戶(hù)使用。大部分使用過(guò)小蟻AI藝術(shù)微信小程序的用戶(hù)，反饋都是非常正面的。在幾乎沒(méi)有推廣的情況下，上線(xiàn)第一天獲得了超過(guò)20萬(wàn)的使用次數(shù)。

我們?cè)缟暇€(xiàn)的小程序只能處理圖片。春節(jié)之后，我們更新了一版，新的小蟻AI藝術(shù)微信小程序可以處理小視頻。相信用戶(hù)用小蟻AI藝術(shù)處理過(guò)小視頻后，會(huì)有更深刻的感受。

現(xiàn)在的小蟻AI藝術(shù)，從用戶(hù)體驗(yàn)上看，還有很多局限性。首先，每一種風(fēng)格，合適于某一類(lèi)圖片。現(xiàn)在的體驗(yàn)，用戶(hù)必須手動(dòng)把所有風(fēng)格都試一遍，才知道哪種風(fēng)格合適。某一種風(fēng)格，或者合適于人像，或者合適于風(fēng)景。對(duì)于同時(shí)有人有景的圖片，有時(shí)候需要做一個(gè)抉擇。

我們能提供的風(fēng)格模板也比較有限，用戶(hù)使用過(guò)一陣后，新鮮感減少。好的用戶(hù)體驗(yàn)，是讓用戶(hù)任意指定一張照片，和一種風(fēng)格，我們能把這張照片按照用戶(hù)指定風(fēng)格處理。我們現(xiàn)在的技術(shù)還無(wú)法做到這一點(diǎn)。

CSDN：您覺(jué)得圖像風(fēng)格遷移技術(shù)的難點(diǎn)在哪里，如何落地，瓶頸是什么？

張駿峰：首先是網(wǎng)絡(luò)設(shè)計(jì)。各種論文上的方法，需要我們自己實(shí)現(xiàn)出來(lái)。但是按照論文方法實(shí)現(xiàn)出來(lái)后，我們發(fā)現(xiàn)效果不是很好，照片處理后有一種很臟的感覺(jué)。如何去臟，把照片弄干凈，花了我們很多時(shí)間。我們對(duì)終的效果還是很滿(mǎn)意的。

然后就是風(fēng)格的選取。選擇一個(gè)對(duì)大多數(shù)照片都合適的風(fēng)格，是一件很繁瑣的事情。我們一開(kāi)始就定了一個(gè)方向：中國(guó)風(fēng)。事實(shí)證明，傳統(tǒng)中國(guó)風(fēng)，顏色比較簡(jiǎn)單，大部分的照片，遷移之后效果不太好。我們從兩個(gè)方面解決這個(gè)問(wèn)題。一方面，我們把中國(guó)近代的著名畫(huà)家都找了一遍，試了無(wú)數(shù)張，后從中挑了8種風(fēng)格做為第一次的模板。同時(shí)，我們針對(duì)這8種風(fēng)格，每一種風(fēng)格都做了不同的網(wǎng)絡(luò)優(yōu)化。

整個(gè)過(guò)程中，我們發(fā)現(xiàn)，選擇一種好風(fēng)格，非常花時(shí)間。我們也希望能有一種工具，讓我們很容易判斷這種風(fēng)格是否好。但目前為止，我們還沒(méi)有找到這樣的工具。

圖片描述

CSDN：小蟻AI藝術(shù)訓(xùn)練所用數(shù)據(jù)來(lái)自哪里，采用何種網(wǎng)絡(luò)及框架，在具體實(shí)施過(guò)程中有何技巧？

張駿峰：對(duì)我們來(lái)說(shuō)，比較幸運(yùn)的是，我們已經(jīng)有一個(gè)小蟻社區(qū)，用戶(hù)在社區(qū)上分享了很多照片。這些照片是我們的測(cè)試數(shù)據(jù)集。風(fēng)格的選取上，由于我們主打中國(guó)風(fēng)，我們主要的目標(biāo)在中國(guó)近現(xiàn)代著名畫(huà)家的作品上。

網(wǎng)絡(luò)方面，主要是借鑒了李飛飛的網(wǎng)絡(luò)，根據(jù)我們自己的風(fēng)格，做了不同的調(diào)整�？蚣芪覀冇玫氖荰orch。

我們花了很多時(shí)間處理去臟的問(wèn)題。這個(gè)也是一個(gè)開(kāi)發(fā)靈機(jī)一動(dòng)想到的辦法，然后就好了。很神奇。

CSDN：小蟻AI藝術(shù)主打“中國(guó)風(fēng)”，請(qǐng)問(wèn)為何選擇這種風(fēng)格？

張駿峰：因?yàn)槲覀儾幌牒推渌艘粯�。很多App選擇了西方風(fēng)格。我們?cè)谥袊?guó)，就應(yīng)該選擇中國(guó)風(fēng)。這種選擇讓我們多了很多開(kāi)發(fā)時(shí)間，但我們認(rèn)為是值得的，也是我們?yōu)橹湴恋摹?/p>

CSDN：在產(chǎn)品的研發(fā)過(guò)程中，團(tuán)隊(duì)遇到過(guò)哪些問(wèn)題？是如何解決的？

張駿峰：服務(wù)端，小程序初上線(xiàn)的時(shí)候，很多人用，給服務(wù)器很大壓力。我們使用的是阿里云的服務(wù)。在阿里云的HPC和阿里云OSS之間，對(duì)于高并發(fā)有一些問(wèn)題。我們幾次反復(fù)，和阿里云支持團(tuán)隊(duì)多次交流，后解決。

小程序方面，很多H5有的功能不能使用，也讓開(kāi)發(fā)饒了一些彎路。比如，給圖片加水印，就試了好多條路，后是在服務(wù)器上實(shí)現(xiàn)的。

開(kāi)發(fā)AI藝術(shù)小視頻的時(shí)候，也遇到了很多問(wèn)題。視頻的方向是一個(gè)大問(wèn)題。視頻的處理時(shí)間比圖片長(zhǎng)很多，這使得我們不得不改架構(gòu)。

大部分問(wèn)題都解決了。但是在小程序上如何保存處理后的視頻，我們始終沒(méi)有找到一個(gè)好方法�，F(xiàn)在只能讓用戶(hù)在我們提供的H5頁(yè)面上處理保存視頻。

CSDN：小蟻的產(chǎn)品及技術(shù)如何與競(jìng)品公司差異化？

張駿峰：聽(tīng)用戶(hù)反饋，抓住每一個(gè)細(xì)節(jié)，緊跟世界前沿，學(xué)習(xí)先進(jìn)經(jīng)驗(yàn)，不斷進(jìn)步，努力做到更好。這是我們的原則。

CSDN：在管理方面，您有何獨(dú)到的帶隊(duì)方式？

張駿峰：給團(tuán)隊(duì)高度，讓團(tuán)隊(duì)用自己的辦法達(dá)到期望的高度，然后告訴我他們自己可以達(dá)到的高度（必須比我要求的高度更高）。向世界好看齊。

上篇文章：2017年網(wǎng)頁(yè)設(shè)計(jì)的16個(gè)趨勢(shì)

下篇文章：開(kāi)展域名實(shí)名認(rèn)證工作

版權(quán)所有棗莊市英特信息網(wǎng)絡(luò)有限公司 ◎2017
聯(lián)系電話(huà)：0632-5271123 5272123 總部地址：棗莊市市中區(qū)文化西路23號(hào)
魯ICP備09021689號(hào) 增值電信業(yè)務(wù)經(jīng)營(yíng)許可證編號(hào)：魯 B2-20080087號(hào)