商城系統(tǒng) 注冊

谷歌猜畫小歌小程序開發(fā)原理以及背后的AI技術(shù)分析

2018-07-20|HiShop
導(dǎo)讀:最近是不是大家都在癡迷谷歌開發(fā)的一個《猜畫小歌》小程序呢,簡直是蜜汁有趣,隨便畫畫,谷歌人工智能就能猜到正確答案。那么下面為大家分析這款小程序背后的原理。...

最近是不是大家都在癡迷谷歌開發(fā)的一個《猜畫小歌》小程序呢,簡直是蜜汁有趣,隨便畫畫,谷歌人工智能就能猜到正確答案。那么下面為大家分析這款小程序背后的原理。

谷歌猜畫小歌小程序開發(fā)原理以及背后的AI技術(shù)分析

機(jī)器學(xué)習(xí)原理

要聊到機(jī)器學(xué)習(xí),我們應(yīng)該知道,它主要有兩種方法:監(jiān)督式學(xué)習(xí)(Supervised Learning)和無監(jiān)督式學(xué)習(xí)(Unsupervised Learning)。

什么是監(jiān)督式學(xué)習(xí)

所謂監(jiān)督式學(xué)習(xí),就是需要我們提供大量的學(xué)習(xí)樣本,包括樣本相關(guān)的特征數(shù)據(jù)以及相應(yīng)的標(biāo)簽。AI 程序可以通過這些樣本來學(xué)習(xí)相關(guān)的規(guī)律或是模式,然后通過得到的規(guī)律或模式來判斷沒有被打過標(biāo)簽的數(shù)據(jù)是什么樣的數(shù)據(jù)。

就比如:「猜畫小歌」,我們小程序的用戶畫了大量的帶著標(biāo)簽的畫作,通過你畫的每個帶著標(biāo)簽的畫作,AI 程序就知道,原來人類是這么畫這個房子,這個船,這個蘋果等等這些東西的。原來人類眼中的他們是這樣的。它就會分析我們畫作的每一個特點(diǎn)和特征,從而進(jìn)行自我學(xué)習(xí)。我們提供這些大量的帶著標(biāo)簽的數(shù)據(jù)樣本也叫:訓(xùn)練數(shù)據(jù)(training data) 。

通過機(jī)器學(xué)習(xí)的算法,找到每幅畫作在不同手寫體下的特征,進(jìn)而找到規(guī)律和模式。然后通過得到的規(guī)律或模式來識別那些沒有被打過標(biāo)簽的畫,以此完成識別手寫畫作的目標(biāo)。

當(dāng)然,這個 AI 小程序在上線之前,肯定已經(jīng)用上萬甚至幾十萬的樣本訓(xùn)練過了,所以你在畫的時候,它會根據(jù)你畫的特征進(jìn)行一些分析和識別。而我們畫的這些又被它當(dāng)做樣本,通過算法進(jìn)行了自我學(xué)習(xí)。

其實(shí)說白了,Google 挺聰明的,讓 AI 小程序識別和猜測人類的畫作,通過大量我們提供的免費(fèi)標(biāo)注訓(xùn)練讓這個系統(tǒng)得到更好的學(xué)習(xí),提升和優(yōu)化。其實(shí)最后的目的可能就是:AI 智能小程序就會自己獨(dú)立創(chuàng)作繪畫,畫出各種跟人類一樣的作品。

所以啊,大家都是在玩的同時,在給這個 AI 小程序當(dāng)陪練呢!??!我每個用戶都為它的進(jìn)化提供了大量的幫助和數(shù)據(jù)。大家畫的越多,提供的數(shù)據(jù)樣本就越多,它通過自我學(xué)習(xí)和算法分析,就會識別越準(zhǔn)確,自己也就越了解人類。

什么是無監(jiān)督式學(xué)習(xí)?

無監(jiān)督式學(xué)習(xí) (Unsupervised Learning) 是人工智能網(wǎng)絡(luò)的一種算法 (algorithm),其目的是去對原始資料進(jìn)行分類,以便了解資料內(nèi)部結(jié)構(gòu)。有別于監(jiān)督式學(xué)習(xí)網(wǎng)絡(luò),無監(jiān)督式學(xué)習(xí)網(wǎng)絡(luò)在學(xué)習(xí)時并不知道其分類結(jié)果是否正確,亦即沒有受到監(jiān)督式增強(qiáng) (告訴它何種學(xué)習(xí)是正確的)。其特點(diǎn)是僅對此種網(wǎng)絡(luò)提供輸入范例,而它會自動從這些范例中找出其潛在類別規(guī)則。當(dāng)學(xué)習(xí)完畢并經(jīng)測試后,也可以將之應(yīng)用到新的案例上。

無監(jiān)督學(xué)習(xí)里典型的例子就是聚類了。聚類的目的在于把相似的東西聚在一起,而我們并不關(guān)心這一類是什么。因此,一個聚類算法通常只需要知道如何計(jì)算相似度就可以開始工作了。

可能還會有什么半監(jiān)督式學(xué)習(xí),這個就是上述兩者的結(jié)合,基本思想是利用數(shù)據(jù)分布上的模型假設(shè), 建立學(xué)習(xí)器對未標(biāo)簽樣本進(jìn)行標(biāo)簽。

「猜畫小歌」背后的 AI 技術(shù)

「猜畫小歌」對我們畫作的辨識,其實(shí)利用的就是神經(jīng)網(wǎng)絡(luò)技術(shù),是基于對大量涂鴉樣本的學(xué)習(xí)。就像,我剛才在上面監(jiān)督式學(xué)習(xí)那里所說的。

Google 表示,「猜畫小歌」由來自 Google 人工智能的神經(jīng)網(wǎng)絡(luò)技術(shù)驅(qū)動。該網(wǎng)絡(luò)源全世界范圍,超過 5000 萬個手繪素描的數(shù)據(jù)群。機(jī)器學(xué)習(xí)手繪素描后,可以通過粗糙的草圖來識別物體。例如一團(tuán)長著耳朵的墨跡可能是一只熊貓。

而這個小程序利用的技術(shù)就是:RNN,也就是遞歸神經(jīng)網(wǎng)絡(luò)。這個技術(shù)其實(shí)谷歌在之前早就使用了,并不新鮮,在去年 11 月,Google 專門研究人 “Quick, Draw!” 的看圖猜物品功能??梢愿鶕?jù)你勾勒的幾筆猜測三個可能的物品。Google 表示,這個技術(shù)是通過模擬人腦在畫一個物體時是如何運(yùn)用線條、形狀以及其它繪畫要素來進(jìn)行推斷。

我們在這個小程序上開始畫作,訓(xùn)練神經(jīng)網(wǎng)絡(luò),讓 AI 來理解人們在繪制畫作時是在何時起筆、走筆方向、何時停筆的。當(dāng)經(jīng)過訓(xùn)練的 RNN 模型接收到人類繪制的畫作后,會生成一張類似的新畫作。

你以為僅僅如此嗎?不是,如果你畫的畫作不對,有瑕疵,它其實(shí)還會糾正呢!在 RNN 模型當(dāng)中,當(dāng)用戶創(chuàng)作出的靈魂畫作,還沒有畫完時,比如只是畫出了人的頭,還沒有畫耳朵,AI 仍然能夠重構(gòu)出 “正常” 的畫作來。RNN 模型仍然會繼續(xù)生成有耳朵,有眼睛的正常人頭。

所以,在「猜畫小歌」小程序中,你僅僅可能只是畫出了一個大致的線條,還沒畫完的時候,AI 就已經(jīng)認(rèn)出你畫的是什么東西呢?它讀取的是你的起筆,線條,和一些特征數(shù)據(jù),就能夠快速猜出你畫的是什么?而且還能幫你補(bǔ)全和糾正。

你打開小程序,找到「我的畫作」點(diǎn)進(jìn)去,在每一幅畫作的下面寫著這么一句話:

谷歌猜畫小歌小程序開發(fā)原理以及背后的AI技術(shù)分析

 

以上就是這篇關(guān)于谷歌的猜畫小歌小程序的開發(fā)案例,如需更多了解可以關(guān)注我們~~

HiShop小程序工具提供多類型商城/門店小程序制作,可視化編輯 1秒生成5步上線。通過拖拽、拼接模塊布局小程序商城頁面,所看即所得,只需要美工就能做出精美商城。更多小程序商店請查看:小程序商店

電話咨詢 預(yù)約演示 0元開店