商城系統(tǒng) 注冊

谷歌猜畫小歌小程序開發(fā)原理以及背后的AI技術分析

2018-07-20|HiShop
導讀:最近是不是大家都在癡迷谷歌開發(fā)的一個《猜畫小歌》小程序呢,簡直是蜜汁有趣,隨便畫畫,谷歌人工智能就能猜到正確答案。那么下面為大家分析這款小程序背后的原理。...

最近是不是大家都在癡迷谷歌開發(fā)的一個《猜畫小歌》小程序呢,簡直是蜜汁有趣,隨便畫畫,谷歌人工智能就能猜到正確答案。那么下面為大家分析這款小程序背后的原理。

谷歌猜畫小歌小程序開發(fā)原理以及背后的AI技術分析

機器學習原理

要聊到機器學習,我們應該知道,它主要有兩種方法:監(jiān)督式學習(Supervised Learning)和無監(jiān)督式學習(Unsupervised Learning)。

什么是監(jiān)督式學習

所謂監(jiān)督式學習,就是需要我們提供大量的學習樣本,包括樣本相關的特征數(shù)據(jù)以及相應的標簽。AI 程序可以通過這些樣本來學習相關的規(guī)律或是模式,然后通過得到的規(guī)律或模式來判斷沒有被打過標簽的數(shù)據(jù)是什么樣的數(shù)據(jù)。

就比如:「猜畫小歌」,我們小程序的用戶畫了大量的帶著標簽的畫作,通過你畫的每個帶著標簽的畫作,AI 程序就知道,原來人類是這么畫這個房子,這個船,這個蘋果等等這些東西的。原來人類眼中的他們是這樣的。它就會分析我們畫作的每一個特點和特征,從而進行自我學習。我們提供這些大量的帶著標簽的數(shù)據(jù)樣本也叫:訓練數(shù)據(jù)(training data) 。

通過機器學習的算法,找到每幅畫作在不同手寫體下的特征,進而找到規(guī)律和模式。然后通過得到的規(guī)律或模式來識別那些沒有被打過標簽的畫,以此完成識別手寫畫作的目標。

當然,這個 AI 小程序在上線之前,肯定已經(jīng)用上萬甚至幾十萬的樣本訓練過了,所以你在畫的時候,它會根據(jù)你畫的特征進行一些分析和識別。而我們畫的這些又被它當做樣本,通過算法進行了自我學習。

其實說白了,Google 挺聰明的,讓 AI 小程序識別和猜測人類的畫作,通過大量我們提供的免費標注訓練讓這個系統(tǒng)得到更好的學習,提升和優(yōu)化。其實最后的目的可能就是:AI 智能小程序就會自己獨立創(chuàng)作繪畫,畫出各種跟人類一樣的作品。

所以啊,大家都是在玩的同時,在給這個 AI 小程序當陪練呢?。?!我每個用戶都為它的進化提供了大量的幫助和數(shù)據(jù)。大家畫的越多,提供的數(shù)據(jù)樣本就越多,它通過自我學習和算法分析,就會識別越準確,自己也就越了解人類。

什么是無監(jiān)督式學習?

無監(jiān)督式學習 (Unsupervised Learning) 是人工智能網(wǎng)絡的一種算法 (algorithm),其目的是去對原始資料進行分類,以便了解資料內(nèi)部結構。有別于監(jiān)督式學習網(wǎng)絡,無監(jiān)督式學習網(wǎng)絡在學習時并不知道其分類結果是否正確,亦即沒有受到監(jiān)督式增強 (告訴它何種學習是正確的)。其特點是僅對此種網(wǎng)絡提供輸入范例,而它會自動從這些范例中找出其潛在類別規(guī)則。當學習完畢并經(jīng)測試后,也可以將之應用到新的案例上。

無監(jiān)督學習里典型的例子就是聚類了。聚類的目的在于把相似的東西聚在一起,而我們并不關心這一類是什么。因此,一個聚類算法通常只需要知道如何計算相似度就可以開始工作了。

可能還會有什么半監(jiān)督式學習,這個就是上述兩者的結合,基本思想是利用數(shù)據(jù)分布上的模型假設, 建立學習器對未標簽樣本進行標簽。

「猜畫小歌」背后的 AI 技術

「猜畫小歌」對我們畫作的辨識,其實利用的就是神經(jīng)網(wǎng)絡技術,是基于對大量涂鴉樣本的學習。就像,我剛才在上面監(jiān)督式學習那里所說的。

Google 表示,「猜畫小歌」由來自 Google 人工智能的神經(jīng)網(wǎng)絡技術驅(qū)動。該網(wǎng)絡源全世界范圍,超過 5000 萬個手繪素描的數(shù)據(jù)群。機器學習手繪素描后,可以通過粗糙的草圖來識別物體。例如一團長著耳朵的墨跡可能是一只熊貓。

而這個小程序利用的技術就是:RNN,也就是遞歸神經(jīng)網(wǎng)絡。這個技術其實谷歌在之前早就使用了,并不新鮮,在去年 11 月,Google 專門研究人 “Quick, Draw!” 的看圖猜物品功能??梢愿鶕?jù)你勾勒的幾筆猜測三個可能的物品。Google 表示,這個技術是通過模擬人腦在畫一個物體時是如何運用線條、形狀以及其它繪畫要素來進行推斷。

我們在這個小程序上開始畫作,訓練神經(jīng)網(wǎng)絡,讓 AI 來理解人們在繪制畫作時是在何時起筆、走筆方向、何時停筆的。當經(jīng)過訓練的 RNN 模型接收到人類繪制的畫作后,會生成一張類似的新畫作。

你以為僅僅如此嗎?不是,如果你畫的畫作不對,有瑕疵,它其實還會糾正呢!在 RNN 模型當中,當用戶創(chuàng)作出的靈魂畫作,還沒有畫完時,比如只是畫出了人的頭,還沒有畫耳朵,AI 仍然能夠重構出 “正常” 的畫作來。RNN 模型仍然會繼續(xù)生成有耳朵,有眼睛的正常人頭。

所以,在「猜畫小歌」小程序中,你僅僅可能只是畫出了一個大致的線條,還沒畫完的時候,AI 就已經(jīng)認出你畫的是什么東西呢?它讀取的是你的起筆,線條,和一些特征數(shù)據(jù),就能夠快速猜出你畫的是什么?而且還能幫你補全和糾正。

你打開小程序,找到「我的畫作」點進去,在每一幅畫作的下面寫著這么一句話:

谷歌猜畫小歌小程序開發(fā)原理以及背后的AI技術分析

 

以上就是這篇關于谷歌的猜畫小歌小程序的開發(fā)案例,如需更多了解可以關注我們~~

HiShop小程序工具提供多類型商城/門店小程序制作,可視化編輯 1秒生成5步上線。通過拖拽、拼接模塊布局小程序商城頁面,所看即所得,只需要美工就能做出精美商城。更多小程序商店請查看:小程序商店

電話咨詢 預約演示 0元開店