Google 如何使用模式識別來了解圖片內(nèi)容
計算機(jī)“看”照片和視頻的方式與人類不同。您在看某張照片的時候,看到的可能是好友正站在自家房前的這一畫面。但對于計算機(jī)而言,這個畫面只是一堆數(shù)據(jù)而已,這些數(shù)據(jù)可能會轉(zhuǎn)譯為形狀以及色彩值信息。雖然計算機(jī)在看到該照片時不會有和您一樣的反應(yīng),但我們可以訓(xùn)練計算機(jī)識別某些色彩和形狀模式。例如,可以訓(xùn)練計算機(jī)識別風(fēng)景(如海灘)或物體(如汽車)數(shù)字圖片中包含的常見形狀和色彩模式。這項(xiàng)技術(shù)有助于 Google 照片對您的照片進(jìn)行整理分類,并讓用戶通過簡單的搜索即可找到任何照片。
此外,還可以訓(xùn)練計算機(jī)識別面孔數(shù)字圖片中包含的常見形狀和色彩模式。這個過程稱為面孔檢測,并且這項(xiàng)技術(shù)有助于 Google 在街景等服務(wù)中保護(hù)您的隱私。在街景服務(wù)中,計算機(jī)會嘗試檢測街景拍攝車所拍攝到的所有路人的面孔,然后對這些面孔進(jìn)行模糊處理。
更進(jìn)一步來說,這種可協(xié)助實(shí)現(xiàn)面孔檢測的模式識別技術(shù)有助于計算機(jī)了解所檢測到的面孔特征。例如,有些模式可能會表明臉上帶有微笑或雙眼緊閉。此類信息可用于協(xié)助 Google 提供多種功能,例如 Google 照片的影片推薦功能,以及其他利用您的照片和視頻制作的效果。
利用類似技術(shù),Google 照片還可以在某些國家/地區(qū)提供面孔特征分組功能,該功能有助于計算機(jī)檢測相似的面孔并將其分為一組,從而讓用戶更輕松地搜索和管理他們的照片。在 Google 照片幫助中心詳細(xì)了解面孔特征分組功能。
語音搜索的工作原理
利用語音搜索功能,您可以向設(shè)備上的 Google 搜索客戶端應(yīng)用提交語音查詢,而無需手動輸入查詢內(nèi)容。該功能利用模式識別技術(shù)將語音內(nèi)容轉(zhuǎn)錄為書面文字。我們會將語音內(nèi)容發(fā)送到 Google 服務(wù)器,以便識別您說的是什么。
對于向語音搜索功能提交的每條語音查詢,我們都會存儲相應(yīng)語言、國家/地區(qū)以及系統(tǒng)對語音內(nèi)容的猜測。我們會保留語音內(nèi)容以改進(jìn)我們的服務(wù)(包括對系統(tǒng)進(jìn)行訓(xùn)練,以便更準(zhǔn)確地識別搜索查詢),但前提是您已同意我們使用此類數(shù)據(jù)。除非您已表明自己打算使用語音搜索功能(例如,在快速搜索欄或虛擬鍵盤中按麥克風(fēng)圖標(biāo),或當(dāng)快速搜索欄中表明可以使用語音搜索功能時說出“Google”),否則我們不會將任何語音內(nèi)容發(fā)送到 Google。