Light Coding技術(shù)。
Light Coding技術(shù)理論是利用連續(xù)光(近紅外線)對(duì)測(cè)量空間進(jìn)行編碼,經(jīng)感應(yīng)器讀取編碼的光線,交由晶片運(yùn)算進(jìn)行解碼后,產(chǎn)生成一張具有深度的圖像。 Light Coding技術(shù)的關(guān)鍵是Laser Speckle雷射光散斑,當(dāng)雷射光照射到粗糙物體、或是穿透毛玻璃后,會(huì)形成隨機(jī)的反射斑點(diǎn),稱之為散斑。散斑具有高度隨機(jī)性,也會(huì)隨著距離而變換圖案,空間中任何兩處的散斑都會(huì)是不同的圖案,等于是將整個(gè)空間加上了標(biāo)記,所以任何物體進(jìn)入該空間、以及移動(dòng)時(shí),都可確切紀(jì)錄物體的位置。Light Coding發(fā)出雷射光對(duì)測(cè)量空間進(jìn)行編碼,就是指產(chǎn)生散斑。
Kinect就是以紅外線發(fā)出人眼看不見的class 1雷射光,透過鏡頭前的diffuser(光柵、擴(kuò)散片)將雷射光均勻分布投射在測(cè)量空間中,再透過紅外線攝影機(jī)記錄下空間中的每個(gè)散斑,擷取原始資料后,再透過晶片計(jì)算成具有3D深度的圖像。
PrimeSence公司用的Light Coding技術(shù),說穿了與微軟先前買下3DV公司所使用的TOF技術(shù)根本就毫不相關(guān),只是產(chǎn)生的結(jié)果類似。這點(diǎn)更加印證了微軟收購3DV Systems,只是為了動(dòng)作感測(cè)相關(guān)的專利權(quán)、取得領(lǐng)先地位。
由于微軟并沒有買斷PrimeSense公司的技術(shù),因此PrimeSensor裝置未來也有可能出現(xiàn)在電視、電腦 等消費(fèi)性產(chǎn)品上,例如CyberLink訊連科技也與PrimsSense合作開發(fā)3D互動(dòng)體驗(yàn)介面(來源:PrimeSense)。面對(duì)將來有可能出現(xiàn)同質(zhì)性產(chǎn)品,微軟則是強(qiáng)調(diào)Kinect的追焦旋轉(zhuǎn)功能是他們的專利,這點(diǎn)別人不能模仿。
PrimeSence公司展示應(yīng)用Light Coding技術(shù)的體感偵測(cè)系統(tǒng)。該技術(shù)并未被微軟買斷,未來將有機(jī)會(huì)應(yīng)用在其他裝置上。
另一關(guān)鍵:骨架追蹤系統(tǒng)
了解Kinect如何獲得影像后,接下來就是進(jìn)行辨識(shí)的工作。透過Light Coding技術(shù)所獲得的只是基本的影像資料,重點(diǎn)還是要辨識(shí)影像,轉(zhuǎn)換為動(dòng)作指令。據(jù)說Prime Sense公司并沒有提供辨識(shí)技術(shù),所以辨識(shí)部份得靠微軟自己搞定。
微軟會(huì)將偵測(cè)到的3D深度圖像,轉(zhuǎn)換到骨架追蹤系統(tǒng)。該系統(tǒng)最多可同時(shí)偵測(cè)到6個(gè)人,包含同時(shí)辨識(shí)2個(gè)人的動(dòng)作;每個(gè)人共可記錄20組細(xì)節(jié),包含軀干、四肢以及手指等都是追蹤的范圍,達(dá)成全身體感操作。為了看懂使用者的動(dòng)作,微軟也用上機(jī)器學(xué)習(xí)技術(shù)(machine learning),建立出龐大的圖像資料庫,形成智慧辨識(shí)能力,盡可能理解使用者的肢體動(dòng)作所代表的涵義。
Kinect偵測(cè)的最佳距離為1.2公尺到3.5公尺間,水平視野則是57度,偵測(cè)范圍似乎比原本想像的還要小,看來還是不能站的太隨意;Kinec也配備了追焦系統(tǒng),如果玩家超出影像范圍,底座馬達(dá)可驅(qū)動(dòng)Kinect左右旋轉(zhuǎn)27度。整體看來Kinect對(duì)操作空間的限制,似乎比其他體感裝置更嚴(yán)格些。
Kinect一次可追蹤2人的動(dòng)態(tài),每人能追蹤高達(dá) 20組細(xì)節(jié)。