8月21日下午,杭州西湖邊,一只靈巧的機器狗正在北山街穿梭。它不時停下來打量西湖夏荷,甚至與路過的小朋友打招呼。過往的游客紛紛駐足拍照,好奇發(fā)問:“機器狗也能獨自賞西湖?”
事實上,這只機器狗并非獨自行動,它的“主人”——操控機器狗的人員,此時正在1300多公里外的山西文博會現(xiàn)場。
8月21日,山西廣播電視臺×黃河plus×當虹科技×云深處科技,聯(lián)合打造了傳媒業(yè)界首次跨越千里的機器狗視角實時直播。通過BlackEye Vision超遠距離遠程操控系統(tǒng),實現(xiàn)了遠隔千里的機器狗視角“云賞西湖”體驗,10W觀眾線上觀看,成為機器人在傳媒文旅方向應用的標桿案例。
01
千里之外實時操控
機器狗絲滑響應指令
山西文博會太原現(xiàn)場的大屏上,畫面隨機器狗腳步“移步換景”:近處荷花、遠處斷橋,還有好奇的小朋友上前打招呼。
“能看斷橋嗎?讓它轉(zhuǎn)個彎兒。”“能看機器人和小朋友握手嗎?”山西文博會現(xiàn)場,觀眾熱情地發(fā)問,一旁的操控人員拿著手機“隔空”操控千里之外的機器狗進行回應。
也有山西文博會現(xiàn)場的觀眾發(fā)出憂慮:隔著1300公里,機器狗會不會因為反應不及時,一不小心掉進西湖?
確實,要讓機器狗在千里之外依然“聽話”,并不簡單。其中,最難解決的就是“隔空”操控機器狗中的延遲問題——哪怕只有0.1秒(100ms)的滯后,都可能造成畫面卡頓、指令失效,甚至導致機器狗因反應不及而發(fā)生意外。
“我們把端到端的延遲降低到了80ms以內(nèi)?!碑敽缈萍脊ぷ魅藛T解釋說,這比人類神經(jīng)反應的極限延遲(約100ms)還要快20ms。正因為幾乎“零延遲”,我們才能在山西文博會現(xiàn)場,實時操控千里之外的機器狗,行走、轉(zhuǎn)身、互動,甚至與游客中的小朋友擊掌打招呼。
02
西湖畫面清晰呈現(xiàn)
離不開“視頻超級壓縮+畫質(zhì)增強”
西湖邊游客如織、水波蕩漾,動態(tài)場景非常復雜;山西文博會現(xiàn)場更是人山人海。不管是從太原到杭州的指令發(fā)送,還是杭州視頻畫面回傳至山西文博會現(xiàn)場,都有巨大的帶寬挑戰(zhàn)。如果網(wǎng)絡不夠好,再美的風景也會因為卡頓影響觀看體驗。
但在直播中,機器狗視角的畫面始終清晰、流暢,即使機器狗轉(zhuǎn)身、跳動拍攝的畫面,也達到了專業(yè)級播出要求。
這背后是系統(tǒng)基于當虹科技BlackEye多模態(tài)視聽大模型,根據(jù)實時的帶寬波動,大模型將高清視頻流進行10-100倍的超級壓縮,再通過AI畫質(zhì)增強算法,讓畫質(zhì)更加接近真實環(huán)境。
03
傳媒文旅應用豐富
機器人也能充當“攝像記者”
在此次直播中,千里之外的機器狗猶如一個特種機位,將機器狗的應用場景拓展到了傳媒文旅方向。
當虹科技工作人員介紹,由機器人充當“攝像記者”的科幻場景正在走進現(xiàn)實,機器人可以代替記者來到平時難以抵達的地方“采訪”,比如深入火災、地震等特殊新聞現(xiàn)場帶回實時直播畫面,大大拓展了機器人在傳媒領(lǐng)域的視界。
尤其是在火災、地震等特殊新聞現(xiàn)場,往往已經(jīng)斷網(wǎng)、斷路、斷電,我們所熟知的4G、5G和Wi-Fi網(wǎng)絡往往已無法提供實時通信。此時,BlackEye Vision會自動切換至衛(wèi)星通信實現(xiàn)遠程操控和現(xiàn)場報道畫面回傳。
同時,BlackEye Vision還具備強大的多模態(tài)處理能力——視頻、音頻、激光雷達點云、控制信令、文本信息都能同步傳輸。這意味著后端記者不僅能看到高清影像,還能通過三維空間數(shù)據(jù)感知地形起伏、障礙物距離,獲得接近真實的“臨場感”,從而更精準地遙控機器狗完成特殊新聞現(xiàn)場的報道任務。
從應急救援到工業(yè)巡檢,從巡邏檢查到媒體報道,機器人成為了人體的延伸。那些人類難以抵達,或需冒生命危險、付出巨大成本的任務,都有望通過BlackEye Vision超遠距離遠程操控系統(tǒng)來幫我們實現(xiàn)。