展會信息港展會大全

5G和云原生時代,技術的下半場從哪里開始?
來源:互聯網   發布日期:2020-12-13   瀏覽:11029次  

導讀:作者 | 畢玄 整理 | 羅燕珊 隨著 5G/ 芯片 / 區塊鏈等等新技術的不斷成熟、云計算的普及和云原生時代帶來的諸多便捷,開發者和架構師們眼前的挑戰也不再只是 0-1 的建設問題,技術如何更多地帶來業務價值成為了一個值得討論的話題。由極客邦科技舉辦的 QCon...

作者 | 畢玄

整理 | 羅燕珊

隨著 5G/ 芯片 / 區塊鏈等等新技術的不斷成熟、云計算的普及和云原生時代帶來的諸多便捷,開發者和架構師們眼前的挑戰也不再只是 0-1 的建設問題,技術如何更多地帶來業務價值成為了一個值得討論的話題。由極客邦科技舉辦的 QCon 全球軟件開發大會 2020(深圳站)上,阿里巴巴集團研究員,阿里云智能視頻云業務負責人林昊(花名畢玄)發表了主題演講《5G 和云原生時代的技術下半撤,以 5G 典型場景音視頻為例,探討相關技術和技術人的下半場,以下內容為演講整理。

很多人可能聽過,比如阿里巴巴集團董事局主席逍遙子在很多場合都會講到,現在世界最大的確定性的變化是數字化,意思是未來大的變化多數是“數字化的加速進行”。而在數字化的趨勢中,我們看到“視頻化”有著更大的確定性。

1

5G+ 云原生,給業務帶來什么變化

5G 跟業務系統關聯性最大的兩部分是延時更低、帶寬更寬。

現在的主流網絡比如 4G,延時大概在 10ms~100ms,它的延時范圍還是比較大。而 5G 通常來講延時會降到 1~10ms,它的目標是 10ms。那么,當延時變得越來越低、帶寬變得更寬的時候,業務上我們會看到什么樣的變化?

上圖主要顯示的是當帶寬變得更大、延時變得更低的時候,會有哪些典型的案例。比如現在特別火的話題云游戲。游戲對延時要求是特別高的,像賽車類、競技類等,4G 網絡本身已經不可能讓延時再低,但在 5G 場景如果延時壓到 50ms 以下,很多業務就有可能變成現實。

所以從 5G 的業務層面,我們關注的是,什么業務需要更大的帶寬,什么業務需要更低的延時。

說到云原生,它確實是現在特別火的一個話題。在去年的雙 11,我們說最大的變化是所有的核心系統都上云,而今年雙 11 我們對外講的是所有核心系統開始云原生化。

但我們也說,每個人心目的云原生可能都不一樣,誰都不知道什么叫云原生。

對阿里來講,我們為什么非常激進地推進云原生?我以前是負責阿里整個核心系統上云的架構師,我覺得整個業務的演進過程,最重要的是所有的業務開始從基于一個封閉自主的技術體系走向一個開放的技術體系,這便是云原生帶來最重要的變化。

云原生以后,整個社會建造業務系統的自有體系會越來越開放、越來越公共化。這對很多業務創新來講,是有很大幫助的。因為以前很多東西得自己做,但現在很多東西可能可以基于一個相對比較成熟的技術去做。就像阿里看到有一些業務在云原生化以后,對我們整個業務創新的速度、業務迭代的速度產生非常大的幫助。

2

最典型場景:視頻

像前面說到,5G 帶來低延時和大帶寬,云原生帶來的是走向一個開放公共的自由體系。那 5G+ 云原生以后,最典型的場景到底是什么?什么樣的場景對 5G 和云原生有特別大的訴求?

從目前來看,我們非常確定的是視頻。因為疫情原因,今年視頻好像突然就成為了整個行業特別火的業務創新以及技術創新領域。但其實視頻技術已經發展很多年了,只是今年看起來再度爆發。

我想很多人有這樣一些感受:以前多數業務系統里面其實是沒有視頻的,但現在大多數業務系統,都開始或多或少地引入視頻。短視頻、直播以及音視頻通信是當前最火的幾個場景。

我們認為從場景層面來講,視頻是非常典型的 5G+ 云原生的場景,原因是:所有做視頻業務的,不管是直播業務、短視頻業務、還是音視頻通話業務,關注的第一要點就是體驗。

做視頻最重要的是體驗,比如看直播是不是足夠流暢、畫面的清晰度怎么樣,短視頻亦然,音視頻通話就更加是了比如大家開視頻會議最關注的是能不能聽清楚對方在說什么,另外是畫面夠不夠流暢。

所以一旦做這個業務以后,第一要關心的話題是體驗,而視頻業務的體驗要做得好,面臨的第一個問題就是視頻能不能很好地分發到離各個用戶比較近的一個點。

說實話,多數中小型創業公司甚至很大規模的公司都很難解決這個問題。通常來講,為了把整個體驗做得非常好,多數業務上來就需要依賴背后一張巨大的網絡,而這個網絡通常只有云廠商公司會提供,因為其他公司要構建這張網絡是需要非常大的投入。

所以,從體驗上來講,視頻是非常典型的、會更多地考慮到應該去使用云原生的服務,而不是自己從頭構建。

除了體驗,視頻業務開始做之后面臨的第二個比較大的問題是成本。視頻跟很多業務不一樣,這些業務規模如果沒有上來,付出的代價也許不是太大,可能只是做幾臺計算資源的機器、一點存儲、一點數據庫。當然,如果是做大數據AI,相對投入就更大一些。

但是,一做視頻就會在帶寬上面臨非常大的挑戰,因為帶寬“上來就是錢”。除了帶寬以外,視頻稍微做大一點,還會面臨存儲成本,因為要存下來,而視頻的文件顯然比以前所有的東西都大。

有了存儲以后,視頻還會面臨計算消耗的問題,因為可能要對視頻做一些處理,比如做一些編解碼或其他東西,導致計算資源整體會有比較大的消耗。所以整體來看,視頻除了解決體驗問題以外,還會面臨巨大的成本消耗的問題。而為了解決成本問題,可能會產生各種問題。所以我們可以看到,對于很多團隊來講,基于視頻的云原生服務是一個相對來講比較好的選擇。

講下我自己的另外一個感受,我覺得視頻業務是需要在基礎技術領域投入非常大的技術領域。比如要讓視頻在分發的過程中、播放的過程中將帶寬控制得更好,我們可能要去解決的問題是怎么讓多數用戶看到的視頻畫面質量不怎么改變的情況下,怎么把帶寬成本降下去,控制碼率。對很多公司來講這是非常重要的,因為在大多數公司的業務中,少數視頻占了最多的帶寬費用,但又不能把少量視頻的質量降下去。因為質量如果降下去,會影響用戶體驗。

為了解決這個問題,我們可能需要投入大量的人員去做編解碼優化。當然開源也是有的,開源的質量也不差,但如果想在開源基礎上做得更好,這個投入就非常大了。

另外大家可能也聽過,在看一段視頻的時候,視頻內容其實是直接決定了哪些地方是需要非常清晰、哪些地方相對來講是不那么重要的,這可能就要結合 AI 做視頻內容的理解,然后做動態的編碼優化,基于你感興趣的點去做優化,背后可能涉及各種各樣的團隊,編解碼的團隊、AI 的團隊、算法的團隊,所以為了一點點的提升,背后可能有非常大的投入。

3

讓延時再低些

延時變得更低到底能來什么好處,簡單給大家舉幾個例子。

第一個是在線教育。最早的時候在線教育是錄播的,老師提前錄完視頻然后再放出來,其他人再點開看。但對很多客戶來講,比如對家長來說這是不太能接受的,因為跟老師不能有很好的互動。后來在線教育就更希望能讓老師跟學生之間有更強的實時互動,而不是錄播的毫無互動。

為了做到互動,最關鍵的是延時。傳統直播技術通常大概延時在 5 秒左右。當然,像電視直播等延時會相對長一點,但那是因為其他的要求,技術層面大概都在 5 秒范圍,這是受協議約束的結果。而在線教育是希望把延時降到幾百毫秒,這樣音視頻互動才能更好地進行。

第二個是電商,這方面阿里有非常強的感受。阿里最早做開始手淘直播的時候,也是采用比較傳統的技術,場景上面臨的最大問題是:主播上來告訴大家,“我要開始賣一個東西了”,然后他要上鏈接,還要做消息互動。但這時候有可能會出現的是:主播說話與用戶觀眾發消息的兩個過程是有延時的,但消息的延時跟視頻的延時又可能不一樣,消息可能在 1 秒,視頻可能在 5、6 秒。

這時候就會出現消息跟視頻不在同一個畫面的問題主播可能都已經切到下一場,而買家還在跟他交流上一場的問題。

所以在手淘場景里,我們不斷跟手淘團隊一起盡可能把延時往下推進。比如在今年雙 11 里,手淘大量采用了低延時直播,大概把直播的延時降到 1 秒左右,控制在 1 秒范圍內之后,我們可以看到它對整個 GMV 的轉化有很大的幫助,因為主播跟觀眾之間有了更強的互動關系。

在所有直播體系里我們都看到了對于延時的訴求,現在直播都希望走向強互動直播,而不希望是原來那種比較單向的行為,因為觀眾也希望有更強的互動。

最后一個是大家疫情期間感受最為強烈的場景,視頻會議,F在視頻會議的延時在技術上能夠做到幾百毫秒,所以現在大家普遍能開視頻會議。雖然以前是電話會議多一些,但現在很顯然視頻會議的比率在上升。畢竟任何人的交流都更加希望能看到人,而不純粹只是電話傳遞的聲音。

舉另外一個例子,很多公司的面試到決定性或者很關鍵的一輪時,都會把候選人邀請到本地,然后面對面地完成這輪面試。這是因為覺得在僅通過電話面試、看不到人的情況下,很多東西是難以判斷的,需要見到本人。但是有了視頻會議以后,一些面試就可以無需把人邀請到現場進行。

所以延時技術在視頻領域的作用是非常明顯的,從幾秒到幾百毫秒催進了非常多視頻場景的創新。

但對視頻來講,這依然不夠。比如視頻會議,之前一個學術機構的研究報告顯示,其實像視頻會議這樣存在幾百毫秒延時的場景,對比人跟人的當面交流,還是存在很大區別。

大家開視頻會議應該都有這樣的感受:在視頻會議的場景下,仍然會出現搶話情況,你說了一句話,可能還沒有說完對面就已經搶話,這是一定會出現的,因為人跟人當面交流的延時并沒有幾百毫秒。

在視頻場景里,我們是有非常強的動力去思考怎么把延時往下推得更低,讓大家有更真實的體驗,包括現在很多公司做很多東西都是為了讓大家在遠程會議上,可以有跟當面交流比較接近的體驗。對我們來講,延時如果能夠越來越低,是一個非常好的事情,可以在這基礎上做更多業務層面的創新。

4

音視頻傳輸延遲引入分析

音視頻整體技術可能跟系統層面技術有一些差別,我們來看一下延時。比如直播,音視頻中比較典型的場景,你拿一個手機開始拍,這是采集的過程,把一個視頻影像留下來,去采集,然后編碼,多數可能是在端上去做。這個延時,現在大概在 60ms 左右的范圍。

采集完之后會把這個流(比如直播、攝像流)直接推到遠端,多數是云端或者自己服務器端。在云端之后,通常還會做一些處理,比如直播通常要做內容審核,內容需要過一遍審核處理,有些稍微復雜點的直播可能還要做其他事情,比如加 logo,做一些鏡頭的剪輯和鏡頭的切換。

如果有多個攝像頭機位,還會涉及到直播的時候選用哪個機位的問題。另外是分發,怎么把服務器端推到很多的點。然后是把客戶端流拉到本地,拉完以后開始解碼和播放。

從整個時間耗時看,以前是 3-5 秒的延遲,主體時間多數耗在拉流那一端,這是協議決定的。RTMP 是比較標準的協議,F在業界比較流行的低延遲直播,是把直播延遲從 3 秒推到 1 秒,推到 1 秒以后,我們給它的名詞都叫低延遲直播,相比以前更低延時一點。

大家看上圖中的整體優化,更多是把協議層開始做替換,現在多數公司的低延時直播都會基于 RTC 協議,就是 Google 開源的 webRTC 協議去做?梢钥吹,當基于 RTC 推流、RTP 分發,前面協議層都在替換,差不多可以把拉流這端開始壓到 1 秒以內,F在阿里手淘的直播,整體延時在 1~1.2 秒范圍,1~1.2 秒在消息類互動場景已經足夠了。主播跟觀眾如果是用消息互動,發一條消息或者打賞什么的,大家都不會有太長的延時感覺?梢钥吹,這種場景下,我們可以通過協議替換把整個延時往下拉低。

但也可以看到,其實還有很多延時是整個網絡造成的。如果是網絡造成的,現在其實是沒有太多很好的解決方案,就非常地難。而標準的 RTC 可以做到 200-300ms 的時間,就是這樣一個狀況。

這三種延時,除了技術層面的差別以外,另外的層面是當采用這些技術以后,整體的成本是有很大變化的。當你延時要做得越來越低的時候,其實成本是會上升非常多的。像 RTC 相比傳統直播延時,有可能成本大概是在 7 倍以上。像低延時直播,現在各家公司在不斷努力盡可能讓這兩者成本開始接近。

為了很好地控制延時,推流最重要的是協議的替換。因為協議替換以后,從 TCP 到 UDP 以后,很多東西需要自己來做了。

各視頻廠商關注的最重要的指標是抗丟包,多數公司追求當丟包在 50%、60%、70% 的時候,在不同場景去滿足訴求。比如視頻會議如果只是為了開會,最大的訴求其實是在音頻端音頻清晰度和流暢度,而畫面如果有一點卡頓,我們勉強還能接受。當然,如果那個視頻會議是講 PPT,那就不能接受了,那優先級可能變成視頻的清晰度。所以,不同場景需要有各種各樣不同的策略。

比如大家如果去看直播場景和視頻會議類型的場景,它面臨最大的不同是什么呢?直播場景的話,比如我是主播,其實只要攝像頭跟我、以及我跟服務器的鏈路整體沒有太大問題,基本上觀眾之間互相是沒什么影響,這個觀眾看的時候會卡,另外一個觀眾有可能是不卡的,因為觀眾之間沒有什么影響。但如果是視頻會議類型的場景就完全不一樣了,比如現在有十個人在開會,這十個人里任何一個人,出現卡了或者視頻、音頻不大正常,就會影響整場會的效率。

在這樣的場景里,為了要保證延時,同時又要保證流暢度的時候,抗丟包層面需要做非常多的事情,包括綜合的策略。

我們去看很多音視頻公司,它們很大的競爭力在于對端的適配能力。因為每個端的狀況不大一樣,比如有人用蘋果,有人用安卓,尤其是安卓,安卓手機有無數種,每種手機的音頻能力、視頻能力有很大差別,還有大家所處的網絡環境,比如現在連了 Wi-Fi,走動的時候可能 Wi-Fi 點會切換,還有可能從 Wi-Fi 切到 4G,這里面網絡點怎么去處理也是非常關鍵的。

所以當整體延時越來越往下探的時候,它的技術門檻在不斷地升高,我們怎么樣做好卡頓的控制,是各家公司去做這類型業務上面臨的最大的一個問題。

這里主要講的關鍵技術,一是推流,二是分發,三是整個拉流層面為了控制延時做的一些事情。推流主要是協議層面和抗丟包,分發層面主要是背后整張網絡的分發。

很多公司做視頻業務,通常有幾種方法,一是直接基于云廠商的 CDN 構建整張音視頻網絡,還有一種是基于邊緣計算節點構建一張自己的音視頻網絡,但這都是有一個問題要解決的。不管用什么方案,都有這樣一個問題解決:這么多的節點要怎么更好地調度?這涉及到非常復雜的調度問題,因為每個節點的帶寬能力、計算資源能力可能不一樣,怎么根據用戶的情況去做整張網絡的調度。

5

超高清是未來,但還有很多技術側問題要解決

帶寬層面,從目前來看,大家都在想 5G 帶寬變大了以后,到底找誰把帶寬用起來,總得有人把帶寬用起來。就像 4G,其實是視頻用起來的,短視頻把 4G 視頻帶寬撐起來,F在互聯網一大部分流量,主體都是視頻構成的。5G 時代也是一樣,我們為什么需要更大的帶寬消耗,肯定要從業務側看到很大的變化。

圖中可能是大家經?吹降囊恍┣逦,我們現在多數場景里能看到的 720p 視頻、1080 4K 和 8K。8K 其實很少看到,因為 8K 對屏幕要求非常高,基本要很大的屏才能展現 8K 的效果。

阿里曾經在幾年前冬奧會的時候做過一個 demo,叫 5G+8K 看冬奧會的滑雪現場,它的運動感非常強,所以是非常明顯的。而現在特別火爆的 VR/AR 是需要更高的清晰度,現在很多 VR 還是 4K,所以導致我們會覺得顆粒感很強,但當 VR 結合 8K 的時候,就會覺得顆粒感的問題好了很多,畫面比較接近真實。

只有更大的帶寬,我們才可能把清晰度更往前推進。關于清晰度,以前有人說,你去問很多人,他都會覺得現在的東西已經夠清晰了,不需要更清晰。但當你給了他一個更清晰的東西的時候,他會發現他需要更清晰的。最典型的是,蘋果推視網膜屏,當視網膜屏推出以后,大家就有了更好的體驗。

現在短視頻廠商也在不斷推進 4K。很多人以前都覺得短視頻沒必要那么清楚,因為手機屏幕太小了,還不至于能看出 4K 的差別。

但從業界發展看,我們覺得這個趨勢還是比較明顯的,整體朝更清晰化發展,它肯定是有訴求的。而為什么現在進展比較慢?有很多原因,第一個是當清晰度要往前推進的時候,不光是后面播放側的問題,還有很大的問題是制作側。當然,現在很多攝像機可能是 4K,但是拍了以后怎么把 4K 視頻做剪輯、處理,其實是非常復雜的,更不要說帶寬消耗。帶寬除了能不能放出來以外,還有一個問題是每放一次背后全部是帶寬消耗,這個帶寬消耗全是成本。

我們覺得超清是一個很好的發展方向,但怎么解決在超清的發展過程中面臨的很多問題,是技術側都需要關注的。

超高清技術里面涉及到很多東西,簡單講就是從視頻輸入開始,就是拍一段視頻,然后到一段視頻最后被用戶看到的時候,到底我們要做些什么。

大家可能聽到過一些詞,比如上圖里的“超分”。簡單來說,就是手機拍出一段 2K 視頻,怎么把它超分成 4K 的視頻,讓你看到一個類似 4K 的效果,這樣做是為了制作端的成本問題,因為很多制作端都不具備制作超高清的能力。

另外,大家可能聽過窄帶高清等技術,其實是為了解決給你一段高清視頻,但怎么來控制整個帶寬成本的問題。如果做高清業務,成本是非常重要的。長視頻就非常典型,多數長視頻會提供非常多種清晰度的選擇,多數公司會提供越來越清晰化和越來越好的體驗,就像優酷自己,我們會提供幀享的東西去讓大家能看到更好的不同的體驗。

還有很多場景的問題,比如拍不同場景,航拍和運動類的視頻對清晰度的要求是比較高的,尤其是運動類的視頻就非常明顯。阿里優酷做世界杯播放的時候,能明顯地感受到,如果清晰度不夠,很多時候可能連球在哪兒都不一定能看到,遠景的時候是比較難的。在那段時間,大家在不斷研究怎么能讓這個畫面變得更加清晰。

所以我覺得,對于很多公司來講超高清技術是需要往前演進,需要解決從制作到分發、處理到播放整個鏈條的問題。帶寬是基礎,只有帶寬越來越大的時候,這個東西才有可能變成現實。

因為我現在跟視頻接觸得比較多,從這 5G 和云原生這兩個命題講,我目前看到視頻是結合最緊密的技術。

5G 帶來的更多是低延時和大帶寬。我們需要思考的是,當延時越來越低的時候,有可能帶來什么新的業務創新,創新模式到底有什么改變。延時越來越低,在視頻場景我們看到會帶來越來越多業務上的變化,很多業務跟以前完全不一樣了。

因為視頻的成熟,在疫情期間很多事情開始轉向,以前必須線下的可以轉向線上業務。當整個社會技術在進步的時候,所有業務系統側都要去思考,視頻只是相對來講可能更明顯一點。另外是帶寬,有什么業務對帶寬的消耗越來越大。

舉另外一個例子,計算資源的消耗。最早多數計算資源是用來做在線業務系統,比如交易系統等等,消耗了大量的機器。但是后來我們看到很典型的變化是大數據,大數據變成了更主力的計算資源的消耗,再后來是 AI。

其實場景都在不斷變化,在所有業務場景里應該去思考延時越來越低會帶來什么,然后帶寬的變化會帶來什么,最后是基于云更快速做業務創新的機會到底在哪里,因為云原生更重要的是,我怎么更好地、更快速地完成整個業務的迭代和創新以及嘗試,可能對所有做系統結構、做系統架構技術的人來說,這是需要慢慢結合自己的業務去思考的一個話題。

會議推薦

關于更多 5G 和云原生技術的業務場景落地案例,QCon 上海(2020 年 12 月 20-21)、QCon 北京(2021 年 1 月 8-9 日)也將給大家帶來更多分享。除此之外還有業務架構演進、研發效能提升、微服務、智能金融、高可用、人工智能前沿技術等熱門話題案例硬核輸出,精彩不容錯過!

贊助本站

人工智能實驗室
AiLab云推薦

展會專題 ZhanHui

展開
Copyright © 2010-2020 AiLab Team. 人工智能實驗室 版權所有    關于我們 | 聯系我們 | 廣告服務 | 公司動態 | 免責聲明 | 隱私條款 | 工作機會 | 展會港
青海快三直播今天 陕西11选五高遗漏 2019最新蝌蚪网 北京快乐八开奖结果 微信麻将软件 青海快3规律破解教程 星空棋牌官网 五小龙对上黑杰克谁赢 快乐10分中奖规则 成都麻将的计算方法 爵士vs掘金预测 浙江十一选五手机版 2019网上真钱捕鱼游戏 2.15快船vs湖人 安徽快3开奖结果前天 大富豪安卓版下载 河南十一选五前2复式