譯 話音的未來

2021-08-25 20:08:56 字數 2565 閱讀 7355

from:

電信話音通訊是否已經停止?亦或智慧型手機和lte為語音映用提供乙個更廣闊的空間。客席作家dean bubley將語音在我們有限的「telephony「創新後面可有若干不同領域的發展。

電信運營商面臨乙個巨大的問題:在發達的電信市場中,已經接近了話音峰點——或者已經過了這個峰點,過了這個峰點,意味著話音收入面臨可怕的下降。傳統的固話和移動電信產業面臨呼叫量停止增長以及**的降低。固話運營上可能很早就意識到他們核心電信業務的問題,而移動運營商現在同樣不可避免地面臨了。總體而言,大約70%的移動運營商的收入仍然**於語音業務和簡訊,因此這是乙個現實的危險,它將威脅到商務模式的深度變化,甚至可能讓某些我們今日熟悉的運營商成為歷史。

很多老運營商有10年的時間來防衛得益於大眾市場移動服務的興起。移動服務來得正當得時,正是固話**(尤其是長途**)因為早期voip的發展而**。總體而言,固網利潤的**可由新興的移動服務中得到了補償,由於移動內在價值,在手機聯絡人列表帶來的便利,推遲了飽和度和被替代的日子。

但是現在,最終,根據摩爾定律,裝置和網際網路發展,使得移動話音面臨著幾個不聯絡的徹底的變化。

「遠端話音」的限制

在過去100年,人類有三種方式進行遠距離通訊:信件、電報和**。傳統的**呼叫發生了奇妙了變革,雖然,某種程度上,也是非常有限,甚至只在移動的幌子。它已使得商業和社會自輪子和印刷書之後發生了最大的變化。但是**呼叫和人們日常的通訊仍是差異的,我們不會將對話當作「session「,也不會用時長來衡量對話的價值。

我們已經將我們的自然通話方式向受限的**模式屈服,長途語音歸納為a和b通過數字號碼標識相互通訊了x分鐘。相比之下,更接近真實話音的會有終端,後台人物,與其他人同步互動,以及使用我們的名字。在人們日常的談話中,會受到到非言語的溝通,物理環境和其他重要因素來增強。我們使用不同的音量,不同的語速和手勢。有些談話是同步的,有些是非同步的——根據某種認可或者裝置關係人們按順序輪著說話。有些方式只被特定的人或者文化接受,有些方式則是普遍下的。在乙個擁擠的房間,我們還可能挺多其他人的談話,無論是故意的還是無意的。

**呼叫是最為優秀的長途話音工具。運營商從中獲得大量利潤,特別是移動性加強。但是這樣作,他們在我們無數的使用範疇以及社會和上午需求中只提供給我們唯一的話音產品。此外很少一些長途話音技術的出現:push-to-talk,語音簡訊,對講機,cb無線電和個人無線系統,用於的士排程和公共安全服務的領域等。

如今,情況正在發生變化。移動平台、繁榮發展的開發者生態圈、智慧型手機、pc 和網際網路的結合,使得新的交流形式開始進化。這些形式更好的反應了人類交流的偏好。我們再也不需要將我們日常的交流方式限制在一條**線(或電波)和乙個開關。在大張旗鼓的打**之前,我們可以通過軟提醒或 im 進行「禮貌的打擾」,通過語音線索在虛擬世界裡找到同伴,或者在簡單任務上直接與語音信箱交流,而不是回**。

不因如此,對於提供基礎的**呼叫功能的增長大大超過需求。如果我們需要建立傳統的a-b在古話不x分鐘的呼叫,我們可以加入更多的現代因素,現在在流動網路上作的就像在固定網路一樣。當然,**號碼是乙個限制,最終的質量可能是有限的,但這個質量是在電信應用的角度上衡量而表示從社會通訊的角度。我們並不會真的在乙個嘈雜的酒吧中抱怨**的qos。

lte話音仍是老式**,還是帶來新的東西?

但問題是:適用於lte和all-ip流動網路仍然沒有為**進行優化。雖然有很多措施,特別是gsma的volte(voice over lte)標準,正在發展運營級別的lte技術,看起來仍需要幾年的時間才能做到在質量,可靠行,可擴充套件性,和價效比上超過現在的gsm。4g網路在公升級中並沒有真正考慮到話音,或者更嘲諷地說:它一直認為這是其他人需要解決的問題。

沒有人知道在乙個基站中有1000個移動voip使用者會是怎樣,他們移動,切換到另外的基站,引起干擾,聲音毛刺等等。固網voip經驗表明:將網路使用於大眾市場需要很長的時間,而且射頻和移動性會產生更多的問題。

這會導致lte網路或者擴充套件到3g網路上的智慧型手機將有乙個真空,可以有其他非電信的話音映用來填補。電信標準和市場代表機構(3gpp,gsma和其他)在遠端話音中的多樣性並不重視,而注重於現有的方式。備受宣揚的提高,例如高畫質編碼對於實現上面討論的人類複雜交換模式中只是前進了很小的一步。

傳統的**(固定和移動)是否可打包起來並通過新的渠道發布?與網路和相關的呼叫控制api關聯,很多運營商希望能夠建立新的通訊雲平台。但是目前無法確定底層的電信控制機制和基於會晤的呼叫方式,是否最優的基礎要求。增加編號、安全、**和特定的聲學機制這些因素,看起來並不太可能提供所有的新的遠距離話音應用。

填補話音創新的的gap

誰來填補空隙,作為過多的話音應用和服務所選擇的平台,目前還尚未確定。它可能是現有的大的voip(例如skype或者google),,軟體客戶端提供商(counterpath),以語音為中心的新興應用(viber,vivox 和 rebelvox),為運營商提供基礎設施的公司(cisco,sonus,acme packet 和broadsoft)等。

從手機的角度看有些複雜,普通的**呼叫並不會消失,但是我們將看到有更多的的話音應用在手機上出現,例如skype和gvoice,而且未來可能會更多。這對於ui和基於聯絡人的應用產生了挑戰,就如同討論那些語音和音訊元件在os上,在基帶或者應用處理器上,在單個應用或者在專用的音訊晶元上,是最好的。

我的產業生態鏈和雜談文章

譯 深度學習的未來

本文講的是 譯 深度學習的未來,譯文出自 掘金翻譯計畫 譯者 changkun ou 校對者 moutainone,sunshine940326 允許模型擺脫 每一步之間的 可微變換 differentiable transformation 限制的新學習模式使得實現上述模型成為可能 譯者注 神經網...

如何計算一路話音消耗的頻寬

如何計算一路話音消耗的頻寬 在voice這方面,是如何計算使用某種codec所消耗的頻寬呢?在預設情況下,把模擬話音轉換為數字話音後,按20ms一段20ms一段切開,用rtp封裝起來,然後包上udp header,ip header,最後是layer 2的包頭,然後發出去。假設咱們用g.729編碼,...

(譯)移動的鍵盤控制

mad sci 著 在這篇教程中我主要講用鍵盤事件觸發不同的移動型別,我們將從簡單的開始,然後再完成一些先進的編碼技術,我假設你熟悉了flash 2k4也受用哦 的指令碼語言,讓我們從簡單的開始.場景大小為 準備乙個mc放到時間軸 onclipevent enterframe 這樣你就可以用 上,下...