時空壺發布 W4：用「硬核」技術，打贏一場 AI 翻譯的「標準」之戰

2026-02-16 vr

文章圖片

文章圖片

科幻小說中的「巴別魚」一直是人類對跨語言溝通的終極想象，一個能塞入耳中、即時消弭語言鴻溝的生命體。而在現實世界，將這一夢想變為現實的漫長征途，早在 2017 年便由一家名為時空壺的公司開啟。
那一年，當整個行業還未將目光聚焦于此時，時空壺就發布了全球第一款翻譯耳機，率先向這個看似遙不可及的目標發起了沖擊。他們的核心理念從始至終都無比清晰：要讓機器翻譯普及，關鍵在于打破專業同傳的交互壁壘，讓技術服務于人類最自然、最無感的交流方式。
這種開創性的思路，不僅定義了時空壺此后多年的產品路徑，也讓這家公司在全球市場悄然占據了「隱形冠軍」的位置。自 2019 年第一代產品在海外發售至今，時空壺已在這條專用賽道上深耕了超過六年。從最初的拓荒者變成如今定義產品功能與形態的獨角獸。
在 2025 年 9 月，德國柏林的 IFA 展會期間，時空壺攜其最新旗艦 W4 AI 同傳翻譯耳機登場亮相，再次用一種極致的務實主義，回應了那個最初的夢想——「AI 翻譯，首先得讓對方聽清你說什么」。同時也借此直指行業最核心，也最容易被忽視的痛點：在真實世界的嘈雜與混亂中，如何保證輸入信號的純凈無暇。
01
硬件優先
時空壺的創始人兼 CEO 田力在介紹 W4 的過程中，并未將重點放在描繪遙遠的 AI 未來，而是選擇直面那個最基礎卻也最致命的行業難題：噪音干擾下的語音識別。面對展會現場鼎沸的人聲與背景音樂，大多數音頻設備束手無策，而 W4 卻能實現驚人的清晰度。
其秘密武器，并非復雜的軟件算法，而是一項看似「返璞歸真」的硬件創新——一套被命名為「骨聲紋傳感器捕捉技術」的多麥克風融合系統。
這套系統的核心，是一顆定制的骨傳導傳感器，它不依賴空氣作為介質，而是通過捕捉用戶說話時頭骨的振動來拾取聲音。這意味著，無論周圍環境多么嘈雜，無論是地鐵的轟鳴、餐廳的喧囂，還是展會的吵嚷，這些通過空氣傳播的噪聲都無法干擾到信號的采集。
與此同時， W4 的每只耳機還配備了兩顆傳統的氣導麥克風，用于收集聲音中的環境信息和部分細節。最終，通過時空壺自研的融合算法，將來自骨骼振動和空氣傳導的兩種信號進行整合，精準地提取出佩戴者最純粹的人聲，從物理源頭就「保護」了一個干凈的音頻信號。
這種理念與主流的軟件降噪有著本質區別。傳統的降噪技術是一種「減法」，它首先錄制一個混雜了人聲和噪音的音頻，再試圖通過算法將噪音「減去」，這個過程不可避免地會損傷人聲的細節，甚至產生失真。
而時空壺的方案則更像是一種「加法」或「保護」，它從一開始就獲得了一個幾乎不受污染的人聲音源，保證了后續翻譯環節的輸入質量。田力對此解釋道：「我們很多的東西其實是在硬件和一些算法上，而它不是一個大家意義上的這種 AI 的純粹的云端的翻譯。真正決定用戶那個交互體驗的東西，不光是翻譯引擎那一刻，而是前面的很多環節。」
這款 W4 耳機在外觀設計上也貫徹了這種務實的哲學。它看上去與普通的 TWS 耳機差別不大，沒有夸張的科技元素。其設計語言低調而優雅，充電盒手感溫潤，耳機本體則通過人體工學設計，確保了長時間佩戴的舒適性。將所有核心的智能模塊、電池都收納于小巧的機身之中，體現了對用戶日常使用體驗的深刻理解。
02
「隱形冠軍」的專注與耐心
推出這款產品的時空壺，早已不是一家初出茅廬的創業公司。但他們的成長路徑，在中國硬件公司中顯得頗為「非典型」。
早在眾多企業將「出?！棺鳛閼鹇钥谔栔?，時空壺就已經在海外市場默默耕耘。他們選擇先在美國市場發力，初期海外與國內的銷量占比一度達到懸殊的 9:1 。這種策略讓他們得以在最成熟、競爭最激烈的市場中打磨產品，并直接服務于那些對跨語言溝通有著最迫切需求的用戶——游客、商務人士以及跨國生活的家庭。
時空壺將自己的核心用戶定義為「專業型消費者 Prosumer」，田力認為這與大疆無人機的早期用戶畫像頗為相似。他們購買產品并非為了嘗鮮，而是為了解決一個專業且剛性的需求。如今，隨著全球用戶累計突破 100 萬，國內市場的認知度也逐漸打開，時空壺的銷售比例也調整至更為均衡的「七三開」。
這種穩健風格的背后，是田力對公司經營原則的堅持。他本人并非典型的硅谷式創業者，公司不依賴一輪又一輪的融資維持生命線，團隊規模也保持著克制，從 2023 年的幾十人穩步增長至如今的一百多人。
「我們早已實現凈利潤為正」田力在專訪中坦言，「我們不是那種等著救命錢來干活的公司」因此他們更愿意將資源和精力投入到產品本身的迭代與打磨中，保持著一種在當下創投環境中略顯「緩慢」的節奏。
03
Babel OS：打造全棧 AI 引擎
隨著用戶量突破百萬，在真實嘈雜環境中進行清晰、流暢跨語言對話的需求已清晰可見， W4 項目應運而生。除了在收音清晰度上的硬件突破，時空壺更是在系統和算法層面構筑了堅實的核心壁壘。這套自研的系統被命名為「巴別系統」（Babel OS），它集成了時空壺多年來在翻譯領域的經驗與技術沉淀。
Babel OS 的第一個支柱，是解決同傳中「速度」與「準確」矛盾的關鍵技術——「AI語義切分」。田力解釋道，同傳領域有一個經典難題：傳統的機器翻譯同樣需要等待一個完整的句子或語義單元，延遲因此產生。而時空壺的技術，能通過大模型實時分析語義，判斷一個意群是否完整，從而做出預判性的翻譯，先把主干意思傳遞出去，后續再快速修正。這正是用技術去無限逼近一個優秀同傳譯員的判斷力。
田力補充道，「行業標準里，真人同傳譯員的準確率也并非 100% ，大約是 80% 多，因為他們追求的是快和流暢。我們做的，就是用技術實現這種平衡。」
Babel OS 的第二個支柱，則是利用大語言模型（LLM）實現「語境感知翻譯」。這是解決翻譯準確性，尤其是處理多義詞和近音詞的關鍵。例如，在英語中，「to too two」或「there their they're」等詞語，如果脫離上下文，機器很難準確判斷。時空壺通過其自研的「TurboFast AI 翻譯引擎」和 LLM 的強大能力，讓系統能夠理解對話的整體語境，從而在這些細微之處做出精準的判斷，極大地提升了翻譯的自然度和準確性。
「我們最開始也用谷歌、微軟的引擎，但很快發現，要達到理想的用戶體驗，必須親自動手去改造模型，」田力說。如今，無論是谷歌還是三星，都選擇將翻譯作為其旗艦耳機的一項附加功能。而時空壺的全棧自研模式，則展現了截然不同的決心。田力指出，大廠的翻譯引擎在很多小語種上表現不佳，例如阿拉伯語、越南語等，存在大量未被解決的「角落案例」。
對此，時空壺的結論是：只有自研才能實現端云一體的深度優化，例如通過前端對聲音進行特殊編解碼，再喂給云端專門訓練過的模型，從而極大提升速度和魯棒性。這種覆蓋硬件、固件、系統到 AI 模型的全棧能力，讓時空壺更像一家專注的通信設備公司，而非純粹的 AI 軟件公司。
04
定義同傳翻譯標準
在時空壺內部，他們用一個 L1 到 L5 的框架來定義「好的跨語言交流」，本次隨著 W4 發布，這一類似自動駕駛行業標準的「同傳翻譯行業標準」也一并向外界揭曉。
L1 ，是電子詞典級別的「詞對詞」翻譯。
【時空壺發布 W4：用「硬核」技術，打贏一場 AI 翻譯的「標準」之戰】L2 ，是谷歌翻譯 App 式的「句對句」翻譯，交互是斷續的。
田力認為，市面上大部分產品，包括巨頭們推出的功能，其交互方式——例如兩人輪流對著手機講話——決定了體驗只做到了 L2.5 ，這并非人類自然的交流方式。
而時空壺努力做到的，是 L3——自由對話。為了實現這一目標， W4 提供了多種精心設計的翻譯模式。核心的「雙語對話」模式，允許兩個人各佩戴一只耳機，進行近乎實時的、面對面的自然交流，翻譯結果會直接在各自的耳機中播放。此外，還有適用于聽講座的「聽譯模式」，以及為問路等快速場景設計的「問答模式」。這些模式覆蓋了用戶在旅途和商務中最常見的使用場景，真正讓「邊走邊聊」的跨語言溝通成為可能。
但 L3 也并非他們設想中、AI 同傳耳機的終點。「我們的目標是 L4 ，達到高級同傳譯員的水平，」田力這樣介紹時空壺對同傳翻譯耳機場景的規劃。
在采訪中，田力還與作者分享了一個現實中土耳其高級譯員的故事：在一次同傳中，官員即興講了個本土笑話，譯員知道直譯國外聽眾無法理解，便在電光火石間對著麥克風說：「現在，領導講了一個笑話，請大家笑一下。」全場爆笑，效果絕佳。「你看，這已經超越了語言本身，是對意圖、情緒和氛圍的理解。這是 AI 目前最難做到的，需要多模態的感知，也是我們努力的方向。」
05
做同傳耳機賽道里的「大疆」
正是基于這種對專業體驗的極致追求，時空壺選擇了耳機這一產品形態，并為其設定了 349 美元的專業級定價。面對外界關于「憑什么賣這么貴」的質疑，田力顯得很自信，在對話中，田力將時空壺的產品邏輯比作大疆的無人機，而非智能音箱。
「你買大疆的無人機，不是因為它也能當風扇，而是因為它在航拍這個專業領域做到了極致。我們的用戶選擇 W4 ，是因為它在跨語言溝通這個特定場景下，提供了遠超通用設備的卓越體驗。」
這或許也是時空壺為何并未急于像其他 AI 硬件一樣，采用訂閱制收費的原因。田力認為，在行業整體成熟度僅在「及格線」徘徊時，首要任務是把基礎體驗從 70 分做到 100 分，而不是過早推出一個 100 分產品才需要的高級商業模式。
在談及與科技巨頭的競爭時，田力認為小公司永遠有機會。「谷歌做硬件，恕我直言，一直有種『玩票性質』，」他回憶，「我 2019 年在灣區見過他們項目的人，他們覺得這個功能很酷，就做出來了，但用戶用得好不好，不是最在意的。所以谷歌硬件總是『起個大早，趕個晚集』。」對巨頭來說，翻譯只是其龐大生態中的一項附加功能；而對于時空壺，「這是我們的『命根子』。小公司跟大公司比，本質上比的還是認真和專注。」
為了更加直觀地展示機器翻譯的真實水平，時空壺此前曾使用自家產品，參與過一場「人機大戰」，讓其產品與真人同傳譯員同臺競技。這不僅是一次營銷，更是向頂級譯員學習的方式。「通過這種極限對比，我們能更清楚地看到自己的差距和努力的方向，」田力說。
關于 AI 硬件乃至時空壺本身的未來，田力聊到驅動著他和團隊前行的樸素愿景。他相信，人類作為社會性動物，天生渴望交流與連接，而語言的壁壘所帶來的，是真實存在的不安與孤立。
而在他看來，時空壺的使命，是要打造一把鑰匙，去開啟那扇因語言而緊鎖的溝通之門，賦予人們跨越鴻溝的勇氣——那種可以跟任何人交流，去連接的從容。這才是他們最大的成就感來源。
「人類是社會性動物，天生渴望交流和連接，」在采訪的最后，田力回歸到了創業的初心，「當你去到一個陌生的國家，語言不通時，那種不安全感是真實存在的。我們希望通過產品，賦予人們勇氣，讓他們可以很爽地去跟任何人交流，去連接，去成為朋友」
因此從某種程度上， W4 不僅僅是一款追逐 AI 浪潮的硬件。更是時空壺對這種愿景的載體，是這家公司用近十年的專注與積累，為消除人類的隔閡所獻上的最新答案。
「消除語言障礙，可能不是一百年內能完成的事，」田力坦言，「但我們正走在這條路上。」

推薦閱讀

上一篇：看衰蘋果 AI？發布會 AI 缺席，是保守還是蓄勢待發？

下一篇：AI重塑未來銀行，來自外灘大會的業界聲音