說話比打字快 3 倍,用 AI 的方式正在被重寫

語音互動正重塑 AI 生產力入口

語音輸入效率超越鍵盤

隨著大型語言模型(LLM)對口語混亂特性的處理能力提升,語音互動正以第三波之勢衝擊主流工作模式。人類說話速度約為打字的三倍,且語音輸入在錯誤率上優於鍵盤輸入(中文語音輸入糾錯率約 6.67%,低於鍵盤輸入的 17.73%)。2024 年 3 月,AI 語音交互技術突破 200 毫秒延遲閾值,使語音輸入效率正式超越鍵盤輸入。

工程師與創業者開始「用嘴寫程式」

在硅谷 YC 的共享空間及辦公室中,創業者與工程師已開始用語音向 AI 口述產品需求、佈置任務清單或要求將會議重點進行提煉。這種模式讓使用者能像普通人一樣隨意表達,途中改變主意,AI 則能將這種混亂轉化為可用的文本或指令。Typeless 等產品正在驗證讓語音回歸為一種輸入方式的邏輯,而非僅做「語音消息 2.0」。

語音成為知識工作的新常態

語音的「輸入快」優勢被保留,而「輸出亂」的劣勢被 AI 吸收。在電子郵件、聊天、會議與文檔撰寫等場景中,即時語音轉錄可加速筆記速度,有時比手動打字節省 2-3 倍時間。專業人士常用語音轉文字快速起草回覆,並由集成的 AI 自動潤色語調與修正語法。若使用者能善用語音與 AI 互動,可能會比用鍵盤打字的人更早下班。

返回頂端