AI 語音輸入法,正在偷偷擠走「鍵盤」

文章指出,鍵盤短期內不會消失,但在更多情境中,鍵盤的角色正從「主要輸入工具」逐步退為語音輸入後的「編輯與微調工具」;隨著各類 AI App 的語音轉文字體驗提升,語音也開始成為接在 AI 互動前的一層關鍵介面。

作者分享自身嘗試多款語音輸入工具的經驗:部分工具雖具知名度,但存在轉錄等待時間、中文辨識準確率不足、專有名詞與中英混排錯誤率偏高等問題;也有主打本地小模型的工具在速度上表現突出、成本低,但在較複雜語境下仍易出錯。最後作者選擇長期使用 Typeless,主因是其輸出文字品質較高,能降低「出錯—返工」對工作流程的干擾。

在具體能力上,文章歸納 Typeless 的特點不只在於把語音「轉成文字」,而是更強調「理解意圖」:可把口述內容自動整理成帶格式的清單、依指令將選取文字改寫成更正式的郵件語氣、快速翻譯選取段落,並能依使用情境(如聊天 App 與工作 App)自動調整語氣與標點風格。作者也將此歸因於技術路線的轉變:從傳統 ASR(自動語音辨識)為主的逐字轉寫,走向結合大語言模型的「辨識+理解」一體化流程,讓系統更能適應使用者的表達方式。

文章同時提出三點主要疑慮,認為挑戰多半來自外部環境而非單一產品體驗:

  • 系統級廠商入場:若作業系統直接提供同等或更強的語音輸入,且能做到系統層「無處不在」的整合,第三方工具的必要性可能下降。
  • 免費本地模型的擠壓:在「本地端也能做語音辨識、且近乎零成本」的趨勢下,使用者可能逐漸形成「語音轉文字就該免費」的預期;面對月費方案,產品需持續證明額外價值。
  • iOS 使用限制與隱私/功耗:受系統限制影響,行動端可能需要在 App 間跳轉;若以背景常駐麥克風改善體驗,也可能帶來隱私與耗電等現實問題。

在「鍵盤會被取代到什麼程度」的討論中,文章回顧 QWERTY 鍵盤源自打字機時代的機械限制,使用者長期透過訓練適應其設計;相較之下,語音更貼近人類自然輸出方式。作者認為,Typeless 類產品正在嘗試成為跨 App 的輸入層,甚至在 iOS 端以「語音優先」作為預設,為未來若作業系統接受語音優先互動提供想像空間。儘管是否普及仍受使用習慣、監管與隱私等因素影響,作者強調其已在「輸入效率」上展現可量化的改善。

來源:https://36kr.com/p/3606264618402825

返回頂端