請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

科技

Apple Intelligence 語音轉文字速度比 OpenAI Whisper 快上兩倍

流動日報

更新於 4小時前 • 發布於 4小時前 • NewMobileLife

最近向開發者推出的 Apple Intelligence 語音轉文字工具,不僅速度快、準確性高,而且通常比 OpenAI 長期以來的對應工具快上兩倍。這可能再次證明 Apple 雖然進入市場較晚,但卻能做到最好。自 OpenAI 於 2022 年 9 月發布其 Whisper 語音轉文字技術以來,它已成為數十款應用程式的標準模型,但現在這種情況可能不會持續下去。在今年的 WWDC 上,Apple 宣布將其 Apple Intelligence 工具開放給第三方開發者。儘管 Apple 幾乎沒有提供任何細節,也當然沒有特別宣傳其語音轉文字工具,但開發者們現在正逐漸發掘它所帶來的各種功能。

開發者的發現與 Yap 工具

開發者 John Voorhees 和他的兒子據報導花了約十分鐘,構建了一個快速工具,以便在 Mac 上使用 Apple 的語音轉文字技術。具體來說,他們使用了 Apple Speech framework 中的 SpeechAnalyzer 和 SpeechTranscriber 元件,這些元件是作為 Apple macOS Tahoe 和 iOS 26 beta 版的一部分向開發者發布的。這個快速工具是一個命令列工具,他們稱之為 Yap,目前已開放從 Github 下載。它需要一個 Apple 開發者帳號和 macOS Tahoe 才能運行。

效能比較與測試結果

AI 語音轉文字工具主要依賴所使用的大型語言模型(LLM),因此比較並非總是那麼簡單。然而,將 Apple Intelligence 與 MacWhisper 的 Large V3 Turbo 模型進行比較,卻展現了顯著的差異。Apple 的 Speech framework 工具始終比這個基於 Whisper 的應用程式快上兩倍多。一項針對 7GB 的 4K 影片檔案測試顯示,Apple Intelligence 在 45 秒內將其讀取並轉錄為字幕。相比之下,使用 Large V3 Turbo 大型語言模型的 MacWhisper 總共花費了 1 分 41 秒,而 MacWhisper 的 Large C2 模型則需要 3 分 55 秒才能完成相同的工作。儘管這些轉錄內容都不是百分之百完美,都需要後續編輯,但 Apple Intelligence 版本的準確性與基於 Whisper 的工具相當,且速度快上兩倍。

技術的廣泛應用

除了向開發者發布這些 Apple Intelligence 工具外,Apple 也發布了詳細的影片,說明如何實作這項技術。當然,該公司也已將相同的技術應用於其 macOS 26、iOS 26 等 beta 版本中。這項技術正是驅動其在訊息應用程式和電話通話中即時翻譯功能的幕後功臣。

NewMobileLife 網站:https://www.newmobilelife.com

查看原始文章

清單控必看 iOS 26 提醒事項 6 大新功能檢閱

流動日報

蘋果將停止 Intel Mac 支援  Hackintosh 時代正式終結

流動日報

Google 影片廣告嘲諷 iOS 26 3 個新功能 Android 四年前就有了!

流動日報
查看更多
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

留言 0

沒有留言。

最新內容

Galaxy Z Flip7確認有Exynos 2500版本 首度加入衛星通訊但面臨一限制

am730

EDENA宣佈進入印度尼西亞數位證券市場

PR Newswire 美通社
影音

最新Apple TV OS功能!取代唱K機?

GadgetGang HK

具備最強拍攝效能的摺疊手機? HUAWEI Mate X7 曝光!

Mobile Magazine

延續極致輕薄路線,HONOR Magic V5 將於 7 月 2 日晚發表!

Mobile Magazine

配 Dimensity 9300+,vivo 小鋼炮 X200 FE 開價$5,498!

Mobile Magazine

技嘉宣布全新 AI 筆電 GIGABYTE AERO X16 與 GIGABYTE GAMING A16 正式開賣

PR Newswire 美通社

Apple 因壟斷 iCloud 備份遭集體訴訟

流動日報

Samsung 首款 Android XR 頭戴裝置傳十月上市

流動日報

Samsung Galaxy Z Fold 7、Flip 7 與 Watch 8 系列傳將 7 月 9 日發表

流動日報

YouTube App 常閃退及無反應 Google 建議:iOS 用戶應先刪除後重新安裝

流動日報

清單控必看 iOS 26 提醒事項 6 大新功能檢閱

流動日報

應科院與博愛醫院簽署合作備忘錄

PR Newswire 美通社

艾德金融為香港虛擬資產市場提供流動性,積極布局RWA服務

PR Newswire 美通社

Bybit TradFi面世:在Bybit平台上交易全球

PR Newswire 美通社

「實況野球 榮冠十字路」與清原和博合作!曾沸騰甲子園的祭典男即將登場!

Saiga NAK

新華絲路:第四屆中非經貿博覽會咖啡產業推介暨項目簽約活動成功舉辦

PR Newswire 美通社

突破儲存極限 Seagate Mozaic 3+掀AI技術革命

PR Newswire 美通社

iPadOS 26實試全新視窗系統 用法更似MacBook

am730

「FF9」25周年紀念POP UP STORE活動將於東京・大阪舉行!把握機會入手豪華周邊吧!

Saiga NAK

Switch 2 插入 MIG Switch 破解卡帶後立即被封鎖

流動日報

法國航空快閃餐廳亮相巴黎老佛爺百貨頂樓

PR Newswire 美通社

聚焦澳洲市場潛力 德國萊因與業界共探綠能機遇

PR Newswire 美通社

推得動的畫作─萊威攜手愛啟兒打造近六千張骨牌藝術

PR Newswire 美通社

Stavian Chemical入選《財富》2025年東南亞500強榜單

PR Newswire 美通社

「機甲戰魔 神話之裔」的「解放旅團」角色介紹影片公開!還有原創商品活動!

Saiga NAK

【開箱評價】Shokz OpenDots ONE 開放式藍牙耳機 E310:小巧又有 Dolby Audio 仲有通話降噪

TECH RITUAL

Galaxy Z Fold7外觀疑意外被廣告牌製作商流出 一設計備受期待

am730

鏈博會倒計時30天:國際參與創新高,聚焦鏈接合作與創新

PR Newswire 美通社

WEKA 推出 NeuralMesh:人工智能創新的智能自適應基礎,並為推理時代而有目的地建立

PR Newswire 美通社

FB新功能|統一所有影片變Reels 簡化發布流程、沒長度格式限制

am730

全球 MANCOZEB 高峰會:歐盟法庭聆訊前,探討 MANCOZEB 的農作物保護關鍵作用

PR Newswire 美通社

Apple 618快閃優惠低至85折 MacBook Pro減$2850、iPhone 16 Pro Max減$400(內附連結)

am730

MTK Dimensity 9500 跑分驚現Geekbench,3.23GHz 碾壓 Snapdragon8 Gen4?

Mobile Magazine

特朗普手機T1標榜「美國製造」遭拆穿中國代工換殼真相浮出水面!

Mobile Magazine

Bharti Real Estate Worldmark 項目:印度從傳統商業中心區邁向全球商業區新紀元

PR Newswire 美通社

POCO F7 港版確認 6 月 27 日中午開賣!即日起開放預售、早鳥優惠搶先睇

Mobile Magazine

英特爾傳7月縮減全球代工部門員工 人數恐逾1萬人

VOCO News

DETERMINANT推出全新「Frozen in Tones」系列 以冰川融化危機為靈感呈現未來穿搭單品

PR Newswire 美通社