逐字稿一個字多少錢?3 種計費方式與台灣行情完整解析
逐字稿一個字多少錢?台灣市場的逐字稿費用,人工服務每字約 $0.5–$3 元,AI 工具則低至 $0.01 元起,兩者差距超過百倍。但報價差這麼多,不代表貴的一定值得,也不代表便宜的就能直接用——真正決定逐字稿一個字多少錢的,是音檔品質、內容難度與計費方式的組合。
以下從計費邏輯、報價因素到常見陷阱,逐一拆解你在拿到報價單之前應該先知道的事。
逐字稿一個字多少錢?台灣市場行情一次看懂
第一次委外逐字稿,最令人頭痛的往往不是找不到服務,而是不知道「行情」該從哪裡判斷。台灣市場上的報價方式五花八門,有的以「字」計費,有的以「分鐘」計費,還有的直接以「小時」報價,讓不同業者的數字幾乎沒辦法直接比較。
拿到報價單後,建議先問清楚計費基準,再統一換算成「每字單價」,這樣才有比較的意義。以下是台灣市場目前的主流行情整理:
| 類型 | 每字單價 | 每分鐘音檔約合費用 | 備註 |
|---|---|---|---|
| AI 自動逐字稿 | $0.01–$0.05 | $5–$30 | 準確率約 85–95%,通常需人工校稿 |
| 人工逐字稿(一般) | $0.5–$1.5 | $150–$500 | 適用清晰音質、標準普通話 |
| 人工逐字稿(專業術語) | $1.5–$3 | $500–$1,000+ | 法律、醫療、學術等高要求場景 |
| 中英逐字稿(雙語) | $2–$5 | $800–$2,000+ | 難度較高,市場報價差異也較大 |
這份表格提供的是市場參考範圍,實際報價還會受音檔品質、交稿期限、內容複雜度等多個因素影響,往往需要個別評估。
人工逐字稿 vs AI 逐字稿的費用差異
人工逐字稿的費用之所以比 AI 高出這麼多,本質上是因為兩者解決的問題不同。AI 工具對清晰、單人、標準普通話的音檔表現穩定,但遇到多人交疊發言、口音明顯或背景噪音較重的錄音,準確率就會有明顯落差。人工逐字稿由真人聆聽後打字,能理解語境、辨識說話者,也能正確判斷術語或諧音字的寫法。
因此,兩者並非「貴的比較好」的關係,而是各自適合不同情境。學術訪談、法院筆錄、新聞採訪這類對精確度要求高的場合,通常仍以人工服務為主要選擇。
學術用、法律用、商業用的定價為何不同?
逐字稿的定價會依「內容難度」分層,這一點是許多人第一次委外時沒預期到的。學術訪談要求正確打出受訪者的語氣詞、停頓、重複;法律錄音對每個字的準確性都有嚴格要求,錯一個字可能影響文件效力。相較之下,商業會議逐字稿通常可接受「語意整理版」,即省略口頭禪與停頓詞,對打字員的要求相對寬鬆,費用也較低。
要求越高的場景,打字員花費的時間越長,報價自然跟著上升。委外前若能清楚告知服務方「這份音檔的用途」以及「需要精確到哪種程度」,往往能拿到更符合實際需求的報價。
加急、方言、多人對話如何計費?
這三種情況在台灣市場普遍屬於「加價項目」。加急件(24 小時內交稿)通常加收 20–50% 的費用,因為打字員需要排開其他工作、優先處理這份音檔。方言音檔,例如台語或客語,需要能聽懂該語言的專業打字員,市場資源較少,報價相對更高。
多人對話的難度在於「說話者辨識」——打字員必須在聆聽的同時,即時標注是哪一位在發言,工作量遠高於單人錄音。如果你的音檔同時符合「加急 + 方言 + 多人對話」這三個條件,報價翻倍都在合理範圍之內。
影響逐字稿報價的 5 大關鍵因素
委外逐字稿後拿到的報價跟預期落差很大,通常是因為事前沒有掌握「哪些條件會讓報價變貴」。逐字稿的定價不是固定的,而是由多個變數疊加後決定的結果。以下五個因素是台灣市場上最常見的定價影響項目:
| 因素 | 影響方向 | 說明 |
|---|---|---|
| 音檔品質(清晰度) | 品質越差,報價越高 | 雜音多、聲音小、口音重 |
| 說話者人數 | 人數越多,報價越高 | 需辨識並標注說話者 |
| 專業術語密度 | 術語越多,報價越高 | 醫療、法律、科技類 |
| 交稿期限 | 越急,報價越高 | 24 小時內通常加收 20–50% |
| 語言種類 | 方言或外語,報價更高 | 台語、英文、日文等 |
音檔品質對定價的影響
音檔品質往往是決定報價高低最直接的因素,但很多委外方在送出音檔前並沒有意識到這一點。一份在安靜會議室、清楚發音錄製的 60 分鐘訪談,和一份在咖啡廳錄音、三個人輪流說話的同等長度音檔,打字員花費的時間可能差到 3–5 倍。
如果預算有限,最有效的降低報價方式是「提升音檔本身的品質」。錄音前使用指向性麥克風或專用錄音筆,並選擇安靜的環境收音,送出的音檔品質越好,拿到的報價通常也越合理。
專業術語與產業別加成說明
逐字稿不只是「聽懂後打出來」,還要求打字員能正確判斷術語的書寫方式。醫療訪談裡的「橫紋肌溶解症」、法律文件裡的「假扣押」、科技會議中的「邊緣運算」,若打字員對該領域不熟悉,往往會以諧音字代替或直接留空,後期校稿的成本反而更高。
正因如此,許多逐字稿業者會依產業別訂定不同的單價,這是合理的做法。委外時,建議主動說明音檔屬於哪個領域,讓服務方評估是否具備承接能力,也讓你取得的報價更接近實際所需的服務水準。
台灣常見逐字稿服務類型比較
台灣目前的逐字稿服務市場大致分為三種類型:接案平台、專業逐字稿公司,以及 AI 自動化工具。三種類型的定位不同,適合的使用情境也各有差異,沒有哪一種是絕對最好的選擇,關鍵在於你的實際需求。
以下是三種服務類型的整體比較,幫助你快速判斷哪種最符合這次的需求:
| 服務類型 | 費用區間 | 交稿速度 | 準確率 | 適合情境 |
|---|---|---|---|---|
| 接案平台(人工) | 中等 | 依接案者而定 | 高 | 一次性需求、預算彈性 |
| 專業公司(人工) | 較高 | 穩定、可預期 | 最高 | 長期合作、高要求場景 |
| AI 工具(自動) | 最低 | 數分鐘內 | 中等 | 大量音檔、可接受校稿 |
接案平台(例如 Tasker、104 外包)
接案平台的最大優勢是「價格競爭性高」,接案者之間互相競價,委外方通常可以在預算範圍內找到合適的選擇。台灣常見的管道包括 Tasker、104 外包網,也有部分打字員在 Facebook 社團或 Dcard 上接單。這類管道適合一次性的短期需求,靈活度較高。
缺點是品質參差不齊,同一平台上的打字員能力差距可能很大。建議在委外前先查看對方的評價,並詢問是否能提供樣稿;合約中也應明確載明交稿格式與期限,以降低後期糾紛的風險。
專業公司與學術機構常用廠商
專業逐字稿公司的特點在於「流程標準化」,通常具備固定的格式規範、明確的校稿流程,以及有保障的交稿期限。學術界常配合的廠商對訪談逐字稿格式有一定熟悉度,例如是否需要保留語氣詞、如何標注停頓等細節,一般接案者不一定了解這些規範。
若你的逐字稿需求是固定且長期的,例如每週的訪談逐字稿或定期會議紀錄,與專業公司簽訂月結合作往往比每次分散委外更省時,整體費用也可能更有優勢。
自己用 AI 工具做逐字稿划算嗎?
AI 逐字稿工具近年來在準確率與易用性上都有明顯進步,對很多人來說,「自己用 AI 工具處理」和「委外人工」之間的差距已大幅縮小。不過 AI 工具有清楚的強項與弱項,在選擇前先了解自己的音檔類型,才能判斷 AI 是否真的划算。
以下是目前台灣用戶常用的 AI 逐字稿工具比較:
| 工具名稱 | 支援語言 | 準確率 | 翻譯功能 | 費用 | 適合對象 |
|---|---|---|---|---|---|
| AfterClass | 99 種語言 | 高(Whisper API) | ✅ 三種對照模式 | 免費起 | 學生、上班族、內容創作者 |
| Otter.ai | 英文為主 | 高(英文) | ❌ 有限 | 訂閱制 | 英文會議為主 |
| Notion AI | 多語言 | 中等 | ✅ | 需 Notion 訂閱 | Notion 現有用戶 |
| Google 語音輸入 | 多語言 | 中等 | ❌ | 免費 | 即時語音輸入 |
| Whisper(自架) | 99 種語言 | 高 | ❌ 需自行整合 | 免費但需技術能力 | 工程師、進階用戶 |
AfterClass 是目前市場上少數同時具備「高準確率轉錄」與「多語言翻譯對照」的一站式工具,底層採用 OpenAI Whisper API,支援 99 種語言,自動加入標點並智能斷句,對中文、英文、日文的辨識表現尤其穩定。
AfterClass 的差異化設計在於三種輸出格式,可依使用情境靈活切換:
- 原文模式:保留完整的外語逐字稿,適合想精確複習原文的使用者
- 翻譯模式:輸出純繁體中文版本,方便快速閱讀與整理
- 對照模式:原文與翻譯並排呈現,適合深度學習與語意核對
這三種格式讓語言學習者和需要雙語會議紀錄的上班族,能依照需求自行選擇,是其他工具目前較難複製的功能組合。
AfterClass 的主要使用流程(依情境說明)
學生複習線上課程
- 上傳課程錄音或音檔至 AfterClass
- 系統自動轉錄並完成智能斷句
- 下載對照文件(中外文並排版本)
- 用關鍵字搜尋功能快速定位重點內容
- 考前直接閱讀文字版,效率遠高於重看影片
上班族整理英文會議紀錄
- 錄製會議音檔後上傳至 AfterClass
- 系統自動輸出英文逐字稿與中文翻譯
- 切換對照模式,核對關鍵術語是否翻譯正確
- 將確認後的內容整理為會議摘要
- 分享文字版給團隊成員,省去手動聽錄的時間
內容創作者轉製文字版內容
- 匯出 YouTube 影片或 Podcast 的音軌檔案
- 上傳至 AfterClass 進行轉錄
- 下載文字版後進行輕量編輯
- 發佈為部落格文章或社群文案
- 同一份錄音內容同時兼顧影音與文字兩種形式,觸及更多受眾
語言學習者對照原文學習
- 上傳外語音檔(日文、韓文、英文等)
- 選擇對照模式,取得原文+中文並排版本
- 逐句閱讀,學習實際口語表達方式與語境
- 搜尋特定詞彙,快速找到上下文用法
- 作為口譯練習或語言考試備考的輔助素材
以下是 AfterClass 在不同情境的適用評估整理:
| 使用情境 | AfterClass 優勢 | 最適合的輸出模式 |
|---|---|---|
| 學生複習線上課程 | 快速轉成可搜尋文字 | 對照模式(外語課程) |
| 上班族英文會議 | 自動翻譯 + 原文核對 | 翻譯模式 + 對照模式 |
| 內容創作者 | 影片音軌直接轉部落格文字 | 原文模式 |
| 語言學習者 | 原文 + 中文並排對照 | 對照模式 |
手上有英文、日文或其他外語音檔,想同時取得原文逐字稿與繁體中文翻譯對照的話,AfterClass 上傳後幾分鐘就能輸出可逐段閱讀的對照稿,不需要等待人工排程。
免費 AI 工具的準確率與限制
免費的 AI 逐字稿工具在音檔條件良好的情況下通常表現不差,但遇到以下幾種情境,準確率往往會明顯下滑:多人同時發言、說話者口音明顯、夾雜台語或方言,以及背景噪音較多。這些情況在台灣人的日常對話和開會場景中相當普遍。
此外,免費工具常見的限制還包括「檔案大小或時長上限」,以及缺乏說話者辨識功能。音檔超過 30 分鐘、或需要區分多位說話者的情境,建議選擇付費版本,或改用針對這類需求設計的工具。
哪些情境建議還是找人工?
AI 工具再進步,目前仍有幾個情境不適合完全依賴它。法律文件和學術論文的逐字稿對每個字的準確性要求極高,AI 約 5–10% 的錯字率在這些場合可能造成實質問題。訪談錄音中受訪者的情緒語氣、說話節奏,也是 AI 目前難以精確標注的層面。
台灣日常對話中頻繁出現「台語與普通話夾雜」的情形,這類音檔對大多數 AI 工具來說仍是挑戰,容易出現大段空白或錯誤轉錄。若對準確率有明確要求,優先尋找熟悉台語的人工服務會更穩妥。
如何判斷逐字稿報價合不合理?
拿到報價單後,很多人不確定眼前這個數字是合理行情還是被高估了。逐字稿的報價範圍本來就很寬,同一份音檔在不同服務方手中,報價可能差到 5–10 倍,這不代表貴的一定品質好,也不代表便宜的一定有問題。
判斷報價是否合理,關鍵在於「這個報價有沒有正確對應到服務的實際難度」。以下三個步驟可以幫助你快速做出評估:
| 判斷步驟 | 做法 | 目的 |
|---|---|---|
| 換算每字或每分鐘單價 | 用總價除以字數或音檔長度 | 建立統一的比較基準 |
| 確認計費標準 | 問清楚是「原始字數」還是「打出字數」 | 避免定義不同導致認知落差 |
| 比對你的音檔難度 | 對照前述 5 大因素評估加成是否合理 | 判斷加價是否有實際依據 |
看懂報價單的 3 個關鍵欄位
拿到報價單後,第一件事是確認「計費單位」。有些服務商以「音檔分鐘數」計費,有些以「打出字數」計費,兩種方式算出來的總價有時差距不小,不能直接拿數字比較。報價單上若只有一個總價,務必追問對方的計費邏輯,才能判斷這個數字是否合理。
第二個需要確認的是「格式規格」。部分低價報價單提供的其實是「精簡版」服務,省略了說話者標注、時間碼或語氣詞保留等項目。收到成品後才發現格式不符需求、還要重新委外,才是真正的時間與金錢損失。
避開低價陷阱的注意事項
低價本身不是問題,問題在於低價同時伴隨「交稿期限不明確」或「沒有校稿承諾」。台灣外包市場偶爾會遇到接案後拖稿,或直接以 AI 輸出後稍作調整就交件的情況,最終品質與自行使用 AI 工具差異不大,卻多花了等待時間。
委外前,建議要求對方提供 3–5 分鐘的試打樣稿,有能力承接的服務方通常願意配合。同時確認對方是否有正式校稿環節、以及對錯字率是否有任何說明或保證,這些都是區分專業服務與低價接案的重要判斷依據。
逐字稿常見計費方式整理(字數 vs 分鐘 vs 小時)
台灣逐字稿市場目前有三種主流計費方式,對委外方而言,各有不同的風險與優勢。了解這三種計費邏輯的差異,在與服務方溝通報價時才不會完全被動。
以字數計費是對委外方來說最直覺的方式,拿到多少字就付多少錢,透明度相對最高。不過這裡有一個常見盲點:「字數」究竟是指音檔中說出的原始字數,還是打字員實際打出的總字數(可能包含說話者標注、時間碼等)?兩者定義不同,算出來的費用可能有相當差距,委外前值得特別確認。
以音檔分鐘計費是服務方最常採用的方式,因為打字員的工時主要取決於音檔長度,而非最終字數。一般而言,1 分鐘的音檔,人工打字約需 4–8 分鐘,清晰音質所需時間較短,複雜音檔則更長。這種計費方式讓服務方較容易估算工時,報價也相對穩定。
以小時計費較為少見,通常出現在客製化服務或長期合作的場合。對委外方來說,這種方式的透明度最低,因為事前難以準確估算總工時。採用這種計費方式前,建議請對方給出工時範圍的預估,並在合約中設定總工時上限,以控制整體費用。
常見問題 FAQ
逐字稿含標點嗎?空白字算錢嗎?
這兩個問題看似簡單,卻是委外逐字稿時最常引發糾紛的細節。大多數服務預設會加上標點符號,但「是否依照說話節奏加標點」還是「只在語意結束時加」,不同服務方的處理方式可能不同。對標點有特殊要求的情境,例如學術訪談需保留停頓標記,務必在委外前明確說明。
空白字的問題主要出現在「以字計費」的情況下。部分服務方的字數計算涵蓋標點符號、換行字元,甚至說話者標注文字;另一些則只計算實際中文字數。建議在正式委外前請對方提供試打樣稿,自行計算後比對,確認計費標準與預期是否一致。
給了音檔多久可以交稿?
人工逐字稿的交稿時間,通常是「音檔長度的 3–5 倍工時」,再加上排程與校稿所需的時間。一份 60 分鐘的音檔,合理的交稿期限大約是 2–3 個工作天。若服務方承諾隔天就能交付 60 分鐘的人工逐字稿,這個時程本身就值得留意,有可能是 AI 轉錄後稍作修改而非真正的人工處理。
AI 工具的處理時間則截然不同,上傳音檔後通常幾分鐘內就能輸出結果,適合有時間壓力的情境。截止期限緊迫但又需要外語音檔同時對照繁體中文翻譯的話,上傳到 AfterClass 後可以同時取得原文逐字稿與繁中翻譯,省去來回溝通和等待人工排程的時間。
結尾
看完這篇,你應該對台灣逐字稿市場的報價邏輯有了基本判斷能力——從每字單價的換算方式、影響報價的五大因素,到如何識別低價陷阱,每個環節都會影響你最終拿到的成品品質。
如果你的需求是一次性、中文音檔為主,接案平台是最有彈性的起點。需要長期穩定品質或涉及專業術語,找專業公司會更省事。
對於手上有外語音檔、同時需要原文逐字稿與繁體中文翻譯對照的情境,直接用 AI 工具處理往往比等待人工排程更快拿到初稿。有這類需求的話,AfterClass 支援上傳後幾分鐘內輸出原文與繁中對照稿,適合趕時間又需要雙語版本的使用者。


