先に結論
この4つは全部「会話できる AI video agent」に見えますが、実際は主語がかなり違います。
- 完成済みの conversational video を早く導入したい → Tavus
- 既存の avatar 動画制作フローから interactive へ広げたい → HeyGen Video Agent
- 1枚画像からブランド character を作って埋め込みたい → Runway Characters
- 自社プロダクトの realtime 基盤として長く握りたい → LiveKit Agents
なので最初に分けるべきなのは、動画付き会話プロダクトを買いたいのか、ブランド avatar API が欲しいのか、既存の動画制作ツールの延長で始めたいのか、基盤を自前で組みたいのか です。
なぜ今この比較が重要か
2026年に入ってから、video AI の主語が単なる「動画生成」から interactive agent へずれてきました。
Tavus は pricing 上でも Conversational Video Interface (CVI) を独立した軸で整理し、1080p、vision、turn-taking、knowledge base、memories、guardrails、function calling までまとめています。つまり最初から 会話運用 が主役です。
Runway Characters も 2026-03-09 に、single image から zero fine-tuning で conversational character を作れる real-time video agent API として出してきました。こちらは「動画を作る」より video-native interface を埋め込む 感覚に近いです。
HeyGen は pricing 上で Creator 以上に Latest Video Agent model を置きつつ、translation、avatar、brand kit、collaboration の延長で扱える形にしています。つまり動画制作ワークフロー側から interactive avatar を伸ばしている立ち位置です。
LiveKit Agents は別系統で、voice / video / text の realtime framework です。WebRTC、tool use、turn detection、multi-agent handoff、telephony を持ち、agent を作る土台 を提供します。avatar 体験の完成品ではありません。
比較表
| 比較軸 | Tavus | HeyGen Video Agent | Runway Characters | LiveKit Agents |
|---|---|---|---|---|
| 主戦場 | 完成済み conversational video | avatar 制作UIの延長にある interactive video | brand character / support avatar の埋め込みAPI | realtime voice / video / text agent 基盤 |
| 導入方式 | SaaS + API | no-code 寄り + SaaS | API 主体 | SDK / framework |
| 入口の分かりやすさ | 強い | 強い | 中 | 弱い |
| ブランド表現の自由度 | 強い | 中 | 非常に強い | 実装次第 |
| knowledge base / memory | 強い | 中 | 強い | 実装次第 |
| function / tool 実行 | 強い | 中 | 強い | 非常に強い |
| WebRTC / realtime 制御 | 完成済み寄り | 完成済み寄り | API 組み込み寄り | 基盤として非常に強い |
| no-code での始めやすさ | 中 | 強い | 弱い | 弱い |
| 料金の読みやすさ | 比較的読みやすい | 中 | 要問い合わせ寄り | 使い方次第 |
| 向いている人 | PoC を早く通したい事業チーム | 既存動画運用を活かしたいチーム | mascot / support avatar を埋め込みたいチーム | 開発主導で長期基盤を作るチーム |
4サービスの違いを実務目線で整理する
Tavus は「会話運用まで含めた conversational video product」
Tavus の pricing はかなり分かりやすく、単なる avatar API ではなく 会話基盤をどう運用するか まで一枚で見えるのが強いです。
Starter は $59/月、Growth は $397/月。CVI minutes は Starter で 100分/月、Growth で 1250分/月、overage はそれぞれ $0.37/min と $0.32/min。さらに custom replica training は Starter で 3件/月、Growth で 7件/月、超過は $65 / $40 per replica と明示されています。
しかも機能軸が、
- 1080p conversational video
- Perception + Vision
- Intelligent turn-taking
- Knowledge Base
- Memories
- Objectives and Guardrails
- Function calling
- Conversation transcripts / recordings
まで揃っています。
この整理の良さは、営業デモ、採用面談、オンボーディング、CS、教育などで「どこまで完成しているか」が読みやすいことです。PoC 前に論点が散りにくいので、最短で導入判断したいチーム にはかなり強いです。
HeyGen Video Agent は「動画制作ワークフローの延長で interactive に寄せる」選択肢
HeyGen の pricing は video creation 文脈が主役ですが、Creator 以上で Latest Video Agent model を premium 機能として前に出しています。
Creator は $29/月、Pro は $99/月。しかも同じプランの中に、
- custom digital twin
- 175 languages and dialects
- voice cloning
- video translation with lip sync
- brand kit
- collaborative workspace
- latest video agent model
が並んでいます。
つまり HeyGen は、最初から pure-play video agent というより、既存の avatar・翻訳・動画運用の資産を持つチームが interactive まで広げる ときに相性がいいです。
逆に、knowledge base や actions を持つ本格的な embedded agent を最初から主役にしたいなら、Tavus や Runway Characters のほうが主語が合いやすいです。HeyGen は「制作フローから会話へ寄せる」分、導入は軽いですが、設計思想は少し違います。
Runway Characters は「single image から brand character を API で実装する」本命
Runway Characters は 2026-03-09 時点でかなり主語が明確です。single image から conversational character を作り、
- natural facial expressions
- eye movements
- lip-syncing
- gestures during speaking and listening
- voice / personality / knowledge / actions の API 制御
を前提にしています。
ここで強いのは、ブランド IP や mascot をそのまま conversation UI に変えやすいこと です。
Tavus が「完成度の高い会話プロダクト」に寄っているのに対し、Runway Characters は 見た目と体験の自由度 がかなり強いです。support avatar、learning coach、brand ambassador、商品ガイドのように、見せ方そのものが価値になる用途ではかなりハマります。
ただし pricing の読みやすさや no-code 導入のしやすさでは Tavus や HeyGen ほど親切ではありません。自社で埋め込み前提のチーム向け です。
LiveKit Agents は「avatar SaaS」ではなく realtime agent infrastructure
LiveKit Agents docs は一貫して、voice / video / text の realtime framework だと説明しています。強いのは次です。
- WebRTC ベースの安定した realtime 通信
- STT-LLM-TTS pipeline と realtime model の両対応
- tool use
- multi-agent handoff
- telephony
- managed deployment / observability
- open source
なので LiveKit Agents を選ぶのは、Tavus や Runway の代わりに「avatar を買う」ときではありません。自社の realtime agent stack を握りたい ときです。
例えば、video agent に加えて voice AI、電話、画面共有、会話ログ、複数モデル切替、社内の独自権限管理まで同じ土台でまとめたいなら LiveKit が強いです。その代わり、avatar 表現や conversational UI の完成度は自分たちで作る責任が残ります。
用途別おすすめ
最短で PoC を通して営業・CS・教育へ広げたいなら Tavus
- replica をすぐ試したい
- pricing を minute 単位で読める方がいい
- knowledge base や guardrails も最初から欲しい
- まずは完成済みの conversational video で価値検証したい
この条件なら Tavus が一番ブレにくいです。
既存の動画制作や多言語運用から interactive へ広げたいなら HeyGen Video Agent
- すでに HeyGen 系の avatar / translation 文脈に慣れている
- no-code 寄りで触り始めたい
- pre-recorded と interactive を同じ運用面で見たい
- brand kit や collaboration を一緒に回したい
この条件なら HeyGen が入りやすいです。
mascot や support avatar を自社サイトへ埋め込みたいなら Runway Characters
- single image からブランドキャラを作りたい
- 見た目や人格をかなり作り込みたい
- API で knowledge や actions を制御したい
- support / training / brand experience に寄せたい
この条件なら Runway Characters が本命です。
長期的に自社の realtime AI 基盤を作るなら LiveKit Agents
- voice / video / text を横断したい
- telephony や multi-agent まで同じ基盤に寄せたい
- WebRTC と deployment を自社都合で握りたい
- avatar 以外の agent 体験にも広げたい
この条件なら LiveKit Agents が最も伸びしろがあります。
料金の読み方で見落としやすいポイント
Tavus は PoC 後の minutes と replica training overage を先に見る
Tavus は料金表が見やすい分、PoC が当たった後に minutes 消費 と replica training 超過 が効いてきます。会話時間が長い営業デモやオンボーディングでは、月額だけでなく overage を読んでおかないとズレやすいです。
HeyGen は「動画制作」と「interactive premium usage」が同じ箱に入る
HeyGen は動画制作の延長で見やすい半面、video agent の利用量がどこまで premium usage と連動するかを、運用前に必ず確認したほうがいいです。pre-recorded の予算感だけで入ると、interactive の想定が甘くなりやすいです。
Runway Characters と LiveKit は導入費より設計コストを読む
この2つは、単純な月額だけでなく 実装と運用の責任範囲 がコストに効きます。Runway Characters はフロント組み込みや設計、LiveKit は agent stack 全体の運用責任まで見て判断すべきです。
どれを選ぶべきか
1. まず「完成品を買う」のか「基盤を作る」のかを分ける
- 完成品寄り → Tavus / HeyGen
- 埋め込み API 寄り → Runway Characters
- 基盤寄り → LiveKit Agents
2. 見た目の自由度が重要なら Runway、運用の分かりやすさが重要なら Tavus
ブランド体験を作るなら Runway Characters、導入判断を急ぎたいなら Tavus が強いです。
3. 既存の動画運用資産を捨てたくないなら HeyGen、avatar 以外まで伸ばすなら LiveKit
HeyGen は動画チームの延長線、LiveKit はプロダクト基盤の延長線です。ここを混ぜない方が失敗しません。
既存記事とどうつなぐか
このテーマは単体で終わりません。
- avatar 動画 SaaS の比較は D-ID vs Synthesia vs HeyGen vs Creatify 比較
- ライブ翻訳や配信基盤の比較は CAMB DubStream vs HeyGen vs LiveKit 比較
- image 起点の conversational character は Sora Image-to-Video vs Runway Characters vs Hedra vs Luma Dream Machine 比較
- realtime agent infrastructure は Gemini 3.1 Flash Live vs OpenAI Realtime API vs LiveKit Agents 比較
という導線にすると、
- 完成済み conversational video を探している人
- avatar の見た目や体験を重視する人
- realtime 基盤を自前で作る人
を分けて回遊させやすいです。
参考にした主な公式情報
- Tavus Pricing
- HeyGen Pricing
- Runway: Introducing Runway Characters(2026-03-09)
- LiveKit Agents Documentation