AI Today
ホーム > カテゴリ > Voice AI

Voice AI

ニュース

考察記事

voice-ai資金調達AIエージェント

📞 電話をAIが受ける時代|Blandの「180社に断られた」逆転劇が示すもの

音声AIのBlandがDell主導でシリーズC5,000万ドル調達、週350万件超の電話を処理。AIが電話対応に入り込む流れとわたしたちへの影響を解説。

elevenlabsvoice-aiAI資金調達ディープフェイクaccessibility

🎙️ 声がここまでお金になる時代|ElevenLabs 110億ドルが見せる音声AIの光と影

音声AIのElevenLabsが5億ドル調達で評価額110億ドル、1年未満で3倍に。声の合成・吹替・アクセシビリティの可能性と、偽造リスクという影をわたしたち目線でやさしく深掘り。

xAIgrokai-apiai-costvoice-aiagentic-aideveloper-tools

🎙️ xAIの「コスト可視化」が地味に効く|AIエージェントを量産する時代のお財布事情

xAIが80音声28言語を追加し、APIに毎リクエストの正確なコストを返す機能を実装。エージェントを大量に回す時代にコスト透明化がなぜ効くのかを6つの理由で深掘り。

OpenAIvoice-aielevenlabsdeepgramrealtime-api

🎙 OpenAI が音声 AI に全力できた|GPT-Realtime-2 の『dead air 解消』が会話を変える

OpenAI が GPT-Realtime-2 / Translate / Whisper の音声 AI 3モデルを GA 公開。ElevenLabs / Deepgram への正面対抗とユーザーへの影響を解説。

OpenAIvoice-aielevenlabsdeepgramrealtime-api

🎙️ OpenAI Voice API が音声AI市場を「ワンストップ化」した日|ElevenLabs / Deepgram の正念場

2026年5月8日 OpenAI Realtime APIから GPT-Realtime-2/Translate/Whisper の3本立てローンチ。$0.017/分の積極価格でElevenLabs/Deepgram直接競合の構造を解説。

elevenlabsvoice-aiAI資金調達india-marketblackrock

ElevenLabs Q1 +$100M ARR|ハリウッド×インド×Wall Streetの3点接続で音声AIが$11B評価を維持する構造

ElevenLabsがQ1 2026に純増ARR $100M、累計$450M到達。BlackRock/NVIDIA/Jamie Foxx/Eva Longoria追加、Activate India展開で音声AIが$11B評価を維持する戦略構造を読み解く。

OpenAIgpt-realtimevoice-aiapi

OpenAI GPT-Realtime-2 API GA|1分3円の翻訳と1分1.7円の書き起こしが商用本番に乗る

OpenAIが5月8日にRealtime APIをGA、GPT-Realtime-2/Translate/Whisperの3モデル投入。コンテキスト128K、70+言語翻訳が1分0.034ドル、書き起こし1分0.017ドル。音声AIの商用本番化が始まる。

sesamevoice-aiオープンソースcsmconversational-ai

🎙️ 音声AIにOSSの選択肢ができた|SesameのCSM Apache 2.0公開がもたらす対話音声の民主化

Sesameが対話音声モデルCSMをApache 2.0で1B版公開。Llama backbone+Mimi audio codec、Maya/Milesが500万分の対話実績。OpenAI Advanced Voice/ElevenLabs/Cartesiaに対する「OSS第三極」の意味を解説。

cartesiavoice-aisonic-3elevenlabstts

🎙️ AI音声、もう人間と区別つかないかも|Cartesia Sonic-3が42言語90msで業界標準を塗り替えた話

Cartesiaが$100M調達+Sonic-3公開で音声AIが90ms 42言語の新基準へ。ElevenLabs対抗の主役交代と、わたしたちへの影響を解説。

elevenlabsvoice-aiibm-watsonx企業向けAI

🎙️ ElevenLabs $11B+IBM統合|音声AIがエンプラ標準になった日

ElevenLabsが$500M調達で評価額$11B、IBM watsonx Orchestrateと統合し70言語の音声エージェント基盤化。AIUC-1認証で初の保険適用も。エンプラ電話業務AI化の現在地を解説。

inworldvoice-aigamingnpc

🎮 Inworld AI #1音声TTS|AAAゲームのNPC音声がついにAIに置き換わる

Inworld AIが2026年Artificial Analysisで音声TTS#1ランクを獲得、サブ200ms低遅延でUbisoft/Xbox/Disney/Google/NVIDIA/Metaの標準採用へ。ゲームNPCのボイスアクター録音から動的AI生成への構造変化を解説。

hume-aiGoogledeepmindvoice-aiGeminiacqui-hire

🎙️ Hume AIのコアチームがGoogle移籍って、Geminiの声がどれくらい人間っぽくなる?|ライセンス型acqui-hireの構造

Hume AI CEO Alan Cowen + 主要エンジニアがGoogle DeepMindのGemini音声チームに合流。買収じゃなくライセンス契約という新パターン。FTC回避の手口と、ユーザー体験への影響を解説。

GoogleGeminivoice-aireal-timeagent

🎙️ Gemini Flash Liveで音声AIが変わる|リアルタイム会話の新時代が始まった

Google Gemini 3.1 Flash LiveがWebSocket常時接続でリアルタイム音声AIの新基準を確立。90言語対応の音声エージェント革命を解説。