ホーム > カテゴリ > Voice AI

Voice AI

ニュース

AIニュースdatabricksAIエージェントvoice-ai資金調達

【2026年6月17日朝】AIバズニュースまとめ｜AIエージェントが「職場」に入り込む

2026年6月17日（水）朝のAIバズニュース。DatabricksがエージェントAI『Genie One』を発表、Google Drive・Jira・Slack等とMCP連携しレポート作成やタスク実行まで自動化。音声AIのBlandがDell主導でシリーズC5,000万ドル調達（約180社に断られてからの逆転、週350万件超の電話を処理）。テーマは『AIエージェントが職場の現場に入り込む』。鮮度1週間以内・一次ソース確認済み。

AIニュースNVIDIAAnthropicmistralAI資金調達voice-ai

【2026年6月7日夕】AIバズニュースまとめ

2026年6月7日（日）夕方のAIバズニュース。NVIDIAとMicrosoftが個人向けAIエージェント時代の新スーパーチップ「RTX Spark」でWindows PCを刷新／音声AIのElevenLabsが5億ドル調達で評価額110億ドル（1年未満で3倍）／仏Mistral AIが17億ユーロ調達で評価額117億ユーロ、欧州AIの存在感／AIスタートアップ資金が一握りに集中、Series A平均5,190万ドルへ／Anthropicが650億ドル調達で評価額9,650億ドル、世界最高額の未公開AI企業に。夕方のテーマは『AIに巨額マネーが流れ込む、いまが本番か選別か』。

考察記事

voice-ai資金調達AIエージェント

📞 電話をAIが受ける時代｜Blandの「180社に断られた」逆転劇が示すもの

音声AIのBlandがDell主導でシリーズC5,000万ドル調達、週350万件超の電話を処理。AIが電話対応に入り込む流れとわたしたちへの影響を解説。

elevenlabsvoice-aiAI資金調達ディープフェイクaccessibility

🎙️ 声がここまでお金になる時代｜ElevenLabs 110億ドルが見せる音声AIの光と影

音声AIのElevenLabsが5億ドル調達で評価額110億ドル、1年未満で3倍に。声の合成・吹替・アクセシビリティの可能性と、偽造リスクという影をわたしたち目線でやさしく深掘り。

xAIgrokai-apiai-costvoice-aiagentic-aideveloper-tools

🎙️ xAIの「コスト可視化」が地味に効く｜AIエージェントを量産する時代のお財布事情

xAIが80音声28言語を追加し、APIに毎リクエストの正確なコストを返す機能を実装。エージェントを大量に回す時代にコスト透明化がなぜ効くのかを6つの理由で深掘り。

OpenAIvoice-aielevenlabsdeepgramrealtime-api

🎙 OpenAI が音声 AI に全力できた｜GPT-Realtime-2 の『dead air 解消』が会話を変える

OpenAI が GPT-Realtime-2 / Translate / Whisper の音声 AI 3モデルを GA 公開。ElevenLabs / Deepgram への正面対抗とユーザーへの影響を解説。

OpenAIvoice-aielevenlabsdeepgramrealtime-api

🎙️ OpenAI Voice API が音声AI市場を「ワンストップ化」した日｜ElevenLabs / Deepgram の正念場

2026年5月8日 OpenAI Realtime APIから GPT-Realtime-2/Translate/Whisper の3本立てローンチ。$0.017/分の積極価格でElevenLabs/Deepgram直接競合の構造を解説。

elevenlabsvoice-aiAI資金調達india-marketblackrock

ElevenLabs Q1 +$100M ARR｜ハリウッド×インド×Wall Streetの3点接続で音声AIが$11B評価を維持する構造

ElevenLabsがQ1 2026に純増ARR $100M、累計$450M到達。BlackRock／NVIDIA／Jamie Foxx／Eva Longoria追加、Activate India展開で音声AIが$11B評価を維持する戦略構造を読み解く。

OpenAIgpt-realtimevoice-aiapi

OpenAI GPT-Realtime-2 API GA｜1分3円の翻訳と1分1.7円の書き起こしが商用本番に乗る

OpenAIが5月8日にRealtime APIをGA、GPT-Realtime-2／Translate／Whisperの3モデル投入。コンテキスト128K、70+言語翻訳が1分0.034ドル、書き起こし1分0.017ドル。音声AIの商用本番化が始まる。

sesamevoice-aiオープンソースcsmconversational-ai

🎙️ 音声AIにOSSの選択肢ができた｜SesameのCSM Apache 2.0公開がもたらす対話音声の民主化

Sesameが対話音声モデルCSMをApache 2.0で1B版公開。Llama backbone＋Mimi audio codec、Maya／Milesが500万分の対話実績。OpenAI Advanced Voice／ElevenLabs／Cartesiaに対する「OSS第三極」の意味を解説。

cartesiavoice-aisonic-3elevenlabstts

🎙️ AI音声、もう人間と区別つかないかも｜Cartesia Sonic-3が42言語90msで業界標準を塗り替えた話

Cartesiaが$100M調達＋Sonic-3公開で音声AIが90ms 42言語の新基準へ。ElevenLabs対抗の主役交代と、わたしたちへの影響を解説。

elevenlabsvoice-aiibm-watsonx企業向けAI

🎙️ ElevenLabs $11B＋IBM統合｜音声AIがエンプラ標準になった日

ElevenLabsが$500M調達で評価額$11B、IBM watsonx Orchestrateと統合し70言語の音声エージェント基盤化。AIUC-1認証で初の保険適用も。エンプラ電話業務AI化の現在地を解説。

inworldvoice-aigamingnpc

🎮 Inworld AI #1音声TTS｜AAAゲームのNPC音声がついにAIに置き換わる

Inworld AIが2026年Artificial Analysisで音声TTS#1ランクを獲得、サブ200ms低遅延でUbisoft/Xbox/Disney/Google/NVIDIA/Metaの標準採用へ。ゲームNPCのボイスアクター録音から動的AI生成への構造変化を解説。

hume-aiGoogledeepmindvoice-aiGeminiacqui-hire

🎙️ Hume AIのコアチームがGoogle移籍って、Geminiの声がどれくらい人間っぽくなる？｜ライセンス型acqui-hireの構造

Hume AI CEO Alan Cowen + 主要エンジニアがGoogle DeepMindのGemini音声チームに合流。買収じゃなくライセンス契約という新パターン。FTC回避の手口と、ユーザー体験への影響を解説。

GoogleGeminivoice-aireal-timeagent

🎙️ Gemini Flash Liveで音声AIが変わる｜リアルタイム会話の新時代が始まった

Google Gemini 3.1 Flash LiveがWebSocket常時接続でリアルタイム音声AIの新基準を確立。90言語対応の音声エージェント革命を解説。