totonoeAI
料金

totonoeai

ドキュメントをととのえるAIツール

無料ツール

  • PDF 変換ツール
  • Word/Excel→Markdown
  • 画像→テキスト (OCR)
  • Markdownエディタ
  • ダイアグラムメーカー
  • スクショ結合→PDF
  • PDF 編集ツール
  • 画像エディター
  • データ変換ツール
  • SQL フォーマッター
  • URL短縮

AIツール

  • AI文書整形
  • AI議事録
  • AI表組み
  • AIダイアグラム生成
  • 動画・音声プロセッサー

その他

  • 料金プラン
  • 利用規約
  • プライバシーポリシー
  • 特定商取引法に基づく表記

© 2026 totonoeai

動画・音声プロセッサー

動画 (mp4 / mov / webm / avi) や音声 (mp3 / wav / m4a / ogg) をアップロードすると、文字起こし → 要約または議事録の生成 → 画面のスクリーンショット抽出 (動画のみ) をまとめて行います。長尺コンテンツでもタイムアウトせず処理できます。

ファイルをドラッグ&ドロップ

またはクリックして選択

対応形式: .mp4, .mov, .webm, .avi, .mp3, .wav, .wav, .m4a, .ogg / 最大200MB

出力モード

スクリーンショット設定

動画から書き起こし・要約・スクリーンショットを AI で一括抽出

MP4 / MOV / WebM / AVI などの動画をアップロードすると、AI が音声を文字起こしし、要約を生成し、シーン切替時のスクリーンショットを ZIP で出力します。Zoom / Teams 録画、YouTube 動画、講義動画、社内研修動画の議事録化・要約に最適。

動画 1 つから 3 つの成果物

本ツールは動画 1 ファイルから以下を**自動で**生成します:

1. **全文書き起こし**: OpenAI Whisper で日本語音声を高精度で文字化 2. **要約 (Markdown)**: Claude Sonnet が文字起こしを読んで重要ポイントを抽出 3. **スクリーンショット ZIP**: シーン切替時または一定間隔ごとの画面キャプチャ

1 時間の会議動画でも 5〜10 分で全部生成完了します。

ユースケース

・**Zoom / Teams 録画から議事録**: 録画 → アップロード → 5 分で構造化議事録 ・**講義・セミナーのノート化**: 動画講義の文字起こし + 章ごとのスクショで完全なノートに ・**YouTube 動画から記事化**: 自分の動画を文字起こし → AI で記事化 ・**社内研修の振り返り資料**: 研修動画を Free プランで 3 視聴 → 議事録 + 重要シーン保存

技術スタック

・**音声抽出**: ffmpeg (LGPL ライセンス、商用利用 OK) でビデオから mp3/m4a/wav にカスケード変換 ・**文字起こし**: OpenAI Whisper API (`whisper-1` モデル、language=ja 固定で日本語特化) ・**要約**: Claude Sonnet 4.5 ・**スクリーンショット**: ffmpeg のシーン検出 (scene change detection) または一定秒数間隔

プライバシー

アップロードされた動画は AWS S3 (東京リージョン) に一時保存され、処理完了後 1 時間以内に自動削除。Whisper API・Anthropic API への送信時は TLS 暗号化 + zero-data-retention 契約済。社内会議動画など機密性が高いファイルも安心してご利用いただけます。

ファイルサイズは Free 20MB / Light 100MB / Premium 200MB まで。動画は async ジョブとして処理されるため、ブラウザを閉じても処理は継続します。

よくある質問

1 時間の動画も処理できますか?

はい。Whisper の 25MB 制限は内部で自動チャンキングしているので、長時間動画も処理できます。ただし動画ファイル自体のサイズはプランの上限内 (Free 20MB / Light 100MB / Premium 200MB) に収まる必要があります。

対応している動画フォーマットは?

MP4 / MOV / WebM / AVI / MKV に対応。スマホで撮った動画 (.mov / .mp4) はそのままアップロードできます。

話者を区別できますか?

現在は話者識別 (ダイアライゼーション) は未対応で、文字起こしから AI が文脈で参加者を推測します。Zoom / Teams の話者ラベル付き字幕がある場合は別途貼り付けると精度が上がります。

スクリーンショットの撮影タイミングは?

「シーン切替」モードはシーンが大きく変わったタイミングを自動検出。「一定間隔」モードは秒数指定 (デフォルト 10 秒) で機械的にキャプチャ。会議動画はシーン切替、講義はインターバルが向いています。

Free プランでも動画処理は使えますか?

使えますが、利用前にリワード広告を 3 回視聴いただきます (Light は 1 回、Premium は視聴不要)。Whisper API のコストが大きいためのコスト相殺策です。

一緒によく使われるツール

AI議事録 →

動画ではなく音声・テキストから議事録だけ作りたいとき。

スクショ結合→PDF →

出力されたスクショ ZIP を 1 つの PDF にまとめる。

AI文書整形 →

要約結果を報告書・提案書フォーマットに再構成。