mirror of
https://github.com/chidiwilliams/buzz.git
synced 2026-03-14 14:45:46 +01:00
5.1 KiB
5.1 KiB
Buzz
パソコン上でオフラインで音声の文字起こしと翻訳を行います。OpenAIのWhisperを使用しています。
機能
- 音声・動画ファイルまたはYouTubeリンクの文字起こし
- マイクからのリアルタイム音声文字起こし
- イベントやプレゼンテーション中に便利なプレゼンテーションウィンドウ
- ノイズの多い音声でより高い精度を得るための、文字起こし前の話者分離
- 文字起こしメディアでの話者識別
- 複数のWhisperバックエンドをサポート
- Nvidia GPU向けCUDAアクセラレーション対応
- Mac向けApple Silicon対応
- Whisper.cppでのVulkanアクセラレーション対応(統合GPUを含むほとんどのGPUで利用可能)
- TXT、SRT、VTT形式での文字起こしエクスポート
- 検索、再生コントロール、速度調整機能を備えた高度な文字起こしビューア
- 効率的なナビゲーションのためのキーボードショートカット
- 新しいファイルの自動文字起こしのための監視フォルダ
- スクリプトや自動化のためのコマンドラインインターフェース
インストール
macOS
SourceForgeから.dmgファイルをダウンロードしてください。
Windows
SourceForgeからインストールファイルを入手してください。
アプリは署名されていないため、インストール時に警告が表示されます。詳細情報 -> 実行を選択してください。
Linux
Flatpakをインストールするには、以下を実行してください:
flatpak install flathub io.github.chidiwilliams.Buzz
Snapをインストールするには、以下を実行してください:
sudo apt-get install libportaudio2 libcanberra-gtk-module libcanberra-gtk3-module
sudo snap install buzz
PyPI
ffmpegをインストールしてください。
Python 3.12環境を使用していることを確認してください。
Buzzをインストール
pip install buzz-captions
python -m buzz
PyPIでのGPUサポート
PyPIでインストールしたバージョンでWindows上のNvidia GPUのGPUサポートを有効にするには、torchのCUDAサポートを確認してください。
pip3 install -U torch==2.8.0+cu129 torchaudio==2.8.0+cu129 --index-url https://download.pytorch.org/whl/cu129
pip3 install nvidia-cublas-cu12==12.9.1.4 nvidia-cuda-cupti-cu12==12.9.79 nvidia-cuda-runtime-cu12==12.9.79 --extra-index-url https://pypi.ngc.nvidia.com
最新開発版
最新の機能やバグ修正を含む最新開発版の入手方法については、FAQをご覧ください。
スクリーンショット
