Adding CUDA / GPU support to whisper model (#809)

2026-03-14 22:55:46 +01:00 · 2024-06-21 21:54:01 +03:00 · 2024-06-21 21:54:01 +03:00 · 2e7dbab958
commit 2e7dbab958
parent 9e6d722ca9
2 changed files with 6 additions and 2 deletions
--- a/buzz/transcriber/recording_transcriber.py
+++ b/buzz/transcriber/recording_transcriber.py
@ -7,6 +7,7 @@ import tempfile
 import threading
 from typing import Optional

+import torch
 import numpy as np
 import sounddevice
 from sounddevice import PortAudioError
@ -60,7 +61,8 @@ class RecordingTranscriber(QObject):
        keep_samples = int(0.15 * self.sample_rate)

        if self.transcription_options.model.model_type == ModelType.WHISPER:
-            model = whisper.load_model(model_path)
+            device = "cuda" if torch.cuda.is_available() else "cpu"
+            model = whisper.load_model(model_path, device=device)
        elif self.transcription_options.model.model_type == ModelType.WHISPER_CPP:
            model = WhisperCpp(model_path)
        elif self.transcription_options.model.model_type == ModelType.FASTER_WHISPER:
--- a/buzz/transcriber/whisper_file_transcriber.py
+++ b/buzz/transcriber/whisper_file_transcriber.py
@ -4,6 +4,7 @@ import logging
 import multiprocessing
 import re
 import sys
+import torch
 from multiprocessing.connection import Connection
 from threading import Thread
 from typing import Optional, List
@ -168,7 +169,8 @@ class WhisperFileTranscriber(FileTranscriber):

    @classmethod
    def transcribe_openai_whisper(cls, task: FileTranscriptionTask) -> List[Segment]:
-        model = whisper.load_model(task.model_path)
+        device = "cuda" if torch.cuda.is_available() else "cpu"
+        model = whisper.load_model(task.model_path, device=device)

        if task.transcription_options.word_level_timings:
            stable_whisper.modify_model(model)