# Vergleich Whisper: Academic Cloud vs noScribe academic cloud: https://mws.hs-mittweida.de/ (mws) noScibe (local): https://github.com/kaixxx/noScribe ## Geschwindigkeit - Testdatei: Interview 1h4min (48mb) mit zwei speakern - Testgerät: Laptop, Mac m1 pro (2 Efficency & 6 Performance Cores) Die MWS Cloud schlägt mit 14min NoScribe auf meinem Laptop (29min) um meilen. beides ist trotzdem inklusive nacharbeit deutlich schneller als händisch transkribieren. NoScribe nutzt vor allem 2 performance cores, zwei weitere so halb und tastet die GPU (außer zur speaker seperation) kaum an. Das ist schade, denn die Hardware könnte DEUTLICH mehr Performance liefern. Bis auf die speaker seperation läuft nicht mal der Lüfter. Schade. Das sollte mit NVIDIA GPUs auf Linus/Windows Dank CUDA jedoch kein Problem sein. ## Qualität Erster eindruck: noScribe hat deutlich bessere Einstellungen und die Zeitstempel sind dezenter. Noch dazu werden pausen gesetzt, in anpassbarer länge. Das reduziert den aufwand selber pausen zu setzen deutlich. MWS erkennt 3 speaker, was typisch für whisper ist. Bei noScribe lässt sich die anzahl der speaker vorher einstellen, so stimmt die auch. Beide verkacken untypische begriffe wie Hackers-Spaces (Hacker-Stelltes) oder FLINTA (Flinter) regelmäßig. Allgemein scheint mit aber MWS deutlich zuverlässiger was das angeht. noScribe wirkt hingegen manchmal etwas dumm, erfasst dafür aber auch leise gesprochenes zuverlässig. Der dazugehörige Editor macht das checken und weiterarbeiten mit dem Transkript jedoch sehr angenehm. ### Verbessern von Whisper durch promting - [OpenAI Cookbook: Whisper prompting guide](https://cookbook.openai.com/examples/whisper_prompting_guide#pass-names-in-the-prompt-to-prevent-misspellings) - muss unter 224 Tokens sein. Überprüfen mit [OpenAI Tokenizer](https://platform.openai.com/tokenizer) - [OpenAI Platform: Promting Speech-to-Text](https://platform.openai.com/docs/guides/speech-to-text/prompting) - [Stackoverflow: How can I give some hint phrases to OpenAI's Whisper ASR?](https://stackoverflow.com/questions/73833916/how-can-i-give-some-hint-phrases-to-openais-whisper-asr) In NoScribe kann die Instruktion in der "[promt.yml](https://github.com/kaixxx/noScribe/blob/1c5af7d48b7c658202efd1cc3995cf54b9cb0d6c/prompt.yml)" datei angepasst werden.