Сравнение транскрипции
Насколько точен scryp для транскрипции на русском языке – и насколько безопасны ваши данные по сравнению с крупными облачными сервисами? Вот результаты нашего бенчмарка.
Точность транскрипции для русского языка
Word Error Rate (WER) – ниже значит лучше. Точность = 100% − WER.
← Прокрутите таблицу в сторону →
| Провайдер | Общая (точность) | Специализированная область (точность) | WER общий |
|---|---|---|---|
| scrypSX-3 | 97.2 % | 96.1 % | 2.8 % |
| OpenAIWhisper Large v3 | 91.8 % | 83.5 % | 8.2 % |
| Google STTCloud Speech-to-Text | 88.5 % | 80.2 % | 11.5 % |
| Azure SpeechMicrosoft Cognitive | 87.9 % | 78.7 % | 12.1 % |
| AWS TranscribeAmazon Standard | 85.7 % | 75.9 % | 14.3 % |
Тестовый набор данных и методика
- Основой служит наш собственный тестовый набор данных публично доступных аудиозаписей на вашем рынке по областям Общая, Здравоохранение и Право.
- Все провайдеры были протестированы на идентичных аудиофайлах и единым методом оценки (Word Error Rate после стандартной нормализации).
- Столбец Специализированная область показывает среднее по медицинским и юридическим записям. Частота ошибок растёт со специализированной лексикой у всех провайдеров – но гораздо сильнее у моделей без доменного обучения.
- Результаты могут различаться в зависимости от качества аудио, числа спикеров, диалекта и конкретного случая использования.
Почему scryp устроен иначе для конфиденциального контента
Эти пункты описывают собственную архитектуру scryp. Они намеренно точны и не являются обобщённым утверждением о каждом другом провайдере.
Шифрование на вашем устройстве
Файлы шифруются в браузере перед загрузкой. Сохранённый контент постоянно хранится только в зашифрованном виде.
Чёткая архитектура в ЕС
Транскрипция в Австрии, зашифрованное хранение в Германии – обе в пределах ЕС. Благодаря этому прозрачно, где происходит каждый этап обработки.
Собственная инфраструктура обработки
В транскрипцию не вовлечён никакой внешний ИИ третьих сторон. Это снижает дополнительные потоки данных и зависимости.
Продуктивный рабочий процесс в браузере
Редактирование, экспорт, обмен и синхронизация аудио встроены прямо в продукт, а не доступны только как отдельные блоки API.
Источники и документация
Возможности провайдеров проверены по официальной документации. Данные о точности основаны на описанном выше тестовом наборе данных.
Модели и точность
- Radford et al. (2022): Robust Speech Recognition via Large-Scale Weak Supervision - OpenAI Whisper Paper
- OpenAI Whisper Repository - Modelle und Sprachen
- faster-whisper (SYSTRAN) - CTranslate2-basierte Whisper-Implementierung
- pyannote.audio 3.x - Speaker Diarization Pipeline
- Mozilla Common Voice - Offener Sprachdatensatz
Документация провайдеров
- Google Cloud Speech-to-Text - Overview and speech recognition
- Google Cloud Speech-to-Text - Speaker Diarization
- Microsoft Azure Speech Service - Overview and documentation
- Azure Speech - Real-time diarization quickstart
- Amazon Transcribe - Developer Guide
- Amazon Transcribe - Speaker partitioning (Diarization)
Готовы к безопасной транскрипции?
Попробуйте scryp бесплатно – зашифровано с первой секунды.